核心职责
数据基建:构建、开发和维护高效可拓展的训练数据管道,设计分布式数据存储与调度系统。
数据采集:开发高效数据采集工具,为预训练、微调和对齐阶段提供高质量数据支持。
数据质量管理:制定数据质量标准,实施数据验证和清洗流程,确保数据的准确性和完整性。
模型迭代支持:与研究、工程团队密切合作,开发合成数据工具,拓展数据规模与多样性。
任职要求
来自计算机科学、数据科学等相关领域,具备模型训练数据处理、增强经验。
熟练掌握Python/SQL,熟悉大数据处理框架。
熟悉大模型数据工作流程,如预训练语料构建、SFT/RLHF数据标注、评估数据集设计等。
有开源项目贡献和经历,积极参与技术社区者优先。
对实现前沿AI解决方案充满热情,具备自驱力与团队协作精神,能适应快节奏的挑战。
宽德投资是一家国内领先、业务全面的量化对冲基金。基于先进高效的研究和交易构架,以及完善的资产管理系统,宽德投资在国内期货、股票、期权等主流市场具有良好的盈利能力。
成立十年来,我们始终怀着打造世界顶尖华人量化对冲基金的梦想,低调扎实地工作,并热切期待着每位同路人。
工商信息