岗位职责
1.负责LLM训练算法(SFT、RL)、训练数据合成、自动评测相关算法研究,提升模型在问答、代码生成、数据分析等领域的推理能力;
2.负责跟踪 AI 领域的技术进展,参与前沿算法研究,推动业界成果在小程序开发生态落地应用。
岗位要求
1.熟练掌握 Python/C++ 等至少一门编程语言,熟悉 PyTorch/TensorFlow 等至少一种深度学习框架;
2.熟悉主流大模型训练框架 Megatron/DeepSpeed,深入理解 Transformer/GPT 等模型架构;
3.具备大语言模型研究和应用经验,包括 SFT/DPO/PPO/GRPO 等技术的落地实践;
4.具备良好的数据处理能力,具备快速学习和解决问题能力,有团队合作精神;
5.对于探索前沿技术有热情,具备独立探索前沿技术的能力。
加分项
1.在 NeurIPS、ACL、ICML、EMNLP 等顶会有以第一作者发表过论文优先;
2.有 RAG 技术实现与调优、Agent 应用落地经验优先;
3.有大模型测评,大模型数据管理相关经验优先。
腾讯以技术丰富互联网用户的生活。
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。