工作职责:
1. 面向物流供应链领域的大模型技术应用研究与工程实现,搭建供应链AI智能决策平台。
2. 追踪学术界和工业界在大模型预训练、微调、强化学习等方向的前沿进展,并进行持续创新和优化。
3. 解决大模型产业落地过程中的算法和工程技术难题。
岗位要求:
1. 具备硕士研究生及以上学历,在NLP、大语言模型、强化学习等领域具有相关工作和项目落地经验,并且有扎实的研究积累。
2. 熟悉Python/Java等开发语言,具备较高水平的工程实现能力和设计能力。
3. 熟练掌握TensorFlow、PyTorch、Megatron、DeepSpeed等框架,了解各种并行策略,并具备大规模分布式训练的经验。
4. 出色的大模型研究能力,有高质量论文和开源项目的产出者优先考虑。
5. 自驱力强,注重结果导向,具有良好的协作能力和沟通能力,富有想象力和创造力。