大模型算法专家

岗位职责

负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,针对大模型的微调算法的设计、训练、微调、优化、部署上线

负责大模型Agent应用的研发工作,包括流程设计、内容生成、交互逻辑设计优化等;

追踪学术界和工业界大模型最近的研究和应用, 在大模型预训练、有监督微调、增强学习等方向的算法、数据、评测等维度进行持续的创新和优化

参与模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。

参与算法和技术方案设计以及专利编写;

岗位要求

1.硕士及以上学历 ,人工智能相关专业,工作5年以上同岗位经验;(博士学历优先考虑)

2. 扎实的代码基础,熟练掌握python、C++、git等,熟悉 PyTorch 等常见训练框架;

3、在机器学习/深度学习/自然语言处理/预训练模型等至少一个方向上有扎实的基础和丰富的经验,紧跟多模态大模型前沿技术。包括但不仅限于多模态目标检测、内容理解、语义向量化、AIGC、Agent应用等

4.熟悉大规模分布式训练框架,如deepspeed、Megatron-LM优先;

5.具备较强的分析能力,能够结合业务场景快速建模和设计算法,分析算法的不足并提出解决方案。

6.在模型蒸馏、模型量化、训练及推理加速等方面有一定经验;

7.具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。

公司地点:杭州滨江区金润科技园C幢4楼

公司简介:

职位发布者:谢女士

杭州联汇科技股份有限公司

融资阶段:

公司规模:100~499人

相似职位: