岗位职责:1、负责人工智能领域前沿算法的研发、探索人工智能的创新应用;2、负责大模型工具链平台研发,支持大模型数据清洗、训练、编译量化、推理、评估等功能;3、负责NLP/CV/跨模态基础大模型研发,行业大模型知识注入、精调、推理等研发工作;4、负责大模型训练、推理加速技术研究,解决千亿级大模型训练及推理加速关键技术问题;5、负责CV领域目标检测、图像定位、语义分割、多目标跟踪等算法研发。
任职要求:
1、计算机、人工智能、通信或电子相关专业,有1年以上大模型研发经验;2、熟悉Tensorflow、Pytorch等AI常用算法和框架,对神经网络关键算子有深入理解;3、精通深度学习算法、NLP、CV和多模态等大模型网络结构和原理,4、有大模型研发经验者优先,如GPT系列、BERT、T5等模型的开发和优化,对大模型的训练、评估、优化以及微调具备实际落地经验。5、熟悉Python、C++等编程预研;6、学习能力强、善于沟通、对技术创新充满激情,有较强的成就导向。
工作城市
上海,南京,天津均有HC