大模型算法专家

工作内容:

1. 负责生成式大模型(LLM)预训练算法的训练、优化、精调、对齐等技术研究,涉及语言大模型、多模态大模型。

2. 负责大模型技术和应用的研究与落地,如智能问答、报告生成、检索增强、知识增强、函数调用等。

3. 负责大模型基于GPU的并行多机多卡训练、高性能模型推理,推进分布式训练中的计算和通信优化等。

4. 负责大模型前沿技术研究,通用类和垂类预训练模型研发及效果持续优化。

5. 负责领域技术洞察和预研,结合业务对现有系统进行分析,识别技术瓶颈,主动优化,牵引架构持续演进,构建持续的架构竞争力。

6. 参与撰写技术文档和学术论文,分享和传播技术成果。

职位要求:

1. 硕士及以上学历,985/211院校毕业优先。计算机信息技术和知识工程相关专业,熟练掌握深度学习、计算机视觉、自然语言处理等领域的专业知识。

2. 熟悉Transformer、BERT、GPT系列、T5、PaLM等模型,对大模型的训练数据标注和处理及训练技术有深入理解。

3. 熟悉Pytorch/Tensorflow深度学习框架,至少掌握Python或C++其中一种编程语言。

4. 了解常见的强化学习算法原理(如DQN、DDPG、A3C、PPO等),有相关训练和开发经验者优先。

5. 曾在AI、CV、NLP顶级会议(如:NIPS、AAAI、CVPR、ACL等)发表论文者优先。

公司地点:杭州滨江区阿里巴巴滨江园区4号楼5楼

公司简介:

职位发布者:董女士

杭州秋果计划科技有限公司

融资阶段:

公司规模:20~99人

相似职位: