AI开发工程师

【工作职责】

1.跟踪主流开源大模型(如 GPT 、 LLaMA 、 DeepSeek 、 Qwen 等)技术演进,结合业务场景进行模型预训练、微调与定制化开发;

2.负责大模型在对话系统、代码生成、知识问答、智能写作等方向的应用落地;

3.与产品、工程、行业专家紧密协作,实现语言模型在实际业务中的高性能部署与持续优化;

【任职要求】

1.计算机、人工智能、数学等相关专业本科及以上学历;

2.深入理解 Transformer 、 Attention 机制、预训练﹣微调范式、指令微调、 RLHF 等语言模型核心技术;

3.有大模型训练经验,熟悉分布式训练框架(如 Deepspeed 、 FSDP 、 Megatron );

4.至少有1个成功的大模型应用落地项目经验,具备完整的工程与评估闭环;

5.熟悉中文语料构建与清洗,具备 Prompt 工程、 RAG 、长上下文建模等实践经验者优先;

6.具备优秀的技术文档编写能力与团队沟通协作能力。

公司地点:成都金牛区成都三环研究院蜀西路30号

公司简介:

职位发布者:李经理

成都三环科技有限公司

融资阶段:

公司规模:

相似职位: