大模型推署部工程师

工作职责:

1.负责大规模深度学习模型的部署与优化,确保模型在生产环境中的高效运行。

2.参与大模型推理框架的设计与实现,提升推理效率和稳定性,并部署到推理平台。

3.解决大模型在实际应用中的性能瓶颈和技术难题。

4.维护和优化现有模型部署方案,提升系统整体性能。

5.与团队合作,推动大模型相关技术在业务中的落地应用。

任职要求:

1.计算机科学、人工智能、机器学习等相关专业本科及以上学历。

2.至少1年大规模深度学习模型部署经验,有Fine tune或成功案例者优先。

3.熟悉Transformer底层架构,具备深入理解和优化Transformer模型的能力。

4.熟练使用至少一种深度学习框架(如TensorFlow、PyTorch等)。

5.熟悉分布式计算、并行计算等相关技术,有大规模数据处理经验者优先。

6.熟悉大模型推理芯片,具备底层芯片软件开发能力者优先。

7.良好的编程能力,熟练掌握Python、C++等编程语言。

8.具备良好的问题解决能力和团队合作精神。

公司地点:北京芯视界科技有限公司北京海淀区北京忆芯科技有限公司2D栋907

公司简介:

职位发布者:唐先生

北京忆芯科技有限公司

融资阶段:

公司规模:

相似职位: