工作职责:
1.负责大规模深度学习模型的部署与优化,确保模型在生产环境中的高效运行。
2.参与大模型推理框架的设计与实现,提升推理效率和稳定性,并部署到推理平台。
3.解决大模型在实际应用中的性能瓶颈和技术难题。
4.维护和优化现有模型部署方案,提升系统整体性能。
5.与团队合作,推动大模型相关技术在业务中的落地应用。
任职要求:
1.计算机科学、人工智能、机器学习等相关专业本科及以上学历。
2.至少1年大规模深度学习模型部署经验,有Fine tune或成功案例者优先。
3.熟悉Transformer底层架构,具备深入理解和优化Transformer模型的能力。
4.熟练使用至少一种深度学习框架(如TensorFlow、PyTorch等)。
5.熟悉分布式计算、并行计算等相关技术,有大规模数据处理经验者优先。
6.熟悉大模型推理芯片,具备底层芯片软件开发能力者优先。
7.良好的编程能力,熟练掌握Python、C++等编程语言。
8.具备良好的问题解决能力和团队合作精神。