岗位职责:
1、负责大模型的应用开发和集成,包括自然语言处理、计算机视觉、推荐系统等领域;
2、深入了解大模型的架构和技术,推动其在实际业务场景中的落地与优化;
3、与产品、算法和后端团队密切协作,设计和实现基于大模型的解决方案;
4、优化大模型的推理性能,确保模型在不同平台(如云端、本地服务器)上的高效运行;
5、编写高质量的代码并参与代码审查,保证项目的可维护性和扩展性;
6、能够及时主动的跟进最新算法进展,主动获取各种开源数据集及代码库来改进自己的工作
7、负责大模型相关技术文档的编写和技术知识的分享。
任职要求:
1、硕士及以上学历,计算机科学、人工智能、软件工程等相关专业;
2、至少3年以上AI、大模型或相关领域的应用开发经验;
3、精通Python编程语言,具有深度学习框架(如TensorFlow、PyTorch、MindSpore等)使用经验;
4、熟悉大模型(如Deepseek,Qwen、llama,InternVL等)及其应用场景;
5、有较强的算法思维和数学基础,理解深度学习模型的优化方法和技术;
6、具有良好的数据结构和算法设计能力,能够进行大规模数据处理和高效计算;
7、了解云计算平台(如AWS、Azure、Google Cloud)及其AI服务,具有分布式计算经验者优先;
8、具备良好的沟通和团队合作能力,能够快速理解业务需求并提供技术解决方案。