主要职责:
1、研究并应用最新的开源大模型(如Stable Diffusion、WaveNet等),实现高质量的图片和语音生成功能(针对文旅文博行业的应用场景,进行模型选择、特征工程和调参优化、模型部署、训练和优化,包括数据预处理、模型构建、训练、调参等工作,以满足业务场景需求)
2、设计并实现高效的算法和系统架构,确保图片和语音生成的高效性、准确性和可扩展性。
3、与产品经理、设计师和前端工程师紧密合作,理解业务需求,将技术解决方案转化为实际产品功能。
4、优化模型性能,提升生成速度和质量,解决技术难题,确保系统稳定运行。
5、跟踪行业动态,探索新技术、新方法,不断提升产品的竞争力。
任职要求:
1、计算机相关专业本科及以上学历,具备扎实的计算机基础和良好的数学功底。
2、熟悉Python/TensorFlow/PyTorch等主流编程语言和深度学习框架,具备丰富的机器学习/深度学习作品经验。
3、理解计算机视觉、自然语言处理或音频处理领域的基础理论和算法,有成功的作品者优先。
4、具备良好的问题解决能力和创新能力,能够独立进行技术调研和方案设计。
5、优秀的团队合作精神和沟通能力,能够与跨职能团队有效协作。
6、有开源项目贡献或参与过知名AI竞赛并获得优异成绩者将优先考虑。