工作职责
1. 负责大语言模型、多模态大模型(文本、图像、语音等)的核心算法研发,包括模型 SFT微调、强化学习后训练、推理优化等关键环节,持续提升模型的效果、效率与稳定性。
2. 跟踪国内外大模型领域的前沿技术(如 Transformer 架构改进、多模态融合技术等),并结合业务场景进行技术调研与创新落地。
3. 针对具体业务需求(如智能客服、内容生成、代码辅助等),设计训练数据处理与清洗、大模型微调、强化学习后训练方案,解决实际业务问题。
4. 通用智能体框架设计与开发,智能体虚拟环境搭建,智能体基座模型的SFT后训练和强化学习后训练。
5. 与工程开发、产品设计等团队紧密协作,推动大模型技术从研发到产品化的全流程落地,输出技术文档与方案说明。
任职要求
学历背景:计算机科学与技术、电子信息工程、数学、统计学、人工智能等相关专业硕士及以上学历,优秀博士优先。
技术基础:
--扎实掌握深度学习、机器学习核心理论(如神经网络结构、优化算法、正则化方法等),熟悉大模型相关技术原理(如 Transformer、Self-Attention、预训练范式等)。
--熟练使用至少一种深度学习框架(PyTorch/TensorFlow),具备丰富的模型开发与调试经验;熟悉分布式训练框架(如 Megatron-LM、DeepSpeed 等)者优先。
--具备良好的编程能力,熟练掌握 Python/C++ 等编程语言,熟悉 Linux 操作系统及 Shell 脚本开发。
项目经验:
-有大语言模型(LLM)、多模态大模型(如 Intern系列、Qwen 系列、LLaMA 系列等)预训练、微调、强化学习后训练,相关项目经验者优先。
-参与过百亿级及以上参数大模型落地项目,或在垂直领域(如金融、医疗、教育、工业等)多智能体框架开发经验者;RAG相关项目(多模态RAG,GraphRAG)开发经验丰富者优先。
-有自然语言处理(NLP)、计算机视觉(CV)、语音处理等相关领域顶会论文(如 NeurIPS、ICML、ICLR、ACL、CVPR 等)发表或顶赛获奖经历者优先。
能力素质:
-具备较强的问题分析与解决能力,能独立应对大模型研发过程中的技术难点。
-拥有良好的创新思维与学习能力,对大模型领域技术发展有敏锐的洞察力。
-具备优秀的沟通协作能力与团队合作精神,能高效推进跨团队项目落地。
-工作态度严谨负责,具备较强的抗压能力,能适应快速迭代的研发节奏。
作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。
商汤科技拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。此外,商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,以低成本解锁通用人工智能任务的能力,推动高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,引领人工智能进入工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块,相关产品与解决方案深受客户与合作伙伴好评。
商汤倡导“发展”的人工智能伦理观,并积极参与有关数据安全、隐私保护、人工智能伦理道德和可持续人工智能的行业、国家及国际标准的制订,与多个国内及多边机构就人工智能的可持续及伦理发展开展了密切合作。商汤《AI可持续发展道德准则》被联合国人工智能战略资源指南选录,并于2021年6月发表,是亚洲唯一获此殊荣的人工智能公司。
商汤(股票代码:0020.HK)已于香港交易所主板挂牌上市。商汤在香港、上海、北京、深圳、成都、杭州、南平、青岛、西安、台北、澳门、京都、东京、新加坡、利雅得、阿布扎比、迪拜、吉隆坡、首尔等地设立办公室。另外,商汤科技在德国、泰国、印度尼西亚、菲律宾等国家均有业务。