职位详情

1.理解医疗业务的场景问题并规划大模型技术解决方案,包括数据处理、模型优化、数据评测等2.使用pre-train、PEFT、SFT、RLHF等大模型优化技术,深度优化场景问题中的大模型效果3.使用数据去噪、知识增强、知识外挂等技术,缓解或消除业务应用中的大模型幻觉现象4.基于大模型技术构建医疗领域的应用服务,解决业务中的场景问题并提升业务价值。 岗位要求 1.计算机、数学或统计学相关专业的硕士及以上学历,精通pvtorch、tensorfow等至少1种深度学习框架,具有3年以上NLP相关工作经验 2.精通attention、transformer及其变型,能熟练应用预训练、PEFT、SFT、RLHF等各种优化技术; 3.熟悉业界领先的大模型系列,包括但不限于GPT、LLaMA、GLM、Bloom等,对DeepSpeed、Megatron-LM有一定了解和使用经验; 4.在大模型方向有高质量(ACL、EMNLP、AAAI等)论文或开源项目产出者优先: 5.自驱力强、结果导向,有良好的协同能力,富有想象力和创造力。

工作地址

北京望京

公司信息

相似的职位

大模型算法—NLP北京NaN算法工程师40-60k15薪

厦门万智睿华企业管理咨询有限公司

机器人导航算法工程师

,

深度学习与 3D 算法专家

,

数据标注