工作职责:
1. 负责构建面向医疗行业的大语言模型,具体包括继续预训练、指令微调、RLHF、检索增强等工作;
2. 跟进大模型领域的最新成果,并在实际应用中进行尝试;
3. 跟踪和研究前沿技术并支持公司常规算法需求的持续优化和迭代;
4. 结合实际应用场景,探索尝试新方法并撰写相关论文和专利。
职位要求:
1. 计算机、统计、自动化、数学等相关专业博士毕业;
2. 熟练掌握python语言,熟悉pytorch或tensorflow等深度学习框架;
3. 具备较强的学习能力和动手能力,具有5年以上NLP或大模型相关项目经验;
4. 在ACL、EMNLP、NAACL、AAAI等相关顶会有论文发表者优先。