岗位职责:
1、进行推理或训练领域的大模型研发工作;
2、推理领域包含推理加速框架的国产算力卡适配、新特性的实现,集群化推理的落地;
3、训练领域包含训练框架的开发、国产算力卡适配、大规模训练配套技术的落地。能够进行模型结构优化、落地业界前沿训练方法。
任职要求:
1、本科以上学历,硕士优先,理工科背景,计算机科学、数学或统计学等专业更佳;
2、掌握大模型相关基础知识,工程代码能力扎实,能熟练掌握python、pytorch等大模型必备开发技能;
3、有三年以上机器学习相关经验,大模型训练或推理加速经验更佳;
4、训练方面要求掌握整个训练流程中常用的技术手段,有数据构建、预训练或后训练等经验,熟悉ms-swift、megatron等训练框架源码,熟悉常见的神经网络结构,能做二次开发;
5、推理方面要求掌握常见推理加速手段,熟悉常用开源推理加速框架vLLM和SGLang源码,能做二次开发,有PD分离+EP等集群化推理经验者优先;
6、有CUDA或triton算子开发相关经验、熟悉硬件算力卡底层原理的优先。
招商银行成立于1987年,是一家在中国具有一定规模和实力的全国性商业银行。在英国《银行家》杂志全球1000家大银行榜单中,按一级资本排名,招商银行位居第14位。招商银行向客户提供各种批发及零售银行产品和服务,推出的“一卡通”、一网通、“金葵花理财”、招商银行App、薪福通等创新产品和服务广为消费者接受。招商银行构建了完善的战略管理体系,形成了良好的业务架构,打造了赋能型的金融科技基础能力。近年来,招商银行紧密围绕“轻型银行”战略,以客户和科技为主线,实现“质量、效益、规模”动态均衡发展。未来五至十年,招商银行着眼于实体经济不断升级的融资需求和居民财富持续高涨的配置需求,以“大财富管理”为工作主线,以金融科技为动力,致力打通资产和资金的供需两端,向“轻型银行”的高级形态不断演进。
招银网络科技成立于2002年,致力于为招商银行提供软件应用开发和维护。作为招商银行总行科技的重要力量,招银网络科技的核心业务是为招商银行全球化发展提供强有力的软件开发及技术支持,其服务遍布中国、美国、欧洲及东南亚等多个国家与地区。公司坚持招商银行“以客户为中心,为客户创造价值”的价值观,同时结合科技队伍特点,倡导“责任、主动、稳健、高效、开放、创新”,在价值观的引领及全体员工的奋斗下,招银网络科技成为了招商银行最重要的技术贡献者。
招银网络科技现有深圳、杭州和成都三家分支机构。公司秉承“让员工做自己的主人”的人才理念,为员工营造优越的办公环境和职业发展通道,创造人性化的工作氛围。