大模型高性能计算工程师

岗位职责:

1、针对不同端侧设备的硬件特性(CPU、GPU、NPU等)进行模型适配;

2、对模型进行推理加速优化,包括但不限于模型量化、剪枝、高性能解码、token压缩等,提升模型端侧运行效率,同时降低模型端侧存储需求;

3、与端侧芯片原厂合作,针对特定硬件架构和推理引擎进行模型优化,以实现最佳性能;

4、跟踪最新的模型压缩、推理加速技术,评估在端侧部署中的可行性和效果,提升产品技术水平和竞争力。

岗位要求:

1、计算机科学相关专业,硕士及以上学历,具备较好的计算机通用算法基础;

2、有数值计算、最优化、代数、图论等理论基础;

3、有大语言模型压缩及推理优化经验,有实现深度学习相关业务算法的经验;

4、熟悉并行计算,熟悉C/C++/python/linux等工具及TensorFlow、PyTorch等深度学习框架;

6、在高性能计算方向发表过高水平论文、获得过相关赛事奖项者优先;

7、强烈的责任心和自我驱动能力及良好的沟通能力。

公司地点:广州黄埔区CVTE第二产业园产业园

公司简介:

广州视源(简称CVTE)成立于2005年12月,A股上市公司(市值900亿元)。

CVTE的产品技术广泛应用在生活、教育、企业、医疗等多个领域:每年全球在售电视机约有三分之一在使用CVTE提供的核心部件,中国学校每七间教室至少一间在用希沃(seewo)上课,企业会议室在用MAXHUB开会,医院病房在用希科(XICOO)的医疗产品……从创立至今,CVTE始终致力于提升电子产品的互动体验,为用户提供更加丰富、高效的沟通方式。

职位发布者:胡先生

广州视源电子科技股份有限公司

融资阶段:不需要融资

公司规模:100~499人

相似职位: