AI 推理引擎开发工程师

岗位职责:

1. 负责 BOSS 直聘推理系统的设计与开发,支撑公司 CTR/LLM/CV 等场景的推理加速工作。优化模型推理性能,提升服务吞吐,降低推理延迟,追求 SOTA 性能。

2. 追踪业内前沿推理优化方法,结合实践场景进行集成与实现,不断改进推理性能,推动团队技术的进步。

3. 与算法工程师密切配合,结合业务场景与需求,一同发现、分析、解决问题,提升业务效果。

任职要求:

1. 本科及以上学历,电子/计算机/通信等相关专业,3 - 5 年工作经验。

2. 有扎实的系统开发经验,熟练使用 C / C++ 和性能优化意识,具备大规模 AI 推理系统开发经验。熟悉 GPU 体系和 CUDA 编程/有并行计算/异构计算经验优先。

3. 有推荐系统开发经验 / LLM 推理服务开发经验优先。

4. 有主流推理框架(TF Serving/Triton Server )、推理引擎(TensorRT/OpenVINO/ONNXRuntime)使用/开发经验优先。

5. 具备良好的团队合作精神,能够与业务方密切配合,并肩解决问题,一同成长。

公司地点:北京朝阳区冠捷大厦(太阳宫中路)

公司简介:

BOSS直聘是一款在全球范围内率先发展移动互联网“直聘”模式的在线招聘APP,于2014年7月上线,2021年6月在纳斯达克上市。

BOSS直聘致力于用技术的手段和用户第一的服务理念,为招聘者和求职者搭建高效、便捷、易用的求职招聘的平台。

BOSS直聘产品的核心是“移动+智能匹配+直聊”,通过将在线聊天功能引入招聘场景,让应聘者和用人方直接沟通,让招聘最终决策者直接参与线上招聘,跳过传统的冗长环节,提升效率。

BOSS直聘应用前沿人工智能技术,不断追求岗位与人才的多维度的智能匹配,提升招聘效果。

职位发布者:戴先生

北京华品博睿网络技术有限公司

融资阶段:

公司规模:1000~9999人

相似职位: