云端AI算法应用工程师

职位概览:

我们正在寻找一位充满激情的云端算法部署工程师,致力于优化和加速算法模型的云端部署,以满足公司日益增长的规模化需求。你将加入一个创新的团队,负责构建高效、低成本的模型部署平台,确保我们的业务能够以高吞吐量和高可用性运行,应对海量数据挑战。

主要职责:

1.模型部署与编排:主导各类深度学习模型的部署工作,支持多模态模型的自由编排与应用,运用前沿技术确保模型在云平台等生产环境中的高效运行

2.服务接入与性能调优:利用Kubernetes等技术开展服务端集群管理,实施负载均衡、批处理、缓存加速等策略,持续优化服务响应时间,提升用户体验。

3.推理加速:结合云端GPU性能,探索半精度(FP16)和整数精度(INT8)的部署策略,实现模型推理的加速。

4.性能瓶颈分析:深入剖析模型如Stable Diffusion、Transformer等的耗时分布,识别并解决pipeline中的性能瓶颈。

5.推理引擎优化:专注于推理引擎如vLLM、TensorRTLLM的适配与优化,包括多步推理、并行计算、attention机制加速及算子融合等,以提升整体推理效率。

6.云端集群调度与优化:负责算法集群的调度与优化工作,确保资源的高效利用和任务的高效执行。

资格要求:

1.卓越的学术背景:持有计算机科学或相关领域的研究生学位,具备深厚的理论知识和研究经历。

2.精湛的编程技能:熟练掌握C++与Python,有使用CUDA开发高效层的实践经验者优先。

3.深度学习框架精通:对TensorFlow、PyTorch、ONNX、TensorRT等主流框架的训练与部署有深刻理解,使用过Triton的优先考虑。

4.广泛的技术视野:熟悉常见神经网络架构与训练任务,具备跨领域知识整合能力。

5.分布式系统实战经验:对大规模分布式系统设计有浓厚兴趣,拥有Kubernetes/Docker等容器化技术的实际项目经验,能够应对复杂系统挑战。

6.云端运维经验:了解并掌握云端运维相关工作,确保云端系统的稳定运行。

我们期待你的加入共同推动AI技术在现实世界中的广泛应用,创造更加智能化的未来。如果你对构建高性能、高可用的AI推理系统充满热情,欢迎投递简历,开启你的职业生涯新篇章!

公司地点:北京海淀区北京泰富酒店写字楼5层

公司简介:

深圳比特微电子科技有限公司(中文简称“比特微”,英文简称“MicroBT”)成立于2016 年, 总部位于深圳,在北京、上海、杭州、成都、 南京、苏州、西安等地设有研发中心,是一家 拥有28nm/16nm/8nm/5nm专用芯片设计和产品研发、营销、服务以及提供系统解决方 案的国家高新技术企业。

公司拥有完整的设计流程和大量自主核心技术,凭借雄厚的技术研发实力,持续在低功耗、高算力芯片和人工智能芯片及相关产品领域创新、创造。

公司秉承“极致、共赢、诚信”的理念,积极拥抱半导体产业、人工智能产业,极致追求,开拓创新,致力于成为领先的芯片、产品和解决方案的行业引领者。

职位发布者:吕女士

深圳比特微电子科技有限公司

融资阶段:

公司规模:

相似职位: