职位描述:
1.承担算法服务的工程开发与性能优化,支撑公司AIGC算法模型的高效部署与工程推理,实现高并发、低延迟、高可用的算法服务,匹配业务场景需求;
2.与算法工程师紧密协作,主动承担并负责完成AIGC算法模型的服务化、接口封装、数据流转及性能调优;
3.调研前沿算法工程技术,包括模型压缩、异构计算,推理加速等,提升算法服务效率与资源利用率。
职位要求:
1.本科及以上学历,计算机/电子/通信工程/应用数学等相关专业;
2.精通至少一门开发语言Python/Rust/C++/Go,熟悉RESTful/gRPC等接口开发;
3.熟练掌握算法与数据结构,掌握消息队列(Kafka/RabbitMQ)及缓存技术;
4.具备较强的沟通协作、快速学习和动手能力,自我驱动,责任心强,承压力好;
优先选择:
1.熟悉常见机器学习框架(如PyTorch)的模型部署和推理框架(如TensorRT/vllm/lmdeploy);
2.了解算法模型优化技术(模型量化、动态批处理、GPU资源调度,CUDA);
3.有算法Pipeline开发经验者优先,有实际算法工程落地经验的优先。