工作职责
1.搭建单/多智能体强化学习模型,并不断完善和优化算法,实现车内外决策认知算法开发
2.负责强化学习的算法建模及开发,包括特征提取、模型训练、强化学习框架开发、在线效果优化等
3.负责强化学习前沿技术的研究,持续优化算法性能,并推动前沿技术落地和通用决策人工智能的发展。
4.负责决策大模型算法开发
岗位需求
1.硕士及以上学历,人工智能,自动控制,计算机科学、物理、数学、统计学、信电等相关专业;
2.熟悉强化学习、深度学习和传统机器学习领域的核心范式与前沿进展
3.较强的Python编程能力(熟悉C++优先),至少掌握一种常见的深度学习开源框架(PyTorch或TensorFlow)
4.熟悉常用的强化学习算法(DQN,DDPG,PPO,A3C等);
5.在强化学习领域,有解决实际问题的开发和调优经验(量化金融、物流优化、仿真、自动驾驶、无人机、机器人决策规划)优先
6.对多智能体学习、模仿学习、分布式强化学习等有积累者优先
长安科技有限责任公司,为重庆长安汽车全资子公司,位于重庆市两江新区现代大道与两江大道交叉口。从事汽车软件行业,自动驾驶业务等。