量化研究员

工作职责

1.搭建单/多智能体强化学习模型，并不断完善和优化算法，实现车内外决策认知算法开发

2.负责强化学习的算法建模及开发，包括特征提取、模型训练、强化学习框架开发、在线效果优化等

3.负责强化学习前沿技术的研究，持续优化算法性能，并推动前沿技术落地和通用决策人工智能的发展。

4.负责决策大模型算法开发

岗位需求

1.硕士及以上学历，人工智能，自动控制，计算机科学、物理、数学、统计学、信电等相关专业；

2.熟悉强化学习、深度学习和传统机器学习领域的核心范式与前沿进展

3.较强的Python编程能力（熟悉C++优先），至少掌握一种常见的深度学习开源框架（PyTorch或TensorFlow）

4.熟悉常用的强化学习算法（DQN，DDPG，PPO，A3C等）；

5.在强化学习领域，有解决实际问题的开发和调优经验（量化金融、物流优化、仿真、自动驾驶、无人机、机器人决策规划）优先

6.对多智能体学习、模仿学习、分布式强化学习等有积累者优先

长安科技有限责任公司，为重庆长安汽车全资子公司，位于重庆市两江新区现代大道与两江大道交叉口。从事汽车软件行业，自动驾驶业务等。

公司地点：重庆渝北区重庆长安科技有限责任公司0