岗位职责:
1.负责处理大规模数据集,进行数据清洗、预处理和特征工程,确保数据质量和可用性。
2.设计并实现高效的工程化数据处理流程,支持AI算法方案的落地和优化。
3.使用Python编写数据处理脚本和工具,提升数据处理效率和可复用性。
4.与算法团队和产品经理协作,将算法方案转化为工程化实现。
5.持续优化数据处理流程,提升算法性能和模型效果。
任职要求:
1.计算机科学、数据科学、机器学习或相关领域的本科及以上学历。
2.2年以上python项目开发经验,熟练掌握Python编程语言,熟悉常用数据处理库(如Pandas、NumPy、Dask等),熟悉python环境的搭建部署。
3.具备处理大规模数据的经验,熟悉分布式计算框架(如Hadoop、Spark、Flink)优先。
4.熟悉数据清洗、特征工程和数据可视化的基本方法。
5.具备良好的工程化思维,能够设计高效、可扩展的数据处理流程。
6.有AI相关工作经验,熟悉机器学习库(如Scikit-learn、XGBoost、TensorFlow/PyTorch)、有大模型算法优化和工程化实践经验者优先。
7.具备良好的沟通能力和团队协作能力,能够与算法团队和产品经理有效协作。
连尚网络全资子公司,海外IM产品。