岗位要求:
1. 熟悉Python开发,有5年以上数据开发经验,有良好的编码习惯;
2. 熟练掌握异构文本数据处理能力,能够使用工具进行数据的抽取、转换和加载;
3. 熟练掌握关系型数据库和NoSQL数据库,能够使用SQL进行数据查询和操作;
4. 熟悉linux操作系统,熟悉shell常用命令,可进行简单的脚本部署;
5. 熟悉运用自然语言处理与Prompt工程技巧,通过大模型+提示进行数据清洗;
6. 具备良好的项目沟通协作能力;
7. 有自然语言建模经验者优先考虑;
工作职责:
1. 负责医疗相关数据的接入、采集、清洗、加工和分析;
2. 根据算法模型、医学等数据要求,构建标准数据集;
3. 开发数据处理组件,保证组件质量要求,可集成到平台;
4. 配合算法工程师参与数据标注、模型训练、参数调优等工作。