岗位职责】
你将重新定义数据与AI的化学反应
数据智能产品攻坚
主导大模型在数据分析场景的工程化落地(如智能报表生成、动态指标预测),打造企业级数据Copilot产品。
设计AI Agent数据融合架构,实现企业数据资产作为智能体的实时感知源(动态数据流)与长期记忆体(知识库)。
基础模型能力突破
研发Data-Centric大模型技术,通过SQL指令微调、结构化数据预训练等方法,提升模型在OLAP场景的推理精度20%+。
构建数据增强的评估体系,设计多模态评估指标(如数据关联性得分、决策可信度验证)。
技术生态建设
与达摩院合作开发行业级数据分析大模型,沉淀开源工具链(如数据清洗插件、领域微调框架)。
主导技术专利申报,参与国际顶会(如NeurIPS/KDD)论文发表。
【岗位要求】
技术栈:
精通PyTorch/TensorFlow框架,掌握LoRA/P-Tuning等大模型微调技术。
熟练使用SQL/Python进行海量数据处理,有DataWorks/MaxCompute实战经验者优先。
算法能力:
深入理解Transformer架构,具备数据分析场景的模型优化经验(如时序预测、指标归因)。
熟悉RAG、Agent记忆网络等数据增强技术,至少1个数据驱动的大模型落地项目。
差异竞争力
数据工程:掌握实时数据流处理(Flink/Kafka)、知识图谱构建等技术栈。
行业认知:在BI分析、企业决策智能等领域有业务抽象能力。
开源贡献:主导过数据相关开源项目(如SQL生成工具、评估框架)。