AI图像算法工程师(智能相册)

岗位职责:

作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括:

一、图像理解方向:

1)开发基于多模态语义的图像理解算法:人物识别、事件聚类、情绪识别、场景识别等;构建个性化的图像语义标签体系;

2)设计图像内容质量评估模型(重复、模糊、人脸表情等)提升用户体验;

3)探索RAG、多模态图像大模型、文本大模型联动下,agent能力建设和开发。

二、 图像AIGC方向(创作与编辑):

1)研究并实现图像生成与编辑算法,如背景替换、人像美化、风格迁移、文生图,图生图等;

2)参与基于 Diffusion基础模型训练;

3)参与ControlNet、Inpainting、aigc编辑大模型等前沿应用模型的业务开发和落地;

任职要求:

一、基础能力:

1)计算机、人工智能、图像处理等相关专业硕士及以上学历;

2)扎实的深度学习基础,熟练掌握 PyTorch / TensorFlow 等主流框架;

3)有扎实的coding能力,熟练掌握python和c++;

4)熟悉图像识别、检测、分割、生成等主流任务与网络结构;

5)能独立完成算法设计、模型训练、上线调优等完整流程。

二、加分项:

1)有多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet 等相关经验;

2)有端侧部署优化经验(CoreML, ONNX, TensorRT等);

3)有实际产品落地经验,如智能相册、人像美颜、图像创作工具等;

4)熟悉大模型(如 GPT-4V, Gemini, Claude)与视觉任务结合。

招聘协作

公司地点:深圳宝安区宝安区

公司简介:

vivo总部位于中国东莞,充分吸纳、发展本地的人才资源,布局了广泛的研发网络,覆盖深圳、东莞、南京、北京、杭州、上海、西安等城市,范围包括5G通信、人工智能、工业设计、影像技术等众多个人消费电子产品和服务的前沿领域。

作为一家以设计驱动创造伟大产品,以智能终端和智慧服务为核心的科技公司,vivo致力于成为联接人与数字世界的桥梁。vivo以独特的创造力,为用户提供更加便捷的个人移动数字化生活。得益于vivo的智能制造网络(含品牌授权),截至目前,vivo年生产能力近2亿台,向全球60+个国家和地区的4亿+用户提供优质产品和服务。从2022年全年的数据来看,vivo以18.6%的市场份额在中国市场排名第一位。(数据来源:IDC,2023.01)

同时,依托智能手机在手机行业的优势,vivo从多个领域寻求互联网业务组合形态的突破,形成了以应用商店、游戏中心、浏览器为核心代表的互联网产品。2018年,人工智能助手Jovi发布,目前覆盖3.78亿用户,支持1000+种场景需求,覆盖手机本身、起居、出行、工作、休闲、学习、亲子、健康等核心场景。

在通往未来的道路上,vivo秉承“本分、用户导向、设计驱动、学习、团队”等企业核心价值观,在整个价值链中遵循并贯彻可持续发展策略,致力于成为一家更健康、更长久的世界一流企业。

职位发布者:姜经理

维沃移动通信有限公司

融资阶段:不需要融资

公司规模:10000人以上

相似职位: