参与共建AGI基础设施,支持大规模的人工智能(深度学习)平台,基于领先的400Gbps 的 Infiniband RDMA 网络和最新的 GPU。结合硬件,操作系统等对平台进行深度分析和优化。
岗位职责:
1. 负责基础设施管理,包括资源调度、扩容、监控和优化。
2. 优化和改进监控系统,确保系统的高可用性和性能。
3. 对新技术进行持续的探索研究,提升效率。
岗位要求:
1. 本科及以上学历,计算机相关专业优先,扎实的计算机软件基础;
2. 具备较强的 Python/go 等开发能力,扎实的系统化工程能力;
3. 具有自动化实践经验;
4. 具备较好的灵活性、学习迁移能力和对新技术的追求精神,能够从0-1快速学习掌握新技术并解决未遇到过的问题;
5. 硬件极客玩家,硬核操作系统开发者优先;
6. 有良好的团队合作精神和积极主动的沟通意识。