职位描述
岗位职责:
1. 负责相关AI平台的部署、配置、管理,运行性能指标的监控分析和优化等运维工作;
2. 负责AI平台相关工具的开发和维护,以及相关文档的编写;
3. 协助AI算法开发工程师解决开发过程中出现的各种系统运维问题,提高工程师开发效率;
4. 协助AI算法开发工程师解决AI应用在生产环境中出现的各种问题,确保AI应用的稳定性和性能;
5. 监控AI应用的运行状态,及时处理出现的故障和性能问题。
职位要求:
1. 拥有计算机、通信、软件等相关专业背景,本科及以上学历;
2. 有2-3年以上平台运维经验或者分布式系统运维经验;
3. 熟练掌握shell、python、java等任一编程技能,熟练使用docker、Kubernetes等容器管理命令;
4. 熟悉Linux操作系统运维管理,具备Linux高并发网站部署和优化经验;
5. 熟悉常用的关系型和非关系型数据库和调优技术,如MySQL、Redis、Mongodb等;
6. 良好的团队合作能力,具备较强的沟通能力,较强的运维技术学习能力;
7. 有AI平台、CV、NLP、大模型等应用、系统运维经验者优先。