工作职责:
1、负责阿里云服务器、K8S、Docker平台的日常运维(发布部署、运行维护、性能调优、平台优化、容量规划、升级更新、软件故障处理、SLA )以及处理7*24小时的突发应急事件;
2、负责协调沟通,推进生产系统问题或故障的解决及优化;
3、负责开发运维相关pipeline脚本,CICD配置、提高自动化运维效率;
4、负责设计和优化系统的监控系统、策略和实施,提升系统的可用率、安全性;
5、负责生产系统各类故障及事务的应急响应、处理,保持公司业务平台安全稳定的运行;
6、负责线下开发、测试环境K8S容器集群管理;
7、负责公司业务系统的运维及配置工作,提升业务稳定性和运维效率,保持与业务方的高效沟通,建立良好的关系;按时完成领导交办的其他相关工作;
8、用代码构建运维系统、开发自动化工具,解决运维痛点和提高运维效率;探索、研究新的智能运维技术体系;
任职资格:
1、计算机相关专业,本科及以上学历;三年以上大型云平台的实际运维经验;
2、精通Linux操作系统的安装、操作和维护,对Docker技术有深入的了解;精通CICD配置;
3、熟练掌握K8S、Docker, Kafka、 prometheus、Zookeeper, Mysql, ELK, Elasticsearch、Gitlab等开源组件的架构原理和实际运维经验;
4、精通Shell或Python/GO开发,对MySQL,MongoDB、Redis等数据库的部署及优化有一定了解,可以进行pipeline脚本开发及自动化运维工具的开发;
5、熟悉自动化运维和监控平台的架构,熟悉Ansible、Saltstack、Puppet的部署和使用;
6、有多云管理平台开发经验,DevOps工作经验优先;
加分项:
1、熟悉Docker与Kubernete的原理与运维,有实际的容器化经验者优先;
2、有AWS、腾讯、阿里云运维管理经验及相关证书者优先;
3、精通主流日志系统源码,具备调优能力(如ELK、Graylog);
4、能够设计基于容器和微服务的持续交付流水线并有效落地。