任職資格:
1.計算機相關專業本科及以上學歷,至少有5年主流云平臺的建設、運維相關經驗。
2.精通Linux操作系統和常用組件(Nginx,Tomcat,Elasticsearch,Redis,Kafka等)的部署優化,以及故障定位和處理。
3.精通一種以上編程語言,至少掌握python/java/go中的一種編程語言,能自主開發自動化運維平臺或工具,提高運維效率。
4.熟悉Docker、Mesos、DC/OS、Kubernetes等主流容器技術的功能及原理,有大規模集群運維經驗。
5.熟悉Ansible、SaltStack、Prometheus、Grafana、Zabbix、Pinpoint、Skywalking等開源運維工具。
6.了解HADOOP集群、PAAS組件,了解SPARK、HIVE、HBASE等技術,掌握SQL基本操作,具備編寫存儲過程的運營研發能力。
7.具備良好的服務意識、具備吃苦耐勞精神,能站在分公司一線角度分析、支撐問題。
8.具備運維團隊牽頭或項目管理經驗,能夠有效組織協調開發、測試、基礎設施等多團隊資源,推動運維相關項目(如自動化平臺建設、架構優化、故障復盤改進、流程標準化等)的規劃、實施與落地。
9.有主導運維自動化項目、或制定/優化運維規范(如SOP、應急預案、容量規劃流程)的成功經驗,具備技術方案選型及實施決策能力。
10.具備通信運營商行業相關的大數據應用系統開發、運維工作經驗者優先。
崗位職責:
1.負責大數據項目管理,負責基于主流公有云產品的業務系統的規劃、建設、維護與優化,確保業務系統的穩定性、高可用性和可擴展性。
2.負責大數據應用系統核心架構的性能調優,定位并修復系統的疑難問題,負責按運維需求完成自動化腳本的開發。
3.掌握云產品運維過程,針對應用系統資源需求、場景、部署、應用、優化、安全等進行實施支撐。
4.負責大數據應用系統日常運維,包括日/月數據維護作業處理、系統安全、系統監控和巡檢、牽頭處理復雜故障和預案優化等;
5.負責大數據應用系統新功能測試、上線割接和驗證,保障系統升級全過程的穩定性;
6.負責大數據應用系統日常問題支撐,包括問題核查、全過程管控和支撐回復,提升業務人員使用系統的感知和滿意度。
7.負責推動運維工作朝著自動化、智能化的方向演進,負責相關技術方案選型、項目規劃與實施落地,提升整體運維管理效率。
8.負責組織或主導重大故障的復盤分析,推動制定并落實有效的改進措施,優化運維流程與規范。
9.協調開發、測試、基礎設施、安全等團隊資源,推動解決跨領域的復雜運維問題,確保運維需求在項目全生命周期中得到有效落實。