一、崗位職責:
1、全面運維管理
v 負責算力中心基礎設施的日常運維,包括電力系統、制冷系統、網絡設備、服務器集群等,確保99.99%以上的可用性;
v 組織部門工作,制定運維工作流程與制度,保證算力中心工作的正常進行,滿足算力中心安全運營的要求,優化資源調度與能效管理(PUE≤1.2);
v 保證供電正常和設備廠商技術支持,其它支持工作項及時到位。
2、安全與應急響應
v 主導機房安全體系建設,落實消防、安防、數據安全規范,制定應急預案并定期演練;
v 處理突發電力中斷、設備故障、網絡攻擊等事件,確保業務連續性。
3、團隊與技術管理
v 領導運維團隊(含電力、網絡、硬件工程師),制定培訓計劃,提升團隊技能;
v 關注各系統的設計、設備的最新成果,并結合實際工作對現有系統、設備進行優化、升級、改造
4、成本與合規管控
v 根據業務目標分析設施運營狀況,優化算力中心運行成本,協調供應商進行設備維護與升級;
v 確保符合國家及行業標準(如GB 50174),通過第三方合規審計。
二、任職要求
1、專業背景
v 本科及以上學歷,電氣工程、計算機科學、通信工程、自動化等相關專業;持有CCNA、CDCP、Uptime認證者優先。
2、經驗要求
v 5年以上IDC運維經驗,其中至少3年管理崗位經驗,主導過大型數據中心(≥1000機柜)運維項目;
v 掌握數據中心電氣、暖通、弱電、消防系統的基本架構、原理、特性、操作、維護保養要點。
v 具備數據中心工程驗收、承載測試、系統優化的工作經驗。
3、核心能力
v 精通數據中心能效優化、故障根因分析(RCA)及SLA管理;
v 具備較強的風險預判與應急決策能力,能快速處理復雜技術問題;
v 具備各系統運維、變更方案、作業指導書、規范、流程、制度、測試演練方案、應急預案等文檔的編寫和審核能力。
4、軟性素質
v 責任心強,良好的口頭與書面溝通、表達能力,具備團隊協作精神與跨部門溝通能力;
v 每周駐場不少于5天,適應7×24小時輪班制及緊急情況現場支援。