崗位職責:
(1)主導Operator設計與研發:基于Kubernetes構建Operator框架,封裝業務邏輯及運維能力,實現部署、擴縮容、故障恢復等全生命周期自動化管理,指導團隊完成Operator的架構設計、代碼開發及性能優化,確保與PaaS平臺的無縫集成,推動運維能力與智能分析(如AI預測、資源調度)的融合 ;
(2)云原生平臺能力建設:設計并實現K8s擴展功能(如CRD、Controller、CNI插件),優化資源調度算法及集群資源利用率,支持千節點級別的容器化業務規模;構建可觀測性體系(監控、日志、告警),保障平臺穩定性(SLO≥99.95%)及高并發場景下的性能調優;
(3)技術研究與生態整合:跟蹤研究CNCF社區技術發展趨勢(如Istio、Prometheus Operator),推動開源項目在業務中的落地,參與云原生中間件(Service Mesh、Serverless)的研發;結合智能算力需求,探索多云/混合云架構下的統一調度方案,實現邊緣計算與中心化平臺的協同 ;
(4)跨團隊協作與標準化推進:制定云原生技術規范及交付流程,指導業務團隊完成微服務拆分、容器編排及DevSecOps流程落地;協調開發、測試、運維資源,推動云原生技術在全公司IT系統的遷移與標準化實施。
任職要求:
(1)計算機相關專業本科及以上學歷,5年以上云原生領域經驗,3年以上K8s Operator開發或架構設計經驗 ;
(2)精通Go/Java語言,深入理解Kubernetes核心組件(API Server、Controller Manager、ETCD)及Operator SDK/Kubebuilder開發框架 ;
(3)熟悉Operator開發全流程,包括CRD定義、Reconcile循環、自定義控制器開發,有大規模集群管理及性能調優經驗 ;
(4)掌握云原生生態技術棧(如Istio、Prometheus、Fluentd),具備分布式數據庫強一致性、Service Mesh等復雜場景的解決方案設計能力 ;
(5)主導過至少1個企業級云原生平臺從0到1的架構設計與落地,支持千萬級設備或百萬級租戶規模,或有AI訓練平臺、多集群管理、Serverless架構等前沿領域實踐經驗者優先 ;
(6)對云原生技術趨勢敏感,持有CKA/CKAD/PMP認證者優先。