崗位職責:
1、負責將現有的運維經驗服務化,并實現服務編排,實現運維自動化、智能化;
2、負責AIOps的算法研究并落地,推動運維產品向自動化、智能化方向發展;
3、負責基于日志、監控等,應用機器學習等技術,構建AIOps運維平臺,包括趨勢分析、故障預警、異常檢測、根由分析、故障自愈及自動運維知識圖譜等產品能力的建設。
任職資格:
1、碩士研究生及以上學歷,計算機、信息通信、密碼學、信息安全等相關專業優先;
2、具有良好的代碼能力,熟練掌握至少一門編程語言;
3、具備快速閱讀深度學習相關論文并理解算法的能力,熟悉至少一個機器學習框架和常用的機器學習算法,熟悉Agent編寫,有DeepSeek/ChatGPT/Copilot等工具實戰經驗;
4、6年以上IT經驗,3年以上智能運維平臺和工具開發經驗,熟悉大型運維平臺的架構設計,并參與研發落地;
5、具備趨勢分析、異常檢測、故障定位、根因分析、自動自愈等場景解決方案的設計能力;
6、熟悉DevOps工具鏈和云原生技術棧,如Jenkins、K8S和Terraform等IaC工具;
7、具有較好溝通協調能力、抗壓能力強,有開源項目貢獻經歷者優先。