職位描述
工作職責:
基礎設施運維:
負責物理服務器、虛擬機及云平臺的日常管理、監控、維護、各程序版本發布與優化。
精通網絡運維: 包括網絡架構規劃、配置管理(路由器、交換機、防火墻、負載均衡等)、性能監控、故障診斷與排除,保障網絡高可用和安全。
實施服務器操作系統(Linux為主,可能涉及Windows)的安裝、配置、安全加固、性能調優及補丁管理。
建立和維護完善的監控報警體系(如 Zabbix, Prometheus, Grafana, Nagios 等),確保問題及時發現與響應。
負責備份策略的制定、實施、驗證與恢復演練。
核心組件管理:
熟練掌握以下組件的安裝、配置、性能調優、監控及故障處理:
數據庫: MySQL / MariaDB
緩存: Redis
Web服務器/反向代理: Nginx
搜索與分析: Elasticsearch (包含 Logstash, Kibana - ELK Stack 經驗更佳)
理解這些組件在不同操作系統環境下的最佳實踐和差異。
自動化與持續集成/部署 (CI/CD):
熟練使用 Jenkins 進行CI/CD流水線的搭建、維護與優化,實現應用的自動化構建、測試和部署。
具備自動化運維能力(優先):
精通至少一種腳本語言(如 Shell, Python, PowerShell)。
熟練使用主流配置管理工具(如 Ansible, SaltStack, Puppet, Chef)。
利用自動化工具實現服務器配置、應用部署、監控配置、日常運維任務的自動化。
故障響應與優化:
快速響應和處理系統、網絡、應用等各級別的故障,進行根因分析并制定預防措施。
持續分析系統性能瓶頸,提出并實施優化方案,提升系統容量和效率。
參與制定和執行容災、高可用方案。
安全與合規:
實施和執行系統及網絡安全策略,進行安全漏洞掃描與修復。
遵循公司IT策略和行業最佳安全實踐。
協作與文檔:
與開發、測試、DBA及其他團隊緊密協作,支持項目上線和運維需求。
編寫和維護清晰、準確的技術文檔(系統架構圖、運維手冊、故障處理記錄等)。
任職要求 (硬性技能):
必備:
計算機科學、信息技術或相關專業本科及以上學歷,或具備同等實踐經驗。
3年以上 專業運維工程師工作經驗。
精通 Linux/Unix 操作系統管理(如 CentOS, Ubuntu, RedHat)和常用命令。
精通網絡基礎知識及運維實踐: 深入理解 TCP/IP, HTTP/HTTPS, DNS, VLAN, VPN, 防火墻策略等;具備主流網絡設備(Cisco, H3C, Huawei, F5等)配置與排障經驗。
熟練掌握至少一種腳本語言 (Shell, Python 等),用于自動化任務。
熟練掌握 Jenkins 的配置、使用和維護。
熟練掌握以下至少兩種組件的安裝、配置、監控和基本調優: MySQL, Redis, Nginx, Elasticsearch。要求具備在不同系統(Linux)上部署調試的實際經驗。
熟悉主流監控工具的使用和配置。
理解高可用、負載均衡、容災備份等關鍵運維概念及實現方式。
具備優秀的故障排查、分析問題和解決問題的能力。
良好的溝通協作能力和團隊精神。
優先考慮 (重要加分項):
有自動化運維項目實戰經驗: 熟練掌握并使用 Ansible, SaltStack, Puppet, Chef 等配置管理工具進行大規模自動化部署和管理。
豐富的 Elasticsearch (ELK Stack) 集群管理、性能優化經驗。
云平臺(AWS, Azure, 阿里云, 騰訊云, GCP 等)運維經驗及認證。
容器化技術經驗(Docker, Kubernetes)。
熟悉基礎設施即代碼 (IaC) 概念及工具(如 Terraform)。
有開發背景或理解主流開發框架。
軟技能:
強烈的責任心和敬業精神,能夠在壓力下工作。
優秀的自主學習能力和技術熱情,能快速掌握新技術。
注重細節,追求系統穩定性和性能優化。
良好的文檔編寫習慣。
積極主動,善于溝通和跨團隊協作。