負責大規模文本數據和復雜數據集的深度分析,運用自然語言處理(NLP)技術進行關鍵詞提取、命名實體識別、文本分類、情感分析、主題建模和事件檢測與追蹤。
應用機器學習(ML)算法(包括監督學習、無監督學習、傳統ML模型及深度學習模型如CNNs, RNNs, Transformers, GNNs)進行趨勢預測、模式識別和用戶行為分析。
參與高級分析功能的研發,如多模態數據分析、異常行為識別及基于大語言模型(LLM)的文本分析與內容生成。
構建和維護風險評估指標體系,參與異常檢測模型的開發與優化。
與團隊成員協作,將分析結果通過可視化方式呈現,為決策提供數據支持。
參與MLOps流程,包括數據管理、模型訓練、評估、部署及監控,確保模型持續有效。
任職要求:
計算機科學、統計學、數據科學或相關領域本科及以上學歷。
扎實的自然語言處理和機器學習理論基礎,熟悉常用的算法和模型。
熟練掌握至少一種主流編程語言(如Python),并熟悉相關的數據分析和機器學習庫(如Scikit-learn, TensorFlow, PyTorch, Transformers, spaCy, NLTK)。
熟悉大數據處理框架者優先(如Apache Spark, Apache Flink)。 具備數據可視化工具使用經驗者優先。
具備良好的邏輯思維能力、數據敏感度和解決問題的能力。
具備良好的溝通能力和團隊合作精神。
有MLOps實踐經驗者優先。