崗位職責:
1. 模型研發與優化:主導大模型架構設計與搭建,基于市場前沿架構,結合業務需求創新改進,持續優化模型性能,降低計算成本,提升準確性與泛化能力。
2. 數據處理與管理:負責海量數據收集、清洗、標注與預處理,構建高質量數據集,運用數據增強技術擴充數據多樣性,為模型訓練提供堅實數據支撐。
3. 算法研究與應用:深入研究自然語言處理、計算機視覺等領域前沿算法,將其應用于實際項目,推動模型功能升級,如實現多模態融合、知識圖譜嵌入等創新應用。
4. 實驗與調試:開展模型訓練實驗,精確設置超參數,監控訓練過程,及時排查解決訓練中出現的梯度消失、過擬合等問題,確保模型穩定高效訓練。
5. 模型部署與維護:與工程團隊協作,將訓練好的模型部署到生產環境,優化模型推理性能,保障線上服務穩定運行,定期對模型進行評估、更新與維護。
任職要求:
1.專業要求:工程管理、計算機科學、信息技術、電子工程、自動化、機械工程等相關專業。具備扎實的理論基礎。
2.熟練掌握Python、C++等編程語言;精通深度學習框架,熟悉自然語言處理、計算機視覺等領域的基礎算法。
3. 擁有大模型研發經驗,參與過架構模型的搭建與優化,有大規模數據集處理和訓練經驗者優先。
4.具備良好的溝通能力和團隊合作精神,能夠與開發人員、系統管理員等團隊成員有效溝通,協同解決運維中遇到的問題。
5.具備持續學習的能力,能夠不斷跟進新技術和新方法,提高自身的專業水平。