1.研發和優化基于GPT架構的大規模預訓練語言模型。
2.負責模型的訓練、微調、性能調優及部署上線,確保模型在實際業務場景中的穩定性和準確性。
3.優化模型的壓縮、量化和推理,提升模型服務性能。
4.跟蹤大模型領域前沿技術,提出創新思路推動算法升級和業務發展。
5.具備良好的團隊合作精神、強烈的責任心、學習能力強,并能承受較強的工作壓力。
任職要求:
1.計算機科學、人工智能、機器學習等相關專業本科及以上學歷,至少2年以上自然語言處理領域工作經驗。
2.熟練掌握深度學習框架(如PyTorch、TensorFlow等),具備使用Transformers庫或其他開源大模型工具包進行私有化部署、模型訓練和微調的經驗。
3.具備大模型訓練和部署的實際項目經驗,特別是對GPT系列或類似架構模型有深入理解和實踐經驗。
4.深入理解模型微調和超參數優化原理,能夠獨立完成模型性能調優工作,并對模型精度、速度和內存占用進行綜合優化。
5.掌握NLP領域相關技術和評估方法,能夠通過嚴謹的數據分析指導模型優化工作。
6.熟練掌握Python編程和Linux環境操作,具有較強的代碼編寫和調試能力。
7.邏輯性強,善于思考,具備良好的需求理解、分析、設計和獨立解決問題的能力,快速學習能力強,并具備良好的溝通能力,能在高壓環境下工作。