崗位職責:
1. 負責大語言模型技術生態的搭建與優化,包括模型架構設計、參數調整等,以提升模型性能和效率。
2. 主導語料制備工作,包括語料的收集、清洗、標注和管理,確保語料的質量和多樣性,為模型訓練提供有力支持。
3. 深度參與Agent訓練過程,運用先進的訓練算法和策略,提升Agent的智能水平和任務完成能力。
4. 構建和優化Agent網絡架構,實現Agent之間的高效協同和信息共享,提高系統的整體性能和可擴展性。
5. 跟蹤和研究大語言模型領域的前沿技術,探索新技術在團隊產品中的應用場景,推動技術創新和產品升級。
6. 與團隊成員緊密合作,包括研究人員、工程師、產品經理等,共同攻克技術難題,確保項目按時完成。
任職要求:
1. 計算機科學、人工智能、機器學習等相關專業碩士及以上學歷。
2. 擁有3年及以上大語言模型相關領域工作經驗,具備扎實的大語言模型理論基礎和實踐經驗。
3. 熟悉主流的大語言模型架構(如Transformer等),并對語料制備、Agent訓練、Agent網絡等有深入的理解和實踐經驗。
4. 熟練使用常見的機器學習框架(如TensorFlow、PyTorch等),具備良好的編程能力(如Python等)。
5. 具備良好的團隊協作能力和溝通能力,能夠與不同背景的團隊成員進行有效的合作。
6. 具有較強的學習能力和創新精神,能夠快速掌握新技術,并將其應用到實際工作中。
7. 具備良好的問題解決能力,能夠在復雜的情況下迅速找到問題的關鍵,并提出有效的解決方案。
專業及研究方向:
計算機科學、人工智能、機器學習等相關專業碩士及以上學歷。