崗位職責:
1. 在芯片設計、驗證,制造、測試環節中定義多模態大模型可以解決的實際問題;
2. 梳理多模態大模型需要的業務數據,完成業務數據的收集和清洗工作;
3. 針對特定的業務場景對大模型進行微調和評測,包括但不限于大語言模型,多模態大模型,agent等技術。
任職要求:
1. 計算機科學,電子信息科學,微電子等相關背景碩士以上學位,至少五年以上NLP相關工作經驗
2. 熟練掌握Python,有TensorFlow、PyTorch等深度學習框架的實際開發經驗。
3. 對大模型的微調技術有實際的項目實踐,包括從預訓練,監督微調,對齊微調的pipeline以及LORA,QLORA,DPO等核心的技術手段
4. 深入理解多模態相關的技術架構,并有實際從事多模態相關的數據清洗的實踐經歷
5. 具備良好的團隊協作精神,目標導向,行動力強,勇于接受挑戰和有較強的抗壓能力
6. 出色的文獻研究能力和溝通能力,樂于分享自己的研究興趣和實踐成果
7. 具有扎實的數學理論功底,有志于通過持續學習和項目實踐,成長為AIForEDA領域的技術專家
8. 工作地點優先合肥,特別優秀的可以在上海,但需要經常來合肥出差
9. 下列附加項為加分項:
9.1 有獨立負責大型軟件項目架構設計并實際參與編碼研發相關的項目經歷
9.2 在AI相關的技術領域有自己獨立開發的開源項目
有頂會或期刊的論文發表,包括但不限于CVPR,ECCV,NIPS等