崗位職責:
1.NLP方向相關技術研發,包括大模型技術、分類,序列標注、信息抽取等任務;
2.NLP大模型前沿技術探索,解決大模型輸出內容不可控、推理效率低等問題;
3.負責技術產品化轉化,參與關鍵技術系統集成;
4.負責創新成果的專利化、論文化工作。
崗位要求:
1.計算機相關專業獲得博士學位,發表過NLP相關研究頂會論文優先,如ACL、AAAI、EMNLP等;
2. 對NLP主流大模型如ChatGPT/LLaMA/ChatGLM等的原理和差異有深入的理解;
3. 熟悉預訓練模型的認知和知識學習(包括認知架構、知識增強、知識支持、知識監督等)、預訓練模型的推理加速技術、預訓練模型的壓縮技術、預訓練模型賦能的知識獲取、預訓練模型的領域適應與任務適應技術;
4. 熟練掌握主流深度學習框架pytorch/tensorflow,有百億/千億大模型訓練調優經驗優先;
5. 熟悉常見的模型小型化技術,如量化/剪枝/蒸餾等,熟悉onnx/tensorRT。