崗位職責
1.負責大語言模型及多模態大模型的預訓練開發和調優工作,
2.負責基于大模型的機器人控制算法設計、訓練、數據集處理、及真機部署測試.
3.負責大樘型訓練效率提升,如:模型并行、flash attention、LoRA:
4.負責跟進領域最新進展,預研和評估大模型在機器人領域的應用,如RT系列等
任職要求
1.熟練掌握大語言模型及多模態大模型相關的網絡結構及訓練方式;
2.熟練Pvtorch/Tensorflow深度學習框架,掌握Pvthon/C++至少一種編程語言
3.熟練掌握常見的分布式訓練框架,以及大型高效微調技術
4.熟練應用云端算力展開大規模教數據處理及訓練:
5.精通常見模仿學習算法(如:ACT、DP等)及Model-Based RL算法者優先
6.精通模型與機器人硬件接口布置者優先:
7.曾在A1、CV、NLP頂會、頂刊(如:TIP、TRO、CVPR、ACL等)發表論文者優先