崗位職責(zé)
1、負(fù)責(zé)機(jī)器人具身操作任務(wù)的強(qiáng)化學(xué)習(xí)算法開發(fā),包括架構(gòu)設(shè)計(jì)、數(shù)據(jù)處理、訓(xùn)練優(yōu)化及真機(jī)部署;
2、研究多模態(tài)學(xué)習(xí)方法,結(jié)合視覺(jué)、觸覺(jué)、力反饋提升機(jī)器人決策能力;
3、負(fù)責(zé)視覺(jué)感知(物體檢測(cè)、語(yǔ)義分割、3D場(chǎng)景重建等)、機(jī)器人運(yùn)動(dòng)策略學(xué)習(xí)(模仿學(xué)習(xí)),機(jī)器人專家示范動(dòng)作的采集和處理;
4、優(yōu)化從模擬到現(xiàn)實(shí)(Sim2Real)的遷移技術(shù),如fine-tuning、prompt設(shè)計(jì)等,提升算法精度、魯棒性、多場(chǎng)景多任務(wù)的泛化能力;
5、跟蹤前沿技術(shù),進(jìn)行強(qiáng)化學(xué)習(xí)算法的調(diào)研、性能對(duì)比和評(píng)估;
6、根據(jù)需求完成算法開發(fā)與代碼維護(hù),協(xié)助測(cè)試團(tuán)隊(duì)優(yōu)化算法性能。
任職要求
1、碩士及以上學(xué)歷,人工智能、計(jì)算機(jī)、機(jī)器人學(xué)等相關(guān)專業(yè),具有3年以上工作經(jīng)驗(yàn),優(yōu)秀應(yīng)屆生亦可考慮;
2、掌握強(qiáng)化學(xué)習(xí)理論,熟悉 PPO、DQN、SAC 等主流算法;
3、熟悉深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等領(lǐng)域的專業(yè)知識(shí)
4、精通 Python,熟悉 PyTorch 或 TensorFlow 等深度學(xué)習(xí)框架;
5、熟悉 Mujoco、Isaac Gym、PyBullet 等機(jī)器人仿真工具;
6、熟悉LLM/VLM/VLA,了解OpenVLA、ACT、RDT-1B、PI0等多模態(tài)模型經(jīng)驗(yàn)者優(yōu)先;
7、在頂會(huì)發(fā)表論文或具備機(jī)器人項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;
8、工作積極主動(dòng),具備良好的團(tuán)隊(duì)合作與問(wèn)題解決能力。