崗位職責:
1.負責多模態圖像大模型的預訓練、微調與評估,包括LLM、Diffusion、Vision-Language模型等;
2.參與構建和優化模型訓練數據集,包括文本、圖像、圖文對等;
3.負責訓練框架的開發與優化,如分布式訓練、混合精度訓練、參數高效微調(LoRA、PEFT 等);
4.跟進前沿研究,推動模型性能優化和推理效率提升;
5.與產品、算法、后端等團隊緊密合作,推動模型落地。
任職要求:
1.計算機、人工智能、圖像處理、自然語言處理等相關專業本科及以上學歷,優秀者可放寬;
2.熟悉大模型架構(如Transformer、Diffusion、CLIP、BLIP、SD等),并有實際訓練經驗;
3.熟練掌握 PyTorch、Transformers、Diffusers、DeepSpeed、Accelerate 等主流框架;
4.具備多模態數據處理與標注經驗,有AIGC相關項目經驗者優先;
5.具備良好的工程實現能力和團隊協作精神;
6.有較強的英文文獻閱讀和技術文檔撰寫能力。
加分項:
1.有開源項目經驗或在頂會發表論文;
2.了解 Stable Diffusion、SDXL、LLaVA、MiniGPT-4、InternLM-XComposer 等項目;
3.有AI繪圖或文生圖產品開發經驗者優先。