1.人工智能、計算機、通信、網絡等專業領域。
2.對Transformer、MOE、多模態、擴散模型等大模型架構有深入理解,熟悉LLM、AIGC、多模態等相關算法的研究與算法優化;
3.精通大模型預訓練與微調策略,包括多模態無監督預訓練、有監督微調與提示學習;
4.精通信號(語音)處理方法,深入研究自動語音識別、語音合成和語音多模態大模型等前沿技術,部分與電磁信號共性技術可直接遷移至電磁大模型上;
5.精通多模態對齊和知識蒸餾技術,熟練使用DeepSpeed、Megatron等多種分布式訓練框架;
6.熟練掌握大模型微調技術,包括LoRA、DPO策略優化,熟悉MoE、AI Agent和RAG技術。
1、根據業務需求,負責領域/場景大模型技術路線論證工作,提供技術解決方案,包括但不限于多模態數據理解、RAG、AI Agent等;
2、與平臺工程師、數據科學家、評測工程師等團隊合作,開展大模型數據工程、訓練與微調、對齊、評估、云邊端部署等工作與工具鏈建設;
3、大模型迭代、訓練與優化工作,持續提高大模型在業務場景中的性能水平;
4、負責優化電磁大模型架構,推進多任務應用落地
5、構建電磁大模型的測評基準,測評在電磁多任務效果,推動大模型性能提升
6、負責電磁大模型內存和推理速度優化,降低訓練部署成本和推理延時
7、編寫項目論證方案、實施方案與項目總結報告等相關技術報告、研發文檔、匯報PPT等文檔撰寫;
8、關注大模型相關技術發展趨勢,參與集團公司大模型相關論證工作。