崗位職責
1.研究并識別各行業(yè)的語料需求,收集并分析行業(yè)語料樣本;
2.制定語料項目的方案計劃,明確項目目標、范圍、時間表和預算;
3.完善語料庫建設的方法論,輸出規(guī)范和相關標準;
4.推進語料項目的交付。
任職要求
1.本科及以上學歷,計算機科學、信息工程、語言學或相關領域專業(yè)優(yōu)先;
2.熟悉語料庫建設流程,包括數(shù)據(jù)采集、清洗、標注和質檢優(yōu)化;
3.了解大模型訓練的方式方法,熟悉所需語料的特點;
4.有大數(shù)據(jù)治理經(jīng)驗,1年以上AI語料庫建設或相關領域工作經(jīng)驗,有跨行業(yè)語料庫建設的優(yōu)先考慮。