【崗位職責】
1、對海量代碼片段進行語義理解與質量判斷,包括但不限于語法正確性、功能完整性、可讀性、風格一致性、是否存在版權問題等;
2、 參與設計并完善代碼數據標注標準與流程規范;
3、執行人工標注任務,如函數意圖識別、代碼缺陷標記、注釋匹配、代碼相似度判斷、生成結果評分等;
4、 協助自動化標注系統的優化,對機器標注結果進行人工校驗與反饋;
5、 參與構建代碼問答、代碼翻譯、代碼補全等專項評測集;
6、配合數據工程師與算法團隊,持續提升模型訓練與評測數據的質量水平。
【任職要求】
1. 計算機科學、軟件工程、人工智能等相關專業本科及以上學歷,有較強編程能力和邏輯思維能力;
2. 熟悉至少一種主流編程語言(Python/Java/C++/JavaScript等),能快速閱讀、理解和分析代碼邏輯;
3. 具備良好的代碼語義理解能力,能夠判斷代碼是否符合語法規則、是否具有潛在錯誤或不良實踐;
4. 責任心強,具備高度的細致度和專注力,能在大規模數據中保持判斷的一致性和準確性;
5. 具備良好的溝通能力和團隊合作意識,能與算法、工程、產品等多角色高效協作;
6. 熟練使用Excel、Google Sheets 或相關標注工具者優先;有Label Studio、Doccano等平臺經驗者加分;
7. 有算法競賽、ACM、LeetCode、GitHub開源項目貢獻經驗者優先考慮;
8. 了解基本的開源協議(如MIT、Apache等),能識別代碼中的潛在版權風險。