職位描述:
1. 使用 AG/TTS方向的相關語音模型 進行音色訓練,保證語音合成的效果,保證模型按時上線。
2. 對TTS模型的輸出進行 基礎調參和優化(如調整語速、音調、停頓等),提升合成效果。
3. 處理語音數據(如文本清洗、音頻裁剪等),準備符合模型輸入的標準化數據。
4. 測試不同TTS模型的效果,記錄問題并反饋給相關專家/算法。
5. 編寫簡單的腳本(Python/Bash)實現批量語音合成或數據處理。
6. 根據日清數據進行熱修復。
職位要求:
1、本科及以上學歷,有過1年以上相關工作或項目經驗優先;(經驗優秀可放寬)。
2、計算機、電子信息、語音處理相關專業優先;
3、能使用Python進行 基礎數據處理(如文本清洗、音頻裁剪),會調用API或本地模型。
4、了解 TTS(文本轉語音)基礎概念,熟悉常見語音合成工具或API
5、對語音質量有基本判斷能力(如是否流暢、發音是否準確)。
6、具備良好的學習能力和責任心,能按流程完成重復性任務。
中關村E世界