職位描述
崗位職責:
1、探索前沿的LLM、MLLM、StableDiffusion等在端側的落地和應用;
2、設計、調試并訓練端側某領域的大模型;
3、負責相關領域的數據收集、清洗、送標、微調、效果評估工作;
4、持續跟蹤行業進展,提升團隊在該領域的技術能力。
任職要求:
1、熟悉Transformers、大模型、Langchain等最新技術,有相關項目經驗優先;
2、熟悉PyTorch、TensorFlow等深度學習框架;
3、良好的團隊協作能力;
4、熟悉業內主流大模型原理,訓練/Fine-tune策略,數據Pipeline等;
5、創新性強,有良好的動手實現能力,對技術有熱情。