職位描述
崗位職責:
1、負責端側模型推理框架開發,包括模型壓縮、優化技術,在端側的接入、適配、算子開發工作,使之符合業務要求,提高性能收益;
2、負責探索和落地 AI 模型工程部署前沿技術,包括但不限于稀疏計算、編譯優化。
任職要求:
1、具備扎實的計算機科學功底和編程能力,了解常見并行計算算法,具有良好的編程習慣;
2、熟悉transformers、stable diffusion等主流模型原理;
3、良好的團隊協作能力;
4、創新性強,有良好的動手實現能力,對技術有熱情;
5、加分項:了解模型剪枝、量化等優化方法原理,具備相關模型優化經驗。