崗位職責
1. 負責智能超聲診療模型在多種不同硬件平臺的極致性能優化,結合編譯優化、并行計算優化、圖融合、高效 CUDA 算子開發實現行業領先的超聲設備端推理性能。
2. 針對特定NPU硬件計算平臺,基于對硬件體系結構的深入理解,實現對硬件的高效利用。
3. 針對Pytorch/CUDA相關GPU計算任務,進行算子和系統優化,提升訓練/推理效率。
崗位要求
1. 工作3年以上,計算機/數學/物理/電子工程/自動控制專業碩士及以上學歷。
2. 優秀的代碼能力,熟練掌握C/C++或Python,有 CUDA 開發經驗,熟悉TVM/TensorRT/Triton/Cutlass等推理框架優先。
3. 熟悉計算機體系結構,對GPU、NPU等有比較深刻的理解。
4. 熟悉CNN/Transformers/DETR等主流模型原理。5. 良好的團隊協作能力;創新性強,有良好的動手實現能力,對技術有熱情。