職位描述
職位描述1. 負(fù)責(zé) SoC AI 推理引擎軟件的需求分析、架構(gòu)設(shè)計、功能開發(fā)等工作。2. 負(fù)責(zé) SoC 上 AI 模型的適配,推理工作流原型開發(fā)及性能優(yōu)化等工作。3. 負(fù)責(zé) Soc 上LLM模型的端到端部署,包括但不限于推理引擎的開發(fā)、模型優(yōu)化和壓縮、模型部署的端到端流程設(shè)計等。職位要求1.熟悉C/C++,熟悉算法與數(shù)據(jù)結(jié)構(gòu),熟悉Python;2.具有深度學(xué)習(xí)推理加速和優(yōu)化的經(jīng)驗,熟悉常見的加速技術(shù),如剪枝、量化、分布式推理等,并能夠根據(jù)不同場景和硬件平臺進(jìn)行針對性的優(yōu)化。3. 熟悉常見的模型量化技術(shù),并能夠進(jìn)行模型的量化優(yōu)化。4. 熟悉mindspore/tensorflow/pytorch訓(xùn)練框架,有mindspore-lite/TensorRT/OnnxRuntime/TFServing等深度學(xué)習(xí)推理框架的實際使用經(jīng)驗;5. 熟悉LLM相關(guān)的算法技術(shù)以及推理加速方法。6. 熟悉NPU/GPU/CPU異構(gòu)加速方法7. 具備較強的團(tuán)隊合作和溝通能力,能夠與團(tuán)隊成員、業(yè)務(wù)部門緊密協(xié)作,完成項目交付和技術(shù)創(chuàng)新。
企業(yè)介紹
上海華為技術(shù)有限公司于2001年1月16日在自貿(mào)區(qū)市場監(jiān)督管理局登記成立。法定代表人孫亞芳,公司經(jīng)營范圍包括程控交換機、傳輸設(shè)備、數(shù)據(jù)通信設(shè)備、寬帶多媒體設(shè)備等。