職位描述
主要職責(zé):性能分析與優(yōu)化:深入分析和優(yōu)化GPU應(yīng)用程序,識別并消除性能瓶頸,包括內(nèi)存訪問模式、線程調(diào)度和執(zhí)行效率。算法開發(fā):利用CUDA或DirectX等并行計(jì)算框架,開發(fā)和實(shí)現(xiàn)高效的GPU加速算法,提升計(jì)算密集型任務(wù)的處理速度。向團(tuán)隊(duì)提供技術(shù)指導(dǎo)和培訓(xùn),分享GPU編程的實(shí)踐和優(yōu)化技巧。持續(xù)關(guān)注GPU技術(shù)和行業(yè)趨勢,評估并整合新技術(shù)以提升系統(tǒng)性能。任職要求:計(jì)算機(jī)科學(xué)、電子工程或相關(guān)領(lǐng)域的學(xué)士或碩士學(xué)位及以上。至少5年的GPU編程和性能優(yōu)化經(jīng)驗(yàn),具有豐富的CUDA或DirectX開發(fā)背景。精通C/C++編程,具備深入的計(jì)算機(jī)體系結(jié)構(gòu)和并行計(jì)算原理知識。熟練使用GPU性能分析和調(diào)試工具,具有實(shí)際的性能優(yōu)化案例和成果。具備分析和調(diào)整各種AI/HPC工作負(fù)載性能的經(jīng)驗(yàn)。加分項(xiàng):具備高性能計(jì)算(HPC)領(lǐng)域的相關(guān)研究經(jīng)驗(yàn)。對機(jī)器學(xué)習(xí)框架如TensorFlow或PyTorch有深入的GPU優(yōu)化經(jīng)驗(yàn)。使用Orin或Xavier平臺進(jìn)行AI模型部署和優(yōu)化,以及開發(fā)自動駕駛相關(guān)算法的實(shí)戰(zhàn)經(jīng)驗(yàn)。具有NVIDIA GPU和CUDA編程的經(jīng)驗(yàn)。
企業(yè)介紹
文遠(yuǎn)知行WeRide成立于2017年,已經(jīng)在全球7個(gè)國家30個(gè)城市開展自動駕駛研發(fā)、測試及運(yùn)營,是同時(shí)擁有中國、美國、阿聯(lián)酋、新加坡四地自動駕駛牌照的科技企業(yè),在廣州、北京、上海、深圳、無錫、鄭州、南京、武漢、圣何塞、阿布扎比、新加坡、斯圖加特等地設(shè)有辦公室。文遠(yuǎn)知行致力于開發(fā)安全可靠的無人駕駛技術(shù),應(yīng)用場景覆蓋智慧出行、智慧貨運(yùn)和智慧環(huán)衛(wèi),已進(jìn)入自動駕駛商業(yè)化運(yùn)營階段,商業(yè)營收居全球同類企業(yè)之首,形成自動駕駛出租車(Robotaxi)、自動駕駛小巴(Robobus)、自動駕駛貨運(yùn)車(Robovan)、自動駕駛環(huán)衛(wèi)車(Robosweeper)、高階智能駕駛(Advanced Driving Solution)等五大產(chǎn)品矩陣,提供網(wǎng)約車、隨需公交、同城貨運(yùn)、智能環(huán)衛(wèi)、高階智能駕駛解決方案等多種服務(wù)。文遠(yuǎn)知行在技術(shù)研發(fā)、商業(yè)化和企業(yè)管理等方面都擁有豐富的海內(nèi)外實(shí)踐經(jīng)驗(yàn),已與多家全球主機(jī)廠和一級供應(yīng)商達(dá)成戰(zhàn)略合作伙伴關(guān)系,包括雷諾日產(chǎn)三菱聯(lián)盟、宇通集團(tuán)、廣汽集團(tuán)、博世等。