職位描述:
1、負(fù)責(zé)基于華為昇騰 AI 芯片(如 Atlas 系列)的模型訓(xùn)練與推理優(yōu)化
2、主導(dǎo) DeepSeek 等大模型的本地化部署方案設(shè)計(jì)與性能調(diào)優(yōu)
3、開(kāi)發(fā) RAG(檢索增強(qiáng)生成)系統(tǒng),實(shí)現(xiàn)知識(shí)庫(kù)與大模型的高效融合
4、參與端到端的 AI 項(xiàng)目落地,覆蓋數(shù)據(jù)處理、模型訓(xùn)練、部署全流程
5、優(yōu)化模型在昇騰硬件上的推理速度與資源利用率
任職要求:
技術(shù)棧要求
1、精通 TensorFlow/PyTorch 等深度學(xué)習(xí)框架,熟悉模型訓(xùn)練全流程
2、熟悉昇騰 CANN 工具鏈(AIPP/ATC/AICPU)及模型轉(zhuǎn)換優(yōu)化
3、掌握 RAG 技術(shù)原理,熟悉向量數(shù)據(jù)庫(kù)(如 Milvus/FAISS)與檢索引擎開(kāi)發(fā)
4、熟悉 Docker/Kubernetes 容器化部署,具備分布式系統(tǒng)經(jīng)驗(yàn)優(yōu)先
實(shí)戰(zhàn)能力要求
1、主導(dǎo)過(guò)至少 1 個(gè)大模型訓(xùn)練項(xiàng)目(如 LLM、多模態(tài)模型)
2、有模型本地化部署(如 GPU / 昇騰 / NPU)的實(shí)際優(yōu)化案例
3、開(kāi)發(fā)過(guò) RAG 系統(tǒng)并成功落地業(yè)務(wù)場(chǎng)景
4、熟悉模型量化、剪枝、蒸餾等優(yōu)化技術(shù)
軟技能
1、具備復(fù)雜問(wèn)題拆解與快速迭代能力
2、良好的團(tuán)隊(duì)協(xié)作能力和技術(shù)文檔撰寫(xiě)能力
行業(yè)經(jīng)驗(yàn)
1、具備金融 / 醫(yī)療 / 電商等領(lǐng)域的 AI 項(xiàng)目落地經(jīng)驗(yàn)優(yōu)先
2、熟悉華為昇騰生態(tài)(如 ModelArts、MindSpore)者優(yōu)先
加分項(xiàng)
1、發(fā)表過(guò)頂會(huì)論文(如 NeurIPS/ICML)或開(kāi)源過(guò)高質(zhì)量項(xiàng)目
2、持有華為認(rèn)證(如 HCIE-AI)或 TensorFlow/PyTorch 認(rèn)證
3、有 AI 芯片底層開(kāi)發(fā)經(jīng)驗(yàn)(如 CUDA / 昇騰 AscendCL 編程)
北京
北京 - 朝陽(yáng)
北京 - 大興
北京中匯恒業(yè)科技有限公司北京 - 東城
北京 - 西城
北京 - 房山
北京機(jī)械設(shè)備研究所