更新于 12月19日

大模型部署工程師

4萬-5萬
  • 北京昌平區(qū)
  • 經(jīng)驗不限
  • 碩士
  • 全職
  • 招2人

職位描述

Python
工作職責(zé):
1. 負責(zé)主流大語言模型(如 LLaMA、Mistral系列)及多模態(tài)模型的部署與性能調(diào)優(yōu),確保其在服務(wù)器上高效運行;
2. 設(shè)計并搭建高性能推理服務(wù)系統(tǒng),支持大模型在實際應(yīng)用中的低延遲、高吞吐需求;
3. 負責(zé)開發(fā)自動化部署流程,簡化大規(guī)模模型的上線與版本管理;
4. 監(jiān)控 GPU/CPU 資源使用情況,排查性能瓶頸,并進行合理的調(diào)度與資源分配。
工作要求:
1. 計算機科學(xué)、人工智能、軟件工程等相關(guān)專業(yè)碩士及以上學(xué)歷,具有豐富的實戰(zhàn)經(jīng)驗可酌情放寬;
2. 熟練使用 Python 進行開發(fā),具備良好的代碼規(guī)范與文檔習(xí)慣;
3. 了解 Linux 環(huán)境下的系統(tǒng)開發(fā)與優(yōu)化,熟悉分布式部署流程;
4. 熟練掌握至少一種大模型推理與部署框架,如 vLLM、Ollama、huggingface TGI 等;
5. 具備 GPU 加速技術(shù)經(jīng)驗(CUDA、cuDNN),熟悉混合精度計算與模型壓縮方法;
6. 有大規(guī)模深度學(xué)習(xí)模型部署經(jīng)驗,具備優(yōu)化多卡訓(xùn)練與推理速度的實踐經(jīng)驗。

工作地點

北京市昌平區(qū)中關(guān)村生命科學(xué)園醫(yī)科路9號院3號樓

職位發(fā)布者

劉女士/人事經(jīng)理

三日內(nèi)活躍
立即溝通
公司Logo北京腦科學(xué)與類腦研究所
北京腦科學(xué)與類腦研究所(CIBR)是在科技部的指導(dǎo)下,由北京市人民政府聯(lián)合中國科學(xué)院、軍事科學(xué)院、北京大學(xué)、清華大學(xué)、北京師范大學(xué)、中國醫(yī)學(xué)科學(xué)院、中國中醫(yī)科學(xué)院等8家單位,共同發(fā)起成立的新型研發(fā)機構(gòu)(以下簡稱“北京腦中心”),屬于事業(yè)單位。北京腦所將結(jié)合全國科技創(chuàng)新中心的首都城市戰(zhàn)略定位,圍繞國家重大項目研究方向,承接國家腦計劃,立足北京的工作基礎(chǔ)和優(yōu)勢特色,搭建關(guān)鍵技術(shù)平臺,在腦科學(xué)與類腦研究領(lǐng)域集中開展科技攻關(guān),實現(xiàn)前沿技術(shù)和重大腦科學(xué)研究的突破,成為國際領(lǐng)先的腦科學(xué)研究所。北京腦科學(xué)與類腦研究所于2018年3月22日成立,前期建設(shè)工作全面啟動,誠邀海內(nèi)外優(yōu)秀的行政服務(wù)人員加盟。
公司主頁