崗位職責:
1.負責大語言模型(如Deepseek、Qwen、GLM等)的微調、訓練及性能優(yōu)化,提升模型在特定場景下的表現(xiàn)。
2.構建行業(yè)垂直領域的專用模型與知識庫系統(tǒng),推動業(yè)務場景的智能化解決方案落地。
3.協(xié)同研發(fā)團隊完成智能應用產(chǎn)品的設計、開發(fā)與部署,包括但不限于對話系統(tǒng)、知識推理等方向。
4.跟蹤前沿技術進展,探索大語言模型與行業(yè)需求結合的技術創(chuàng)新點。
任職要求:
1.本科及以上學歷,計算機科學、人工智能、數(shù)學或相關專業(yè),2年以上人工智能開發(fā)經(jīng)驗者優(yōu)先。
2.熟練掌握PyTorch/TensorFlow等深度學習框架,熟悉Transformer架構及NLP領域核心技術(如預訓練、微調、Prompt工程)。
3.具備大語言模型實戰(zhàn)經(jīng)驗,包括分布式訓練、模型壓縮、推理加速等技術,熟悉LangChain、Hugging Face等工具鏈。
4.扎實的編程能力,精通Python,熟悉Linux開發(fā)環(huán)境及CUDA加速,有工程落地經(jīng)驗者優(yōu)先。
5.邏輯清晰,具備跨團隊協(xié)作能力,對AI技術商業(yè)化有強烈興趣。
6.加分項:擁有Deepseek、Qwen、LAMM、GLM等模型的實際項目經(jīng)驗或開源貢獻。