崗位職責:
1、 參數(shù)數(shù)學模型數(shù)據(jù)清洗方面的工作,包括收集、整理與清洗等內(nèi)容,優(yōu)化數(shù)據(jù)質(zhì)量
2、 參數(shù)數(shù)學模型數(shù)據(jù)合成方面的工作,包括預訓練數(shù)據(jù)、后訓練數(shù)據(jù)等內(nèi)容
3、 參與數(shù)學模型預訓練驗證相關工作,對數(shù)據(jù)配比、數(shù)據(jù)調(diào)度等方向進行優(yōu)化
4、 參與數(shù)學模型后訓練對齊相關工作,包括指令微調(diào)、強化學習方面的內(nèi)容
任職要求:
1、熟悉大模型、深度學習、機器學習等相關領域的基本概念和技術。
2、具備較強的編程能力,熟悉Python,對TensorFlow、PyTorch等主流深度學習框架有一定的使用經(jīng)驗。
3、掌握業(yè)界領先大模型的基本原理和訓練以及微調(diào)方法,如LLaMA、Qwen、deepseek等模型的訓練過程及LoRA微調(diào)等。
4、對大模型的數(shù)據(jù)合成、數(shù)據(jù)處理、數(shù)據(jù)質(zhì)量評估等方面具有相應的研究經(jīng)驗。