更新于 9月26日

高級(jí)算法工程師(NLP、大模型方向)

2萬(wàn)-3萬(wàn)
  • 成都雙流區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

文本分析信息抽取文本挖掘詞法分析推薦系統(tǒng)PythonC++
職位概要:
深入學(xué)習(xí)招采大數(shù)據(jù)業(yè)務(wù),研究、研發(fā)和應(yīng)用數(shù)據(jù)處理算法,完成數(shù)據(jù)的抽取、清洗、入庫(kù)、建模、應(yīng)用、維護(hù),持續(xù)提升數(shù)據(jù)完整性和準(zhǔn)確性。

崗位職責(zé):
1、深入理解招標(biāo)采購(gòu)業(yè)務(wù)和產(chǎn)品應(yīng)用場(chǎng)景,設(shè)計(jì)基礎(chǔ)數(shù)據(jù)分類(lèi)畫(huà)像,和數(shù)據(jù)關(guān)系圖譜;
2、微調(diào)或私有化訓(xùn)練通用大模型,或結(jié)合自研算法,設(shè)計(jì)數(shù)據(jù)實(shí)驗(yàn)方案,并設(shè)計(jì)數(shù)據(jù)完整性、準(zhǔn)確性驗(yàn)證方法,并保障設(shè)計(jì)方案與過(guò)程結(jié)果的一致性;
3、運(yùn)用大模型結(jié)合自研算法,將各格式文檔(包括但不限于Word、Pdf、Excel、Html)的文字、表格、壓縮文件進(jìn)行解析,對(duì)文檔中關(guān)鍵表格、關(guān)鍵文字段落進(jìn)行識(shí)別和抽??;
4、對(duì)上述完成粗加工的數(shù)據(jù),研究數(shù)據(jù)特征、相似性、關(guān)聯(lián)性、差異性,并定向開(kāi)發(fā)和調(diào)試語(yǔ)義識(shí)別算法和機(jī)器學(xué)習(xí)算法程序,自動(dòng)提取準(zhǔn)確數(shù)據(jù);
5、根據(jù)基礎(chǔ)數(shù)據(jù)關(guān)系,設(shè)計(jì)或重構(gòu)數(shù)據(jù)庫(kù)表結(jié)構(gòu)和數(shù)據(jù)關(guān)系,對(duì)提取字段數(shù)據(jù)進(jìn)行結(jié)構(gòu)化入庫(kù);
6、深入研究數(shù)據(jù)之間的業(yè)務(wù)關(guān)聯(lián)關(guān)系,定向開(kāi)發(fā)和調(diào)試匹配算法,將多個(gè)來(lái)源分別獲得的“項(xiàng)目-招采單位-供應(yīng)商-產(chǎn)品-資質(zhì)要求”組成完整準(zhǔn)確的業(yè)務(wù)關(guān)系鏈數(shù)據(jù);
7、持續(xù)優(yōu)化算法和基礎(chǔ)數(shù)據(jù),并開(kāi)發(fā)數(shù)據(jù)維護(hù)工具(提升基礎(chǔ)數(shù)據(jù)增、刪、改更新效率和穩(wěn)定);
8、積極研究數(shù)據(jù)的應(yīng)用,協(xié)助產(chǎn)品、研發(fā)、測(cè)試完成數(shù)據(jù)到產(chǎn)品的轉(zhuǎn)化,并驗(yàn)收上線(xiàn)數(shù)據(jù)效果,對(duì)數(shù)據(jù)完整性和準(zhǔn)確性負(fù)責(zé);
9、對(duì)數(shù)據(jù)打標(biāo)簽、推薦算法進(jìn)行探索研究,發(fā)現(xiàn)數(shù)據(jù)新的應(yīng)用價(jià)值,并基于數(shù)據(jù)分析層面,為產(chǎn)品提供建議,提升產(chǎn)品價(jià)值;

任職資格:
教育背景:
◆ 本科以上學(xué)歷,計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)相關(guān)專(zhuān)業(yè)。

經(jīng) 驗(yàn):
◆3年以上算法實(shí)際工作經(jīng)驗(yàn)(研究生可2年以上)
◆ 深入研究和測(cè)試過(guò)大模型應(yīng)用(chatGPT、文心一言等),擁有基于場(chǎng)景化需求,對(duì)算法模型微調(diào)、二次訓(xùn)練,或自行開(kāi)發(fā)機(jī)器學(xué)習(xí)算法的實(shí)際經(jīng)驗(yàn);
◆ 深厚的數(shù)據(jù)挖掘、統(tǒng)計(jì)、分析、應(yīng)用理論和實(shí)踐經(jīng)驗(yàn);
◆ 在大模型商業(yè)化、NLP、大數(shù)據(jù)挖掘和處理領(lǐng)域,至少1個(gè)項(xiàng)目承擔(dān)數(shù)據(jù)主導(dǎo)作用項(xiàng)目經(jīng)驗(yàn);
◆ 有招采大數(shù)據(jù)相關(guān)經(jīng)驗(yàn)優(yōu)先。

技能要求:
◆ 精通使用python(同時(shí)熟練java優(yōu)先),具備很強(qiáng)算法實(shí)現(xiàn)能力;
◆ 精通數(shù)據(jù)庫(kù)結(jié)構(gòu)、表結(jié)構(gòu)設(shè)計(jì);
◆ 在文本分類(lèi)、關(guān)系抽取、自動(dòng)摘要,文本生成、圖譜構(gòu)建、關(guān)系聚類(lèi)、知識(shí)推算上有深入研究;
◆ 經(jīng)常學(xué)習(xí)和研究最新算法論文及成果的習(xí)慣,并能將匹配的算法成果場(chǎng)景化改造用于實(shí)際工作,幫助產(chǎn)
品獲得持續(xù)的競(jìng)爭(zhēng)力;

態(tài) 度:
◆性格開(kāi)朗,對(duì)工作充滿(mǎn)激情;
◆有強(qiáng)烈的責(zé)任心,工作主動(dòng)積極,認(rèn)可公司發(fā)展目標(biāo)規(guī)劃,愿景,及公司價(jià)值觀,愿意與公司共同發(fā)展;


工作地點(diǎn)

超圖成都大廈1棟 202室

職位發(fā)布者

蘭女士/人資經(jīng)理

立即溝通
公司Logo四川業(yè)億辰科技有限公司
四川業(yè)億辰科技有限公司專(zhuān)注于業(yè)務(wù)咨詢(xún)、ERP實(shí)施(SAP)、電子商務(wù)、移動(dòng)政務(wù)、移動(dòng)電商的專(zhuān)業(yè)軟件服務(wù)提供商。公司致力于軟件系統(tǒng)的開(kāi)發(fā)和應(yīng)用,將高端咨詢(xún)和互聯(lián)網(wǎng)+大數(shù)據(jù)進(jìn)行結(jié)合,以?xún)?yōu)秀的創(chuàng)新思維和領(lǐng)先的技術(shù)能力為客戶(hù)提供端到端的高端整體解決方案,幫助傳統(tǒng)企業(yè)向互聯(lián)網(wǎng)領(lǐng)域轉(zhuǎn)型升級(jí),實(shí)現(xiàn)傳統(tǒng)業(yè)務(wù)向互聯(lián)網(wǎng)互聯(lián)網(wǎng)的快速接入,互通,打造一體化的全渠道營(yíng)銷(xiāo)供應(yīng)鏈體系。公司產(chǎn)品兼顧傳統(tǒng)企業(yè)信息化市場(chǎng)和互聯(lián)網(wǎng)技術(shù)市場(chǎng),主要產(chǎn)品方向?yàn)閮煞矫?,一方面,通過(guò)與企業(yè)信息化服務(wù)商合作,提供專(zhuān)業(yè)的電子商務(wù)、供應(yīng)鏈、大數(shù)據(jù)等技術(shù)產(chǎn)品,補(bǔ)充企業(yè)信息化在互聯(lián)網(wǎng)方面的弱項(xiàng)。另外一方面,以互聯(lián)網(wǎng)為平臺(tái),打造輕量級(jí)的供應(yīng)鏈+互聯(lián)網(wǎng)的產(chǎn)品,實(shí)現(xiàn)網(wǎng)絡(luò)營(yíng)銷(xiāo)自主推廣。公司集結(jié)了一批年輕的、有學(xué)識(shí)的、具有實(shí)干精神的三高(高素質(zhì)、高標(biāo)準(zhǔn)、高學(xué)歷)IT人才,以及一批業(yè)務(wù)知識(shí)豐富、項(xiàng)目管理能力強(qiáng)、市場(chǎng)反應(yīng)速度快的行業(yè)技術(shù)專(zhuān)家、項(xiàng)目管理干部及高層次商務(wù)人才。核心團(tuán)隊(duì)成員經(jīng)驗(yàn)豐富,大都擁有10年以上從事企業(yè)信息化咨詢(xún)和軟件行業(yè)的工作經(jīng)歷,同時(shí)擁有國(guó)際、國(guó)內(nèi)知名公司工作背景。
公司主頁(yè)