更新于 1月1日

自然語(yǔ)言處理nlp算法工程師

面議
  • 蘇州吳中區(qū)
  • 1-3年
  • 碩士
  • 全職
  • 招2人

職位描述

文本分析文本挖掘信息抽取篇章分析PyTorchTensorFlowBERTword2vec機(jī)器閱讀理解Python
崗位職責(zé)
1.負(fù)責(zé)標(biāo)準(zhǔn)文檔的文本糾錯(cuò)、結(jié)構(gòu)識(shí)別、長(zhǎng)文本合規(guī)性審查;
2.應(yīng)用NLP技術(shù)處理海量非結(jié)構(gòu)化數(shù)據(jù)處理,完成知識(shí)抽取、文本分類(lèi)、文本挖掘等;
3.對(duì)大語(yǔ)言模型進(jìn)行微調(diào)、探索AIAgent應(yīng)用于出版領(lǐng)域方案。

任職要求:
1.三年以上算法經(jīng)驗(yàn),計(jì)算機(jī)/數(shù)學(xué)相關(guān)專(zhuān)業(yè),碩士及以上學(xué)歷;
2.對(duì)NLP算法,分詞,實(shí)體識(shí)別,信息抽取,句法分析等有深入的理解和應(yīng)用經(jīng)驗(yàn);
3.熟悉N-gram、Seq2Seq、transformer、BERT、GPT等模型,對(duì)BERT的改進(jìn)算法MacBERT、Soft-Masked-BERT等有一定了解,熟練使用TensorFlow/PyTorch等深度學(xué)習(xí)框架;
4.較強(qiáng)的工程實(shí)踐能力,熟悉Linux開(kāi)發(fā)環(huán)境,熟練掌握python/java/c++等高級(jí)語(yǔ)言一種或多種;
5.具備較強(qiáng)的邏輯思維能力和鉆研精神,強(qiáng)烈的責(zé)任心和團(tuán)隊(duì)精神。
6.有深入的中文文本糾錯(cuò)經(jīng)驗(yàn)者優(yōu)先。

工作地點(diǎn)

江蘇省蘇州市吳中區(qū)旺墩路269號(hào)(時(shí)代廣場(chǎng)地鐵站出入口步行420米)3102,3202兩層樓

職位發(fā)布者

黃先生/HR

立即溝通
公司Logo中國(guó)科技出版?zhèn)髅焦煞萦邢薰?/a>
科學(xué)出版社由中國(guó)科學(xué)院編譯局與1930年創(chuàng)建的龍門(mén)聯(lián)合書(shū)局于1954年8月合并成立;2007年4月轉(zhuǎn)制改企為科學(xué)出版社有限責(zé)任公司;2011年完成股份制改造,整體變更設(shè)立為中國(guó)科技出版?zhèn)髅焦煞萦邢薰荆ㄒ韵潞?jiǎn)稱(chēng)“公司”)。2017年1月18日,公司在上海證券交易所主板掛牌上市(股票簡(jiǎn)稱(chēng):中國(guó)科傳,股票代碼:601858),成為中央出版集團(tuán)上市第一股。60多年來(lái),科學(xué)出版社依托中國(guó)科學(xué)院,秉承多年來(lái)形成的“高層次、高水平、高質(zhì)量”和“嚴(yán)肅、嚴(yán)密、嚴(yán)格”的優(yōu)良傳統(tǒng)與作風(fēng),堅(jiān)持為科技創(chuàng)新服務(wù)、為科學(xué)傳播服務(wù)、為廣大作者和讀者服務(wù)的宗旨,面向世界科技前沿,面向國(guó)家重大需求,面向國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng),充分挖掘國(guó)內(nèi)外優(yōu)良出版資源,重視重大出版工程建設(shè),形成了以科學(xué)(S)、技術(shù)(T)、醫(yī)學(xué)(M)、教育(E)、人文社科(H)為主要出版領(lǐng)域的業(yè)務(wù)架構(gòu)。目前科學(xué)出版社每年出版新書(shū)4000多種,期刊300多種,擁有《中國(guó)科學(xué)》雜志社有限責(zé)任公司、北京龍騰八方文化有限責(zé)任公司、北京中科進(jìn)出口有限責(zé)任公司等23個(gè)下屬分、子公司;在成都、武漢、南京、西安、石家莊、沈陽(yáng)、廣州、蘇州,以及美國(guó)、日本、法國(guó)均設(shè)立了分支機(jī)構(gòu),建立了完善的全球出版、發(fā)行網(wǎng)絡(luò),是國(guó)內(nèi)最大的綜合性科技出版機(jī)構(gòu)。公司始終堅(jiān)持“專(zhuān)業(yè)化、精品化、系列化”的出版理念,高度重視重大重點(diǎn)出版工程建設(shè),入選國(guó)家出版基金項(xiàng)目42項(xiàng);入選國(guó)家科學(xué)技術(shù)學(xué)術(shù)著作出版基金項(xiàng)目占總數(shù)的一半以上;入選“十二五”國(guó)家圖書(shū)重點(diǎn)出版規(guī)劃項(xiàng)目90個(gè)、“十三五”國(guó)家重點(diǎn)圖書(shū)出版規(guī)劃項(xiàng)目70個(gè);入選“三個(gè)一百”原創(chuàng)出版工程15種;等等。公司入選各類(lèi)出版基金和國(guó)家級(jí)規(guī)劃項(xiàng)目的數(shù)量均在全國(guó)出版社中位列前茅。公司還擁有一個(gè)高水平、高質(zhì)量、多品種的期刊方陣,2019年,公司年出版期刊347種,其中英文期刊131種,被SCI(《科學(xué)引文索引(Science Citation Index)》)收錄53種、被EI(《工程索引(Engineering Index)》)收錄50種,有14種位于國(guó)際同類(lèi)期刊Q1區(qū)。其中,《中國(guó)科學(xué)》、《科學(xué)通報(bào)》系列(簡(jiǎn)稱(chēng)“兩刊”)中英文17種期刊,是在中國(guó)科學(xué)院學(xué)部平臺(tái)上運(yùn)作和管理的高水平學(xué)術(shù)期刊,是我國(guó)自然科學(xué)期刊中的知名品牌,曾獲得第一、二、三屆國(guó)家期刊獎(jiǎng),第二、三、四屆中國(guó)出版政府獎(jiǎng)期刊獎(jiǎng)等榮譽(yù)。高端綜述性學(xué)術(shù)期刊《國(guó)家科學(xué)評(píng)論》(National Science Review)最新影響因子(2022)達(dá)17.275,在全球多學(xué)科綜合類(lèi)期刊中排名第三。公司積極響應(yīng)中央文化“走出去”戰(zhàn)略部署,與20多個(gè)國(guó)家和地區(qū)的200多家出版公司建立了長(zhǎng)期的良好合作關(guān)系,并在設(shè)立美國(guó)、日本全資子公司的基礎(chǔ)上,于2019年完成了對(duì)法國(guó)EDP Sciences 100%股權(quán)的收購(gòu),完善了全球業(yè)務(wù)布局。近年來(lái),每年輸出圖書(shū)版權(quán)均位居科技出版社之首,先后榮獲全國(guó)版權(quán)輸出先進(jìn)單位、2008中國(guó)版權(quán)最具影響力企業(yè)、2015年全國(guó)版權(quán)示范單位等稱(chēng)號(hào),并且連續(xù)多年被商務(wù)部、宣傳部、財(cái)政部、文化部、廣電總局等五部委聯(lián)合評(píng)為“國(guó)家文化出口重點(diǎn)企業(yè)”。在出版業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,公司大膽創(chuàng)新,明確了從傳統(tǒng)出版向知識(shí)服務(wù)轉(zhuǎn)型發(fā)展的戰(zhàn)略路徑,確立了專(zhuān)業(yè)學(xué)科知識(shí)庫(kù)、醫(yī)療健康大數(shù)據(jù)、數(shù)字教育云服務(wù)等業(yè)務(wù)創(chuàng)新轉(zhuǎn)型的方向,并先后推出了“科學(xué)文庫(kù)”、“CourseGate教育云平臺(tái)”、“SCIPMED中科醫(yī)學(xué)資源庫(kù)”、“SciEngine中國(guó)科技期刊國(guó)際傳播平臺(tái)”等多款知識(shí)服務(wù)產(chǎn)品。其中,“SciEngine平臺(tái)”入選“全國(guó)報(bào)刊媒體融合創(chuàng)新30佳”榜單,“科學(xué)文庫(kù)”榮獲“第二屆中國(guó)出版政府獎(jiǎng)音像電子網(wǎng)絡(luò)獎(jiǎng)”。 2015年,國(guó)家新聞出版廣電總局還授予公司“專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式試點(diǎn)單位”稱(chēng)號(hào)。
公司主頁(yè)