一、主要職責(zé)
1.為Scilit數(shù)據(jù)庫進行數(shù)據(jù)倉庫的設(shè)計、開發(fā)、維護工作,推動數(shù)據(jù)工程技術(shù)棧革新,整合MDPI公司級數(shù)倉體系,構(gòu)建豐富穩(wěn)定的數(shù)據(jù)資產(chǎn),推動Scilit的數(shù)據(jù)產(chǎn)品化;
2.協(xié)同相關(guān)方,將產(chǎn)品/數(shù)據(jù)分析/算法需求轉(zhuǎn)化為數(shù)據(jù)工程需求,構(gòu)建數(shù)據(jù)Pipeline和ETL任務(wù),增進相關(guān)合作方的數(shù)據(jù)使用便利;
3.建立和提高數(shù)據(jù)模型的準(zhǔn)確性、易用性、靈活性、可擴展性,提升查詢效率,為可視化報表開發(fā)、數(shù)據(jù)分析、工程項目和算法開發(fā)等下游數(shù)據(jù)應(yīng)用提供良好的數(shù)據(jù)條件;
4.承擔(dān)大規(guī)模復(fù)雜指標(biāo)的快速計算和維護任務(wù),根據(jù)業(yè)務(wù)和數(shù)據(jù)分析需求,開發(fā)、倉儲和維護分析表(寬表),優(yōu)化其查詢效率;
5.收集、清洗、整理Scilit數(shù)據(jù),提升Scilit數(shù)據(jù)質(zhì)量、數(shù)據(jù)可用性和數(shù)據(jù)效率,使得數(shù)據(jù)準(zhǔn)確、一致、完整、有效、及時。搭建數(shù)據(jù)質(zhì)量校驗、報警、自動整理機制;
6.建立數(shù)據(jù)字典,將常用維度和指標(biāo)的技術(shù)口徑文檔化。
二、職位要求
1.熟練運用書面和口語英語交流數(shù)倉技術(shù),可以勝任同國際化團隊協(xié)同工作;
2.計算機、信息技術(shù)、信息管理、數(shù)據(jù)管理、數(shù)據(jù)科學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;
3.熟練使用數(shù)據(jù)工程工具,例如:
? SQL類工具,如MySQl和PostgreSQL等
? Python數(shù)據(jù)類工具:如pandas, polars, DuckDB, PyArrow, Great Expectation等
? Data Lake相關(guān)工具:Delta Like, Parquet, Amazon S3, Apache Iceberg等
? Airflow等數(shù)據(jù)調(diào)度工具
4.具備較好的維度建模方法論,獨立負責(zé)過數(shù)倉架構(gòu)設(shè)計和優(yōu)化,熟練ETL、數(shù)倉分層、性能調(diào)優(yōu),了解MySQL數(shù)據(jù)庫模型和數(shù)據(jù)結(jié)構(gòu);
5.熟悉一門或多門面向?qū)ο蟮木幊陶Z言:Python/Java/Scala/C++;
6.熟悉從數(shù)據(jù)生產(chǎn)到數(shù)據(jù)消費的全鏈路,具有將技術(shù)和優(yōu)秀的業(yè)務(wù)理解相結(jié)合的能力,發(fā)掘機會、解決問題;
7.兩年以上對口行業(yè)經(jīng)驗,優(yōu)秀者工作年限可適當(dāng)放寬;
8.邏輯清晰嚴謹,對數(shù)據(jù)敏感,跨團隊協(xié)作能力、溝通能力強。
加分項:
? 熟悉以下技術(shù):
* PHP Symfony
* 元數(shù)據(jù)管理,如DataHub
* 圖數(shù)據(jù)庫和圖數(shù)據(jù)分析
* 其它:Apache Solr, Shell, Git
* Streamlit
* Docker
? 有學(xué)術(shù)出版、文獻計量學(xué)和科學(xué)計量學(xué)、作者消歧等相關(guān)知識、技能和經(jīng)驗;
? 了解數(shù)據(jù)分析/機器學(xué)習(xí)/NLP,或有將數(shù)據(jù)分析/算法和業(yè)務(wù)洞察能力結(jié)合的經(jīng)驗。
三、薪酬福利
1. 薪酬待遇:19K-35K;
2. 基礎(chǔ)福利:六險一金,帶薪年假,年度體檢,節(jié)日福利,活動經(jīng)費,豐富茶歇,營養(yǎng)晚餐等;
3. 進階福利:父母福利,子女福利,團隊獎勵,培訓(xùn)津貼,崗位津貼;
4. 職業(yè)發(fā)展:導(dǎo)師培養(yǎng),技能培訓(xùn),管理培訓(xùn)。