崗位職責(zé)
1.持續(xù)跟進(jìn)視覺預(yù)訓(xùn)練表征模型的研究進(jìn)展,利用開源數(shù)據(jù)集,結(jié)合道路交通場景,從事視頻內(nèi)容理解前沿技術(shù)的探索與研發(fā);
2.設(shè)計、實現(xiàn)Object-Centric體表征視頻預(yù)訓(xùn)練模型,開展與Patch-based模型對比研究;
3.研究不同抽象層級的文本表征((側(cè)重于關(guān)系和狀態(tài))對視覺表征效果的影響,并探索改進(jìn)方法;
4.實現(xiàn)和評估關(guān)系和狀態(tài)“增強”對齊下的文本視覺表征,進(jìn)而研究其對T2V生成效果影響;
崗位要求
1. 計算機科學(xué)、應(yīng)用數(shù)學(xué)等相關(guān)專業(yè),熟悉計算機圖形學(xué),碩士及以上學(xué)歷;
2. 在NLP、CV(偏CV)領(lǐng)域有扎實的理論研究基礎(chǔ),熟悉圖像視頻理解模型與生成算法;
3. 較強的工程實現(xiàn)能力:熟練掌握Python,熟悉Linux開發(fā)環(huán)境,精通深度學(xué)習(xí)框架TensorFlow或Pytorch,了解分布式訓(xùn)練框架并有一定的多機多卡訓(xùn)練經(jīng)驗;
4.有高質(zhì)量論文發(fā)表者優(yōu)先;有高質(zhì)量Github項目經(jīng)驗者優(yōu)先;
5.具備極強的學(xué)習(xí)能力和學(xué)術(shù)追求,良好的團(tuán)隊溝通合作能力。