葛藝瀟:從華科測控到港中文MMLab
在將門-TechBeat人工智能社區(qū)上線一周年之際,我們從104位講者中評選出Top30進(jìn)入「2021年度TechBeat紅人榜」。同時我們也潛心策劃了AI工作者人物專訪欄目「AI紅人薈」,第一期:專訪圖森未來首席科學(xué)家王乃巖已經(jīng)新鮮出爐啦,點(diǎn)擊回顧~
本次為大家?guī)淼氖恰?strong>香港中文大學(xué)在讀博士·葛藝瀟的故事。
作者 | 何伊靜
2013年,葛藝瀟考入華中科技大學(xué)自動化學(xué)院測控技術(shù)與儀器專業(yè)。
2017年,她去往被稱為“計算機(jī)視覺界黃埔軍?!钡?strong>香港中文大學(xué)多媒體實(shí)驗(yàn)室(MMLab)深造,目前主要研究方向是計算機(jī)視覺中的表征學(xué)習(xí),包括無監(jiān)督學(xué)習(xí)、解耦學(xué)習(xí)、領(lǐng)域自適應(yīng)學(xué)習(xí)等,及其在圖像檢索、圖像生成上的應(yīng)用。
測控技術(shù)和計算機(jī)視覺,兩個不同的領(lǐng)域在葛藝瀟身上有了奇妙的交錯,從人工智能小白到在NeurIPS、ICLR、ECCV、CVPR等計算機(jī)頂級會議中發(fā)表多篇論文,葛藝瀟在這個行業(yè)里走得愈發(fā)從容。
01 編程
“在不斷的實(shí)踐中收獲了一種成就感,我重拾了對編程的自信和興趣?!?/p>
剛高考完的葛藝瀟一定想不到三年后自己的選擇,18歲的她只想“逃離”計算機(jī)。由于信息類競賽的好名次有助于升學(xué),葛藝瀟從小學(xué)起就開始接觸編程,但是這個曾取得過江蘇省前十好成績的小女孩,其實(shí)很久都無法領(lǐng)會編程的奧秘——她所能看到的只是一道道算法題,根據(jù)之前的練習(xí)把它們做出來是必須完成的任務(wù)。
到了初中,課內(nèi)的學(xué)習(xí)壓力加大,藝瀟發(fā)現(xiàn)自己越來越難以專注在編程上,編程成績也并不理想。壓力引發(fā)抵觸,等到高中,她便徹底放下了編程的學(xué)習(xí),在選擇大學(xué)專業(yè)時,首先排除的也是計算機(jī)。
后來,葛藝瀟來到華科大測控技術(shù)與儀器專業(yè),盡管刻意與計算機(jī)科學(xué)保持了距離,她還是遇上了兩年多沒見的“老朋友”。在該專業(yè)大一下的課程安排中有一門C語言,除學(xué)習(xí)基本語法外,學(xué)生們還需要在大一升大二的暑假獨(dú)立完成一個程序設(shè)計。這門課的掛科率比較高,“它相當(dāng)于課上教了你1+1=2,作業(yè)卻是讓你算一個特別復(fù)雜的微分方程式”,但有編程基礎(chǔ)的她并沒有感到太大困擾。

在葛藝瀟的印象中,當(dāng)時的成品雖然簡陋,程序?qū)崿F(xiàn)的功能也不復(fù)雜,僅僅是“紅燈停、綠燈行”的路況模擬,但看到8000行左右代碼跑通的那一刻,她在編程這件事上感受到了前所未有的成就感?!叭擞蟹N常態(tài)就是,什么東西你學(xué)得好就容易感興趣,然后越學(xué)越好”,藝瀟心中有些念頭開始萌動。
大二時,葛藝瀟通過選拔,進(jìn)入了華科聯(lián)創(chuàng)團(tuán)隊。創(chuàng)立于2000年的聯(lián)創(chuàng)團(tuán)隊是一個以技術(shù)為驅(qū)動的學(xué)生組織,集結(jié)了眾多對編程感興趣并且很有創(chuàng)造力的人才。當(dāng)時,人工智能還不是潮流,聯(lián)創(chuàng)團(tuán)隊主要專注于軟件開發(fā)。葛藝瀟所在的是一個主攻安卓開發(fā)的項(xiàng)目組,通過自學(xué)以及向團(tuán)隊里計算機(jī)、軟件學(xué)院的學(xué)長學(xué)姐請教,她逐漸也能獨(dú)立完成一些App的開發(fā)。

那些小時候看起來枯燥蒼白的代碼終于連通了觸手可及的日常,變得無比鮮活,在聯(lián)創(chuàng)的日子讓藝瀟愈發(fā)體會到編程的美妙?!白隽撕芏嗍虑椋蛟S跟我現(xiàn)在做的方向毫無關(guān)系,但我就是在不斷的實(shí)踐中收獲了一種成就感……在這個過程中,我重拾了對編程的自信和興趣?!?/p>
轉(zhuǎn)變已經(jīng)可見端倪。伴隨年級增長,雖然在本專業(yè)成績優(yōu)異,葛藝瀟覺得自己對硬件相關(guān)學(xué)科的興趣還是“差點(diǎn)意思”。臨近大三結(jié)束,葛藝瀟在考慮碩士或者PhD專業(yè)時,盡管沒有想到是計算機(jī)視覺,但偏計算機(jī)方向是可以肯定的。
02 橄欖枝
“如果不能進(jìn)MMLab,那么港中文也就不在升學(xué)考慮之列了。"
大三暑假,本計劃在內(nèi)地保研的葛藝瀟參加了港中大工程學(xué)院組織的HK PhD Fellowship Summer Workshop,在這里,她意外地被王曉剛老師的報告內(nèi)容吸引了,“王老師那時主要展示了人群計數(shù),比如一張照片里有非常密集的人群,計算機(jī)可以快速通過視覺理解的方式精準(zhǔn)獲取人員數(shù)量和人群密度分布,并跟蹤、預(yù)測人群軌跡。王老師也展示了人員重識別的應(yīng)用,這后來也是我的研究方向之一”。
2016年,計算機(jī)視覺乃至人工智能領(lǐng)域都還不像現(xiàn)在這樣家喻戶曉,有的同學(xué)甚至還會開玩笑地稱計算機(jī)視覺是“做相機(jī)、做美圖秀秀”。一場報告能帶來的理解總歸還是淺顯,況且她的本科專業(yè)并不對口,但葛藝瀟抱著一種純粹的“有意思而且有應(yīng)用前景”的念頭,目光開始在MMLab上鎖定。

于是,在Summer Workshop正式的面試前,藝瀟通過郵件聯(lián)系,獲得了一次與王曉剛老師單獨(dú)交流的機(jī)會。那天,她走進(jìn)辦公室,看見王曉剛老師坐在桌后。辦公桌上放著文件材料,還有一罐打開的可樂,上面爬著螞蟻。她坐下,看著老師卻不知道該說些什么。老師翻了翻她的簡歷,問了些問題,最后說的是“有沒有考慮別的老師?可以再去聊一聊”。
模糊的態(tài)度不免讓藝瀟有些失落,但在和其他老師交流之后,她還是對王曉剛老師的研究方向最感興趣。學(xué)員們在統(tǒng)一面試前還需要填寫志愿,藝瀟便毅然決然只填了曉剛老師。如果不能進(jìn)MMLab,那么港中文也就不在升學(xué)考慮之列了。
面試當(dāng)天具體的問答早已忘卻,藝瀟只記得當(dāng)她正準(zhǔn)備從面試房間出去,作為面試官之一的王曉剛老師卻又叫住了她,就在門口,向她提議要不要先到實(shí)驗(yàn)室做一年研究助理,也就是先gap一年,再正式讀博士。她愣了一會兒,喜悅之余,疑問也在腦海中一個個炸開:身邊選擇gap的同學(xué)很少,大部分都是直接升學(xué),這樣真的好嗎?當(dāng)一年研究助理后,我真的能順利轉(zhuǎn)為PhD嗎?會不會有風(fēng)險……
藝瀟沒有當(dāng)即答復(fù),回家后,經(jīng)過和王曉剛老師多個來回的郵件確認(rèn),她終于下定了決心。

“我當(dāng)時就是小白,如果一上來就讀PhD,對我來說可能壓力很大,也很難完成研究任務(wù)。”葛藝瀟很感謝實(shí)驗(yàn)室所給予的這一年緩沖期,“這一年的時間,讓我對計算機(jī)視覺有了初步了解,讓我沒有一口氣吃成個胖子的感覺?!?/p>
在訪談過程中,葛藝瀟反復(fù)提到王曉剛老師的知遇之恩,她也很好奇,當(dāng)年自己到底是哪里打動了王老師,“我也不確定,但我感覺王老師會喜歡勇于表達(dá)自己,很清楚地知道想要什么、不想要什么并且表現(xiàn)出一種自信狀態(tài)的人?!钡谝淮谓涣鞯臅r候,由于是第一次“套瓷”,葛藝瀟可能確實(shí)有些放不開,但在正式面試時放手一搏,狀態(tài)反而好了許多。

03 模仿
“創(chuàng)造力始于模仿”
半只腳踏進(jìn)MMLab,藝瀟很快就感受到了意料之中的不適應(yīng)。
在這個未曾接觸的領(lǐng)域里,來自測控專業(yè)的葛藝瀟有太多背景知識亟需補(bǔ)充。李鴻升老師是另一位對葛藝瀟來說非常重要的老師,正是他為剛剛踏入計算機(jī)視覺領(lǐng)域的藝瀟明確了大方向——看哪些論文,跑哪些代碼,李老師為她遞上了一些可以抓住的繩索,但抓著繩索攀行也并不輕松。
這是葛藝瀟第一次接觸純英文論文,除了一個套著一個的基礎(chǔ)知識盲區(qū),對英文句法本身的理解能力不足也成為了不小的障礙,“明明每個單詞都認(rèn)識,卻不知道整句話表達(dá)的意思”。剛開始時,她甚至需要用一周時間才能完全讀懂一篇8頁的英文論文。效率奇低讓人懊惱,葛藝瀟的內(nèi)心也自然地做出了“不愛看、不想看”的反抗。
可能是察覺到學(xué)生情緒的變化,李鴻升老師要求新進(jìn)入實(shí)驗(yàn)室的同學(xué)每周都要上交對當(dāng)周所閱讀3-4篇論文的總結(jié),硬性要求當(dāng)頭,葛藝瀟不得不強(qiáng)迫自己盡力完成。隨著論文越看越多,兩三個月后,她的閱讀速度有很大提升,如果遇上當(dāng)時比較熟悉的領(lǐng)域里的新論文,只要瞄一眼就能知道重點(diǎn)在哪里,如果只是粗讀,一篇論文可能只需二十分鐘。

在基礎(chǔ)知識增長的同時,葛藝瀟也在通過實(shí)踐進(jìn)行知識的驗(yàn)證,除了實(shí)驗(yàn)室前輩們留下的代碼,GitHub為她提供了大量整理詳盡的開源代碼,有時沒有合適的資源,她也要自己根據(jù)論文的描述完成代碼的復(fù)現(xiàn)。即便代碼可以輕松獲得,葛藝瀟也不僅限于看結(jié)果、純調(diào)用,而是會一步一步理解代碼內(nèi)在的邏輯。
“創(chuàng)造力始于模仿”,藝瀟想起自己做研究助理的那一年,所做最主要的工作就是模仿,看論文也好,跑代碼也好,“你模仿到一定程度,你都很熟悉了,這時候你就會發(fā)現(xiàn)你能看到一些之前的人沒有看見的突破點(diǎn)。”
成果來得比葛藝瀟想象得快。
2018年9月,機(jī)器學(xué)習(xí)頂級會議NeurIPS宣布收錄了藝瀟在研究助理時期完成的一篇論文。收到論文入選通知時,正好是藝瀟博士第一個學(xué)期剛開學(xué),那天早上,她看著來自NeurIPS的郵件,對PhD階段的學(xué)習(xí)充滿了信心。


04 沉潛
“一整年不斷地被拒論文,我覺得對我來說是一種快速的成長”
等到從研究助理正式轉(zhuǎn)為博士生,那種由陌生帶來的不適應(yīng)減輕,但在匯集眾多優(yōu)秀學(xué)生的MMLab,同輩壓力總是讓人精神緊張。尤其是近年來,人工智能得到越來越多的關(guān)注,MMLab的入學(xué)門檻也越來越高,后進(jìn)實(shí)驗(yàn)室的同學(xué)可能在學(xué)術(shù)成果上走得更快,沒有人能賴在原地。
可是,2019年,葛藝瀟卻沒有一篇論文入選頂會。且不說與別人比較,即使是與自己比,她也感到巨大的心理落差,甚至做好了延長讀博時間的準(zhǔn)備。
那年,她一共產(chǎn)出了2個工作。第一個工作先投CVPR,沒中,修改后又和第二個工作一起投ICCV,又雙叒沒中。更不幸的是,第一個工作與CVPR-2019接收的一篇oral論文“撞了idea”,這意味著該投稿已經(jīng)失去價值。
不過,盡管2019年是藝瀟讀博以來壓力最大的一年,但她并不消沉。科研人的生活不只有科研,也絕不能只有科研,否則在遇到瓶頸時容易跳不出來。在壓力太大時,葛藝瀟喜歡通過運(yùn)動尋找多巴胺,通過旅游放松自我。科研進(jìn)展不順利的2019,葛藝瀟上半年去了臺灣,年底又去了冰島和芬蘭。只要還在香港,哪怕是看電影、吃美食,藝瀟還是會不自覺想到實(shí)驗(yàn),而一旦踏上遠(yuǎn)方的旅程,什么煩惱似乎都可以完全拋在腦后。

壓抑的情緒走得快,但問題還在。葛藝瀟對自己當(dāng)年第一個工作所使用的方法比較滿意,所以被CVPR拒絕時,她沒想太多,更多歸因于偶然因素。但第二次又被拒,而其他方法相近的論文卻被收錄為oral,當(dāng)年第二份比較滿意的工作也沒有得到理想的結(jié)果,葛藝瀟也無法說服自己這是偶然因素了。
通過反復(fù)鉆研主題相近的入選論文以及和老師持續(xù)且深入的討論,藝瀟覺得自己的問題還是在于有點(diǎn)浮躁。比如2019年的第二個工作,在她發(fā)現(xiàn)自己的新方法能把任務(wù)性能提高十幾個百分點(diǎn)后,她就沒有再多思考,后續(xù)寫作和分析也相對比較草率。方法本身簡單易懂、性能能打固然重要,但會議審稿關(guān)注的不僅僅是這些。葛藝瀟在自己做了審稿人后,也就能把問題看得更加明白。審稿人往往抱著比較嚴(yán)苛的態(tài)度,試圖找到論文中的不合理之處,所以在向別人展現(xiàn)成果之前,一定要學(xué)會換位思考,一層一層細(xì)致地論證自己方法的合理性,盡可能做到面面俱到。
面面俱到也體現(xiàn)在論文寫作上,好的技術(shù)需要輔之以好的表達(dá)。葛藝瀟2018年入選頂會的論文,在英文寫作上其實(shí)獲得了李鴻升老師非常大的幫助。由于之前沒有接觸過英文學(xué)術(shù)寫作,藝瀟的表達(dá)常常缺少明晰的邏輯,是李老師幫她“把論文的邏輯捋得非常通順,而且能一眼就讓人看見”貢獻(xiàn)和亮點(diǎn)“。李老師的打樣成為她學(xué)習(xí)的范本,但提高本身來得并沒有那么快。
在認(rèn)識到問題后,藝瀟轉(zhuǎn)變不夠嚴(yán)謹(jǐn)?shù)膽B(tài)度,對寫作也更加上心。為了避免自我審視的盲區(qū),她還會把自己的論文給其他領(lǐng)域的朋友看,如果除了技術(shù)的細(xì)節(jié)都能夠被理解,那么這篇論文應(yīng)該可以算寫清楚了。

“一整年不斷地被拒論文,我覺得對我來說是一種快速的成長”,這一年的反思和改進(jìn)都在2020年得到了完全的展現(xiàn)——
曾被ICCV-2019拒絕的論文Mutual Mean-Teaching: Pseudo Label Refinery for Unsupervised Domain Adaptation on Person Re-identification經(jīng)改進(jìn),成功收錄于ICLR 2020;
隨后,Self-supervising Fine-grained Region Similarities for Large-scale Image Localization?被ECCV 2020收錄為spotlight presentation;
又有Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID(點(diǎn)擊這里直接閱讀)被NeurIPS 2020收錄……
藝瀟覺得2020年的自己很幸運(yùn),但她也能清楚地看見自己與更厲害的人之間的差距,之前在意的可能是論文的數(shù)量,但越往后,她希望自己做的工作能有更大的影響力。



05 下一扇門
從實(shí)驗(yàn)室到工業(yè)界,面對下一扇打開的門,她已經(jīng)做好了準(zhǔn)備。
2021年,計算機(jī)視覺頂級會議CVPR接收了葛藝瀟的三篇論文。算上做研究助理的一年,這已經(jīng)是她在MMLab的第四年。畢業(yè)后,藝瀟決定到更加貼近實(shí)際應(yīng)用的工業(yè)界去。
“去工業(yè)界的朋友都是希望能夠?qū)⒓夹g(shù)真正落地到產(chǎn)品當(dāng)中,我未來也是會往這個方向去進(jìn)行努力?!?/p>
投身陌生的專業(yè)領(lǐng)域,需要力氣,也需要勇氣。時間好像又回到五年前——從實(shí)驗(yàn)室到工業(yè)界,藝瀟即將真正走出象牙塔,面對下一扇打開但還看不清未來的大門,她已經(jīng)做好了準(zhǔn)備。

關(guān)于TechBeat人工智能社區(qū)
TechBeat(www.techbeat.net)隸屬于將門創(chuàng)投,是一個薈聚全球華人AI精英的成長社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長。期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ
-?The End -