一個(gè)計(jì)算機(jī)視覺PhD的畢業(yè)隨感
作者:bebaa444
來源:https://zhuanlan.zhihu.com/p/122148241
本文已由作者授權(quán)轉(zhuǎn)載,未經(jīng)允許,不得二次轉(zhuǎn)載。
幼兒園時(shí),每天的期待是周末在奶奶家門口爬樹摘枇杷,畢業(yè)后便沒有再多的牽掛。
到了小學(xué),班主任實(shí)行基于奇偶行列交替的一周一次的shuffle座位法,于是每天便在計(jì)算一個(gè)學(xué)期有多少周可以和喜歡的女孩子坐同桌,畢業(yè)后,每當(dāng)遇見也不再有類似的心動(dòng)。
高中,第一次遠(yuǎn)離家鄉(xiāng),很快有了獨(dú)立意識(shí),開始了好好學(xué)習(xí)。入學(xué)排名剛過二本線的我,期待著畢業(yè)之后能去哈工大學(xué)航空航天,想想就很酷,于是每天只睡2.5小時(shí)?,F(xiàn)在看來,那段時(shí)光失去了太多的東西,再來一次也許會(huì)多花些時(shí)間學(xué)學(xué)編程,看看歷史,讀讀文學(xué)。
進(jìn)了大學(xué),期待著自己能夠養(yǎng)活自己,心里想著,如果能拿到阿里的15*15算法工程師的special offer簡(jiǎn)直就是夢(mèng)想,如今卻已經(jīng)為笑談。
后來,加入某CV實(shí)驗(yàn)室攻讀PhD,開啟了我正統(tǒng)的CV research之旅。沒怎么見過8點(diǎn)的太陽,卻天天觀賞凌晨三四點(diǎn)的月光。偶爾跑跑長(zhǎng)跑,也被救護(hù)車送過醫(yī)院。曾在宿舍憋著幾周不出門,也借著開會(huì)游歷了不少國(guó)家和地區(qū)。經(jīng)歷了數(shù)年的艱苦鏖戰(zhàn),終于通過了博士畢業(yè)答辯。
曾經(jīng)以為會(huì)有無數(shù)感慨,以為這些年壓抑在心中已久對(duì)研間百態(tài)的感想會(huì)在在畢業(yè)的那一剎那噴涌而出,以為會(huì)把曾經(jīng)無數(shù)次的驚奇與興奮,不滿和憤懣,希望和激動(dòng),絕望與哀傷一股腦灑在交流時(shí)的慷慨激昂。然而,當(dāng)defense chair說出you have passed the oral defense的那一刻,所有的一切都不再躁動(dòng)了。
突然明白,這段PhD生涯像兒時(shí)的成長(zhǎng)一樣,帶給我最大的收獲,不是多少papers多少honors,而在于更深入地了解了自己和世界。少不經(jīng)事的我,一次次小心翼翼的期待,在每一次殘酷的成長(zhǎng)與認(rèn)清自己的無知后都顯得不再重要。
答辯結(jié)束后,忙了一周,終于可以抽空寫寫沉淀下來不再躁動(dòng)的部分。
AI研究應(yīng)該是什么樣的
什么是研究
CV出身,只能說說對(duì)工程研究的看法。
本科的我曾天真地認(rèn)為,學(xué)術(shù)和工程是分家的,學(xué)術(shù)遠(yuǎn)比工程牛逼不少。只有推公式思考問題寫paper才是應(yīng)該做的,paper多多的才是好的;而有dirty work的事情就是工程,我不做;要寫大量code的事情就是工程,我不做;解決某個(gè)實(shí)際問題就是工程,我不做?,F(xiàn)在想想真是年輕,缺乏科學(xué)素養(yǎng)的指導(dǎo),沒有從小養(yǎng)成正確的學(xué)術(shù)價(jià)值觀。機(jī)器學(xué)習(xí),本質(zhì)上是數(shù)據(jù)科學(xué),或者說數(shù)據(jù)驅(qū)動(dòng)的優(yōu)化科學(xué)。如果我們自己都不能充分理解數(shù)據(jù)分布,理解系統(tǒng)原理,理解每一個(gè)參數(shù)底層的意義,又怎么能給算法提供正確的先驗(yàn)?zāi)亍?/p>
近幾年來我一直堅(jiān)持一個(gè)觀點(diǎn),工程學(xué)科,比如CSE,EE,IE,SE,都是以Engineering為結(jié)尾。工程學(xué)科的研究,必然以工程需求為出發(fā),以工程落地為結(jié)束。工程研究是建立在基礎(chǔ)研究的基礎(chǔ)上,是人類未來科技發(fā)展的一粒粒種子。人類有了對(duì)天空的好奇,遍有了對(duì)飛行的需求,才有了飛行動(dòng)力學(xué),進(jìn)而有了如今各式先進(jìn)的飛行器。同樣,人類有對(duì)人造智能體的向往,加上對(duì)重復(fù)勞動(dòng)力替換的需求,才有了人工智能,機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺等學(xué)科繁榮的發(fā)展。Fancy卻沒什么卵用的研究確實(shí)令人向往,而遺憾而又無奈的是,這個(gè)世界,人類在每一階段能利用的資源是有限的(土豪除外)。
工程研究是需要錢的。新興行業(yè)的錢從哪來?要么能產(chǎn)生價(jià)值滿足社會(huì)需求,要么足夠fancy能吸引風(fēng)險(xiǎn)投資。只有在社會(huì)需求和資本熱點(diǎn)眷顧下的極個(gè)別行業(yè)才能有足夠的資源支持不計(jì)后果的研究投入。更殘酷的事情是,需求是善變的,資本是短視的,社會(huì)能夠留給一個(gè)學(xué)科負(fù)投資回報(bào)率的周期是短暫的,只有在高估值的資本回撤前完成技術(shù)爆炸性提升-->市場(chǎng)需求提升-->更多資本進(jìn)入&行業(yè)效益反哺研究的良性閉環(huán)才能真正對(duì)整個(gè)社會(huì)和行業(yè)產(chǎn)生正效益。而這之中的關(guān)鍵便是技術(shù)的研究方向要滿足社會(huì)潛在需求點(diǎn)。近年來CV界無數(shù)爆款研究工作,如ResNet,F(xiàn)PN,GAN,模型量化剪枝,NAS,三維場(chǎng)景理解...無一不滿足上述兩點(diǎn)。
那么什么是工程學(xué)的研究?它是一種范式,人們能通過它更好地定義期待,通往期待,達(dá)到期待??梢允菍?duì)一個(gè)問題更本質(zhì)的抽象,可以是對(duì)一種從0到1或從1到99的方法,也可以是對(duì)一個(gè)猜想的深入理解。而這一切,與是否dirty無關(guān)。
什么是好的研究
博士數(shù)年,投了不少篇論文,也審了快100篇論文。偶爾翻翻多年前的paper筆記和與朋友的對(duì)話,發(fā)現(xiàn)對(duì)于研究工作評(píng)價(jià)的心態(tài)在這幾年發(fā)生了很神奇的變化。就像弱者似乎總喜歡拿貶低別人來凸顯自己的睿智:
“本質(zhì)上就是個(gè)xxx”
“這idea我早想過,居然還真有人當(dāng)paper投了”
“臥槽這性能也能中?”
“咋不放個(gè)大庫的結(jié)果,做個(gè)mnist什么鬼,肯定不work!”
“結(jié)果不錯(cuò),方法就是一堆trick,沒啥新東西”
“我沒中是因?yàn)橛龅絪b reviewer,比這辣雞的工作多了去了”
......
后來,paper讀得多了,也就釋然了,不再糾結(jié)一個(gè)工作的局部問題,開始逼迫自己挖掘它的亮點(diǎn)。一個(gè)文章能中頂會(huì),自然有能征服3個(gè)審稿人和2個(gè)AC的原因。結(jié)果不好但idea是否具有啟發(fā)性?想法trivial但是否做了很多結(jié)論有意義而沒什么人愿意做的實(shí)驗(yàn)?沒什么實(shí)驗(yàn)和方法但對(duì)現(xiàn)有技術(shù)的理解是否更深了一步?
學(xué)術(shù)會(huì)議終究是一個(gè)溝通思想激發(fā)整個(gè)領(lǐng)域發(fā)展的地方,而不是比誰的工作NB誰的性能高半個(gè)點(diǎn)的選美大賽。人類對(duì)科學(xué)邊界的探索永遠(yuǎn)不是一步一步向前走的,而是像RL agent那樣,往前走一步往后退兩步,踩踩坑,重復(fù)驗(yàn)證下前人的結(jié)論,震蕩前進(jìn)。其中每一步都是有意義的,共同促進(jìn)了optimal curve扎實(shí)前行。而從前的我忽略了這一點(diǎn),陷入了盲目自信的溫床,付出了本可以快速成長(zhǎng)的機(jī)會(huì)成本。
一直會(huì)問自己一個(gè)問題,科研既然這么的具有發(fā)散性和多樣性,真的有一個(gè)固定的evaluation metric來衡量它的好壞嗎?如果是這樣,不就可以用一個(gè)AI來自動(dòng)審稿了嗎(確實(shí)也有很多類似的研究工作)。
目前看來,我對(duì)一個(gè)好研究工作的標(biāo)準(zhǔn)是具有啟發(fā)性或普適性,對(duì)整個(gè)學(xué)術(shù)界真正有益和正向價(jià)值的。這個(gè)標(biāo)準(zhǔn)現(xiàn)階段似乎還不太能定義成一個(gè)機(jī)器友好的概念(看來reviewer還不會(huì)失業(yè),雖然沒工資)。舉幾個(gè)差工作的feature:
- 結(jié)果造假(違反正向價(jià)值)- Novelty不強(qiáng)且只在極個(gè)別數(shù)據(jù)分布上work,其他常規(guī)分布不work也不講,通過無關(guān)痛癢的超參不敏感型證明robust (違反普適性和正向價(jià)值)- 改改網(wǎng)絡(luò)結(jié)構(gòu),性能漲一兩個(gè)點(diǎn),沒有深入分析原因而是老中醫(yī)式強(qiáng)行解釋一波(沒有啟發(fā)性)
同時(shí),一個(gè)不錯(cuò)的研究者也可以類比定義:堅(jiān)持做有啟發(fā)性和普適性的工作,idea要有足夠的novelty,分析與理解要有足夠insight,刷性能要有絕對(duì)的領(lǐng)先。至于講好故事畫美圖,那只是錦上添花的事情,千萬不要有“好包裝拯救水工作”,以及“沒做完整的工作先湊合投出去抽個(gè)獎(jiǎng)”的心態(tài)。
AI研究應(yīng)該在哪里做?
最近面試了很多申請(qǐng)實(shí)習(xí)崗的博士和碩士,他們都有一個(gè)比較神奇的想法:研究只能在實(shí)驗(yàn)室做,到了公司就是業(yè)務(wù)導(dǎo)向的研究了,不那么“純”了。確實(shí),他們說的有一定道理,但也不完全對(duì)??v觀近代AI的發(fā)展史,突破性的工作如曾經(jīng)的MLP,DBM,DBN,到后來的CNN大多都是在實(shí)驗(yàn)室搞出來的,而后來的諸多突破如ResNet,NAS,COCO等又是來源于工業(yè)界。對(duì)此我的看法會(huì)比較極端。我認(rèn)為較合理的AI研究資源(算力資源和人力資源)分配只有兩種:在工業(yè)界做解決實(shí)際問題的應(yīng)用類、系統(tǒng)類研究,在實(shí)驗(yàn)室做理解性、理論性和啟發(fā)性的工作。而不幸的是,現(xiàn)在(尤其國(guó)內(nèi))有非常多老師為了funding和外快,圈起自己的碩博生在實(shí)驗(yàn)室用著人均0.5塊GPU的資源做著諸如人臉識(shí)別、物體檢測(cè)等高運(yùn)算需求的刷點(diǎn)工作,還不讓出去實(shí)習(xí),這是研究資源十分不合理的分配方式,卻符合目前的學(xué)術(shù)圈風(fēng)格。
科研的人生應(yīng)該是什么樣的
初入科研
先講一個(gè)自己的故事。
和大多數(shù)科研從業(yè)者一樣,在科研這條道路上我也經(jīng)歷過絕望和痛苦。
大三時(shí),在有幸在某跨國(guó)公司研究機(jī)構(gòu)A實(shí)習(xí)。同時(shí),還受到了當(dāng)時(shí)拿到PhD口頭offer的老板下的一個(gè)小老板的瘋狂push,于是我開始了雙線工作。但是小老板做的方向和我不一致,且只有push沒有任何指導(dǎo),導(dǎo)致我陷入了一個(gè)“小老板push我復(fù)現(xiàn)論文結(jié)果-->按論文復(fù)現(xiàn)后精度對(duì)不上-->被小老板冷暴力并繼續(xù)push”的死循環(huán)。到后來才知道學(xué)術(shù)界里有一些common或隱藏settings是不會(huì)在paper里明說的,但在此之前,我陷入了極大的自卑和抑郁的深淵。而這進(jìn)一步導(dǎo)致實(shí)習(xí)的活干不好,又擔(dān)心小老板不開心給大老板反饋會(huì)影響到PhD offer,進(jìn)而更抑郁的惡性循環(huán)。期間小老板還使出了類似peer pressure變相威脅等多重暴擊,當(dāng)時(shí)和EX也在分手邊緣,整個(gè)人直接崩了。
不久,我便做了一個(gè)決定,quit,老子不給你干了,愛誰誰。
自那之后,我整個(gè)人都變了,對(duì)于學(xué)術(shù)圈充滿了防備,但也算是好事,遇到學(xué)術(shù)圈不正義的事會(huì)直接開懟,不再會(huì)唯唯諾諾。
再后來,通過基友介紹我去了研究機(jī)構(gòu)B,開始了我真正的研究生涯。B公司的mentor對(duì)我非常好,在技術(shù)、資源和空間上給予了我極大的幫助和鼓勵(lì)。很快,我便在B發(fā)表了第一篇頂會(huì)的文章,一投就中的運(yùn)氣令我重拾起我對(duì)科研的信心。
在gap year中我在B公司全職工作了一年,繼續(xù)發(fā)了兩篇一作論文,也學(xué)習(xí)了如何從研究到落地的全棧流程?,F(xiàn)在想來,在整個(gè)一年中真正讓我長(zhǎng)期受益的不是那些paper和項(xiàng)目,而是對(duì)待科研正確的態(tài)度,對(duì)行業(yè)的思考與視野。很快,在mentor的推薦下,我來到了C校開始了我的博士生涯。
正是由于在B學(xué)習(xí)到真正受益的學(xué)術(shù)價(jià)值觀,讓我在C非常愉快地度過了博士學(xué)習(xí)生涯,有正確的研究方向,遇到不好的事情敢于及時(shí)止損,基于對(duì)研究領(lǐng)域的vision確定自己的目標(biāo),真正為自己的學(xué)術(shù)興趣與夢(mèng)想而研究。這對(duì)于大多NB的PhD或許是自然的,而對(duì)于在A時(shí)的我卻是一個(gè)遙不可及的事情。
后來,我也開始帶實(shí)習(xí)生和低年級(jí)的PhD了。由于曾經(jīng)的經(jīng)歷,我深知初入學(xué)術(shù)圈的學(xué)生的那種惶恐,無知又興奮的心態(tài),也堅(jiān)信好的研究者不是靠push出來的。便時(shí)刻提醒自己換位思考,為他們帶來寬松的成長(zhǎng)環(huán)境,注重科研方法與態(tài)度的培養(yǎng)而不是教他們?nèi)绾尾拍芸焖贊q點(diǎn)發(fā)paper。
說到發(fā)paper,如今的AI領(lǐng)域頂會(huì)論文質(zhì)量分布大家也都明白。上限比以前高,下限也遠(yuǎn)比以前低,均值略微下降的情況下方差激增,這激起了部分研究員內(nèi)心諸如“摸獎(jiǎng)投稿法”、“灌水投稿法”、“斐波那契投稿法”等非?;蔚耐陡逵?。但是這樣的論文真的有用嗎?在篩簡(jiǎn)歷環(huán)節(jié)確實(shí)能蒙過非專業(yè)的HR小姐姐們,但在面試環(huán)節(jié)只能是減分項(xiàng)。想起去年面某北美大廠D的intern program,兩個(gè)面試官只用了10秒吹捧了一下我impressive的pub list,之后的幾十分鐘全都在仔細(xì)地challenge我paper里的每一個(gè)細(xì)節(jié)和對(duì)相關(guān)領(lǐng)域的深度思考。如果被問到的方向沒什么很好的insight,有很多paper只能說明候選人的研究流于表面,想起曾經(jīng)拒絕過幾個(gè)pub list很豐富的實(shí)習(xí)生,主要原因也是如此。我相信在AI領(lǐng)域,無論是5年前還是現(xiàn)在,無論paper是否已經(jīng)發(fā)生通貨膨脹,一個(gè)研究員的評(píng)估標(biāo)準(zhǔn)從來不是頂會(huì)paper的數(shù)量,而是對(duì)技術(shù)理解的廣度與深度,以及對(duì)技術(shù)發(fā)展趨勢(shì)的精準(zhǔn)判斷。
綜上。對(duì)于初入科研的學(xué)生,我覺得最重要的不是迅速發(fā)一篇paper,找個(gè)大腿蹭一些學(xué)術(shù)經(jīng)歷,或是找一個(gè)實(shí)驗(yàn)室勤勤懇懇干活,而是找到一個(gè)真正適合的科研環(huán)境,勇于止損,同時(shí)樹立正確的學(xué)術(shù)價(jià)值觀,能做到這些,已經(jīng)比當(dāng)年的我強(qiáng)太多了。一個(gè)paper和經(jīng)歷也許會(huì)對(duì)未來一到兩年會(huì)有實(shí)質(zhì)性幫助,而良好的學(xué)術(shù)價(jià)值觀會(huì)受益終身。當(dāng)然,如果兩者能兼得自然是極好的。
愿天下科研萌新不再有痛苦。
科研小兵
激情、堅(jiān)持、視野
作為一個(gè)5年經(jīng)驗(yàn)的科研小兵,目前我認(rèn)為搞科研就像做投資,最穩(wěn)妥的是看準(zhǔn)長(zhǎng)周期趨勢(shì)(視野)然后深耕(堅(jiān)持)進(jìn)去,而不要跟著短周期熱點(diǎn)隨波逐流,打一槍換個(gè)地方,沒有什么沉淀。永遠(yuǎn)有比你在熱點(diǎn)領(lǐng)域積累更深的“莊家”挖好了坑等著割你的韭菜。研究的廣度自然是重要的,但一定要有核心積累的領(lǐng)域。當(dāng)然有能力又廣又深自然是極好的,但這種人鳳毛菱角不具有普遍性。而這一切的基礎(chǔ)一定要源于對(duì)科研的熱愛與激情。見過不少學(xué)弟學(xué)妹,有些確實(shí)能力也很出眾,覺得AI火,就要轉(zhuǎn)過來搞AI,聽說PhD地位高工資高還能轉(zhuǎn)教職,就要讀PhD。問問他們真的喜歡嗎,答曰一般吧,也說不上喜歡和不喜歡,就覺得是趨勢(shì)來錢快所以想all in。這樣就很危險(xiǎn)。為了生活而做科研,難免落入“還是要恰飯的嘛”的不良學(xué)術(shù)價(jià)值觀,進(jìn)而極大地影響自己的學(xué)術(shù)風(fēng)格。希望自己能長(zhǎng)期保持這三種特征,快快成長(zhǎng)成成熟的研究員吧!
成熟的研究員
因?yàn)樽约哼€沒有到這個(gè)階段,但根據(jù)接觸到的A、B、C、D和學(xué)術(shù)界的諸多資深學(xué)者身上學(xué)到了不少東西,簡(jiǎn)單總結(jié)一下。相比于科研小兵,有的成熟研究員能獨(dú)擋一面,成為某細(xì)分領(lǐng)域的絕對(duì)大牛;有的積極嘗試產(chǎn)學(xué)結(jié)合,將自己深耕的技術(shù)領(lǐng)域成功落地,得到了豐厚的經(jīng)濟(jì)回報(bào)的同時(shí)依然在認(rèn)真做著研究工作;有的進(jìn)入了學(xué)術(shù)界,帶領(lǐng)并指導(dǎo)出一批又一批厲害的學(xué)術(shù)新星,自己卻很久不coding了。看似各有各的閃耀,我卻在他們的身上發(fā)現(xiàn)了一些共性:
1. 廣闊且銳利的視野:
如果說一個(gè)科研小兵今天的學(xué)術(shù)成果是一年前埋下種子結(jié)的果,那么這些成熟研究員如今的成果大多取決于3-5年甚至更久以前的布局與積累。而曾經(jīng)選擇的研究方向、發(fā)展模式、運(yùn)營(yíng)手段都是在當(dāng)時(shí)并不一定被看好或追捧的。這需要極強(qiáng)的預(yù)判力、對(duì)技術(shù)和社會(huì)的理解與寬廣的知識(shí)儲(chǔ)備。
2. 執(zhí)著甚至偏執(zhí):
認(rèn)準(zhǔn)了方向就堅(jiān)持執(zhí)行下去,做事極有長(zhǎng)周期的計(jì)劃性。
3. 極強(qiáng)的好奇與精力:
對(duì)于新的技術(shù)永遠(yuǎn)保持好奇與學(xué)習(xí)心態(tài),有時(shí)甚至比一線科研工作者了解的細(xì)節(jié)都多,加上觸類旁通的寬廣知識(shí)面,思考產(chǎn)生的成果是遠(yuǎn)超科研小兵的。
4. 極強(qiáng)的運(yùn)營(yíng)能力:
能夠充分調(diào)動(dòng)資源(人力、物力)的利用效率,很少懈怠,長(zhǎng)期積累下來的結(jié)果就是具有極強(qiáng)的同階層競(jìng)爭(zhēng)力(感覺AI能做的更好)
5. 機(jī)遇與理性:
能抓得住每一個(gè)關(guān)鍵的機(jī)遇,能在失敗中迅速恢復(fù)理性并深入復(fù)盤
先寫這么多,感謝C,感謝A、B和D mentor們的培養(yǎng)。
共勉。