我從「人間地獄」的算法崗內(nèi)卷中,倔強(qiáng)的踏出了一條路
作者|王玨
編輯|極市平臺(tái)
引言
從研究生踏入人工智能的范疇,王劍波的每一步都是朝著實(shí)際業(yè)務(wù)走去,而今年剛完成研究生學(xué)業(yè)的他也選擇成立自己的算法公司,成為自己的領(lǐng)導(dǎo)。
“三人行必有我?guī)煛?,王劍波始終認(rèn)為優(yōu)秀的工作都是自己能夠?qū)W習(xí)的方向,他相信AI未來(lái)的發(fā)展,在極市平臺(tái)積累的競(jìng)賽和項(xiàng)目經(jīng)驗(yàn)是他為迎接未來(lái)機(jī)遇的儲(chǔ)備。
#01 在AI最火熱的時(shí)候,搭上人工智能的快車
在《2022高考搜索大數(shù)據(jù)》中,人工智能專業(yè),熱度上升幅度54%,成為熱度最高專業(yè),緊隨其后的是機(jī)械工程和電氣專業(yè)。
王劍波剛好踩住了這兩個(gè)熱點(diǎn),他本科就讀于西安理工大學(xué),專業(yè)是電氣工程及其自動(dòng)化。18年本科畢業(yè),受到人工智能火熱的氛圍感染,他開(kāi)始走上人工智能這一條道路。
魯迅說(shuō)過(guò)這樣一句話“一碗酸辣湯,耳聞口講的,總不如親自呷一口的明白”,從實(shí)際出發(fā)是王劍波每次做選擇的第一要素。
雖然選擇計(jì)算機(jī)視覺(jué)這一方向有受到當(dāng)時(shí)研究組里師兄們的影響,但最終選擇弱監(jiān)督時(shí)序動(dòng)作定位這個(gè)方向是經(jīng)過(guò)對(duì)現(xiàn)實(shí)環(huán)境的仔細(xì)分析考慮后決定的。他說(shuō)原因主要有兩點(diǎn):1.目標(biāo)檢測(cè)和語(yǔ)義分割是兩個(gè)相對(duì)基礎(chǔ)的任務(wù),能夠給其他領(lǐng)域提供思考。2.現(xiàn)有的人工智能應(yīng)用場(chǎng)景也大多都和這兩個(gè)任務(wù)相關(guān)。
#02 天下之至拙,能勝天下之至巧
作為一個(gè)江西人,王劍波的為人處事似乎也受到了這片紅色搖籃的影響。
在他的日常學(xué)習(xí)中,對(duì)于一個(gè)特定的任務(wù)或者問(wèn)題,他都會(huì)先去調(diào)研這個(gè)任務(wù)的基本歷史和背景,然后針對(duì)某個(gè)方法或者算法進(jìn)行深入的學(xué)習(xí)研究,最后是給出自己的思考,即能否給出更好的改進(jìn)方法。這樣的類似強(qiáng)化學(xué)習(xí)的方式很繁瑣枯燥,但卻能夠培養(yǎng)深入鉆研、過(guò)細(xì)咀嚼、獨(dú)立思考的能力。這也為他后來(lái)在極市平臺(tái)做項(xiàng)目的優(yōu)秀產(chǎn)出打下了夯實(shí)的基礎(chǔ)。
王劍波認(rèn)為只要是優(yōu)秀的人和工作,都是他學(xué)習(xí)的榜樣。
計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域較大的一個(gè)板塊,最不缺人才。除了ResNet、YOLO這些視覺(jué)領(lǐng)域基石性的工作,這兩年的swinT、MAE等,每年頂會(huì)被錄取的工作,都是大量的最優(yōu)質(zhì)的學(xué)習(xí)材料。這就好比人工智能里的模仿學(xué)習(xí),只要認(rèn)真研究的話,肯定能學(xué)到許多。
#03 從競(jìng)賽到項(xiàng)目,每一步都是走向真實(shí)業(yè)務(wù)場(chǎng)景
關(guān)于對(duì)AI工業(yè)落地的看法,王劍波認(rèn)為這個(gè)方向是很有前景的,目前工業(yè)界存在大量的任務(wù)可以用AI去解決,同時(shí)成本也相對(duì)較低。而他本人也秉持著對(duì)AI工業(yè)落地的希望,選擇早早的接觸到實(shí)際的業(yè)務(wù)當(dāng)中。
王劍波最開(kāi)始接觸到極市平臺(tái)是參加了2021年的ECV競(jìng)賽,當(dāng)時(shí)也在比賽中拿到了獎(jiǎng)項(xiàng)。有了比賽的經(jīng)驗(yàn),加上極市打榜恰好又提供了大量的真實(shí)項(xiàng)目實(shí)踐機(jī)會(huì),王劍波就著手了他的第一個(gè)項(xiàng)目-火車車廂編號(hào)識(shí)別。
因?yàn)橹耙恢痹谧鰧W(xué)術(shù)相關(guān)的研究,對(duì)于算法落地方面的知識(shí)了解不深,在項(xiàng)目開(kāi)發(fā)的過(guò)程中他也遇到了不少的障礙,走了不少的彎路。在查閱了大量的資料和極市平臺(tái)專業(yè)技術(shù)支持的幫助后,還是成功的完成了這個(gè)項(xiàng)目,也在平臺(tái)里學(xué)到了很多對(duì)于SDK封裝,使用TensorRT對(duì)模型加速推理,算法部署等相關(guān)知識(shí)。
僅僅過(guò)去一年,王劍波已經(jīng)在極市平臺(tái)上參與開(kāi)發(fā)了十多個(gè)算法,例如滅火器識(shí)別、下樓梯玩手機(jī)識(shí)別、快遞爆倉(cāng)識(shí)別、打架識(shí)別、煙霧火焰識(shí)別等。他以近期獲獎(jiǎng)的客流統(tǒng)計(jì)識(shí)別為例,大致闡述了自己開(kāi)發(fā)算法的整體過(guò)程:
“當(dāng)時(shí)的整個(gè)思路是先用YOLOv5去檢測(cè)人頭,然后用ByteTrack去追蹤人頭,然后通過(guò)邏輯判斷人頭是否進(jìn)出預(yù)定義的區(qū)域。由于這個(gè)項(xiàng)目還要求輸出追蹤對(duì)象的性別和年齡,同時(shí)還要檢測(cè)到工牌。因此如果直接用純YOLOv5去檢測(cè),肯定是不行的,樣本很不均勻,這里就借鑒了之前比賽的一個(gè)思路,采用屬性分類的方法去解決。最后還進(jìn)行了不同模型尺寸和速度的對(duì)比實(shí)驗(yàn),確定最終的模型大小選擇。最終選擇了Large模型,速度也剛好滿足要求?!?/p>
除了積累大量的算法開(kāi)發(fā)、模型訓(xùn)練的經(jīng)驗(yàn),他也獲得了極市給予的項(xiàng)目開(kāi)發(fā)的獎(jiǎng)金,曾在1月的“快遞爆倉(cāng)打榜算法”訂單分成中獲得42750元的分成獎(jiǎng)金。
目前人工智能方向雖然還很火熱,但也隨之越來(lái)越卷,競(jìng)賽和項(xiàng)目經(jīng)驗(yàn)是卡住很多應(yīng)屆畢業(yè)生求職的一大門檻。在這樣的大環(huán)境下,王劍波覺(jué)得把握住機(jī)會(huì)是最為重要的,實(shí)驗(yàn)室里接觸算法落地的機(jī)會(huì)并不多,通過(guò)極市這樣的平臺(tái)可以接觸大量的實(shí)際落地項(xiàng)目,還能接觸使用到海量真實(shí)場(chǎng)景數(shù)據(jù)集;在自己的周邊的機(jī)器不足或者不能連接有GPU的機(jī)器時(shí),極市平臺(tái)提供的云端訓(xùn)練功能給他提供了很大的幫助;極市平臺(tái)的自動(dòng)化測(cè)試功能也大大提高了模型開(kāi)發(fā)的效率。
談到如何平衡學(xué)習(xí)和項(xiàng)目開(kāi)發(fā)這一問(wèn)題,王劍波認(rèn)為這兩者其實(shí)并不存在矛盾。
其實(shí)很多的項(xiàng)目開(kāi)發(fā)是存在現(xiàn)有的代碼模版可以進(jìn)行訓(xùn)練、部署等,也存在一些業(yè)務(wù)邏輯相對(duì)比較復(fù)雜的項(xiàng)目,但只需要集中精力,不要拖延就不會(huì)影響學(xué)習(xí)的進(jìn)度。當(dāng)然也發(fā)生過(guò)一些焦頭爛額的情況,比如學(xué)習(xí)的問(wèn)題和項(xiàng)目的問(wèn)題同時(shí)出現(xiàn),這個(gè)時(shí)候他會(huì)先讓自己平靜下來(lái),再按照緊急程度一個(gè)個(gè)的去解決。慢慢走,一步步來(lái),都是可以解決的。
#04 前路漫漫,星芒萬(wàn)里
王劍波提到自己有一個(gè)小小的目標(biāo),希望能夠開(kāi)發(fā)出一套屬于自己的訓(xùn)練和部署框架?;谶@個(gè)中長(zhǎng)期的目標(biāo),也恰好極市平臺(tái)推出了對(duì)算法團(tuán)隊(duì)的EQP激勵(lì)計(jì)劃,王劍波今年畢業(yè)就組建了自己的公司,盡管現(xiàn)在這個(gè)公司還很稚嫩,但是秉持著敏于觀察、勤于思考、善于綜合、勇于創(chuàng)新的態(tài)度和精神,腳踏實(shí)地實(shí)事求是,他相信埋頭努力的那些黑夜終會(huì)凝聚出不容小覷的力量。
與浩瀚的宇宙相比,人就像是一粒塵埃,所以向著目標(biāo)大膽的去做,前路漫漫亦燦燦,都沒(méi)有什么好懼怕的。