面試分享!猿輔導(dǎo)計(jì)算機(jī)視覺算法工程師一面
來(lái)源:投稿 作者:LSC
編輯:學(xué)姐
總共時(shí)長(zhǎng)45分鐘,首先是自我介紹,然后開始面試。
1.旋轉(zhuǎn)數(shù)組[1,2,3,4,5,6,7]--->[5,6,7,1,2,3,4],找出k是否存在一個(gè)旋轉(zhuǎn)數(shù)組中,旋轉(zhuǎn)數(shù)組一開始是有序的。
二分:
2.字符串a(chǎn),能不能在1步內(nèi)(增加、刪除、修改)變成字符串b,都只含有小寫字母,但是不能改變?cè)瓉?lái)a b各個(gè)字符的順序
Eg:a=”abcdfgd” b=”abcdffd” ?yes?
a=”bbiiom” b=”abiion” no?
a=”ccaabb” b=”aabbcc” no
法1: 動(dòng)態(tài)規(guī)劃 編輯距離
法2: 直接判斷:
(1)先判斷兩個(gè)字符串的長(zhǎng)度相差是否大于1,是no,否繼續(xù)
(2)統(tǒng)計(jì)每個(gè)字符串中每個(gè)字母的個(gè)數(shù),再計(jì)算相同字母每個(gè)字符串的差,用字典來(lái)統(tǒng)計(jì),一旦有差大于1,是no,否繼續(xù)
(3)如果兩個(gè)字符串等長(zhǎng),遍歷兩個(gè)字符串,是否存在超過1相同位置的值不同的,是no,否yes,不一樣長(zhǎng)的話,遍歷,如果相同位置不同,長(zhǎng)的指針向后移動(dòng),再次字符不相同就是no,否則yes。
3.介紹項(xiàng)目
主要介紹項(xiàng)目的數(shù)據(jù)、任務(wù)、模型、參數(shù)、優(yōu)化和結(jié)果。
4.為什么這個(gè)項(xiàng)目要用到光照數(shù)據(jù)增強(qiáng),為什么選擇yolov5模型
因?yàn)槲翼?xiàng)目的數(shù)據(jù)收到光照這個(gè)因素的影響比較大,所以特地進(jìn)行數(shù)據(jù)增強(qiáng),增加模型的泛化性。
5.熟悉OCR算法嗎?比較了解的有哪些?
對(duì)CRNN比較熟悉,入門ocr必學(xué)的經(jīng)典算法。
CRNN=CNN+RNN+CTC,不用先對(duì)單個(gè)文字進(jìn)行切割,而是將文本識(shí)別轉(zhuǎn)化為時(shí)序依賴的序列學(xué)習(xí)問題,就是基于圖像的序列識(shí)別,使用 CTC 損失,把從循環(huán)層獲取的一系列標(biāo)簽分布轉(zhuǎn)換成最終的標(biāo)簽序列。
此外還有SVTR,是PaddleOCR的PP-OCRv3的主要模型, 模型小, 效果好,主要就是利用Transformer替代了RNN, 得益于self-attention機(jī)制, 這樣面對(duì)不規(guī)則文本圖像的時(shí)候應(yīng)該有更好的信息抽取能力, 可以更好的抽取有序后驗(yàn)概率矩陣。
6.常用的ocr框架
PaddleOCR和mmocr框架,這兩個(gè)都是當(dāng)下最流行的ocr框架,兩種框架的文本檢測(cè)和識(shí)別的代碼結(jié)構(gòu)相似,PaddleOCR更全面,我使用頻率較高,支持多種語(yǔ)言文本,mmocr對(duì)中文支持行較差,總的來(lái)說準(zhǔn)確率大體都差不多。
久違的分享一下面試經(jīng)驗(yàn),希望可以給還在找工作的同學(xué)一點(diǎn)幫助~
另外關(guān)注“學(xué)姐帶你玩AI”公眾號(hào)
回復(fù)“簡(jiǎn)歷”可以免費(fèi)領(lǐng)取300+簡(jiǎn)歷模板&算法工程師萬(wàn)能簡(jiǎn)歷公式!