說(shuō)了那么多,到底什么是「神經(jīng)搜索」?
?從人腦神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),來(lái)自 Jina AI 的 Jack 將帶大家從 0 到 1 認(rèn)識(shí)「搜索」及「神經(jīng)搜索」。?
什么是神經(jīng)搜索?它與普通搜索有什么區(qū)別?它能解決哪些問題?又有哪些優(yōu)勢(shì)和劣勢(shì)?
觀看本期 Jina AI 小科普,在 Jack 的帶領(lǐng)下,只需 6 分鐘,你將對(duì)神經(jīng)搜索 (Neural Search) 的概念、原理及與人類大腦的相似之處,有更全面的認(rèn)識(shí)和理解~

什么是「搜索」
提到「搜索」很多人第一反應(yīng)就是百度、Google 等搜索引擎,我們?cè)谒阉骺蛑休斎胂胍樵兊膬?nèi)容,然后得到一系列與之相關(guān)的鏈接。
實(shí)際上,搜索遠(yuǎn)不止如此。比如使用聽歌識(shí)曲功能時(shí),其實(shí)是用錄制的音頻片段搜索匹配歌曲;刷 Tinder 的時(shí)候,算法也在搜索它認(rèn)為你感興趣的對(duì)象。

除了這些以外,搜索能做的事情還有很多,比如在學(xué)術(shù)論文庫(kù)里查找答案;又或者通過(guò)以圖搜圖,搜索一雙心儀的鞋子……
我們能不能通過(guò)任意一種類型的數(shù)據(jù),搜索其他類型的相似數(shù)據(jù)呢?有了神經(jīng)搜索 (Neural Search),實(shí)現(xiàn)這些將不再是夢(mèng)。
什么是「神經(jīng)搜索」
「神經(jīng)搜索」即 Neural Search,是由 Jina AI 首創(chuàng)的概念。
Neural Search 可以理解為 Deep Learning for Search 的簡(jiǎn)稱,是指借助深度學(xué)習(xí)技術(shù),使用非結(jié)構(gòu)化數(shù)據(jù)搜索非結(jié)構(gòu)化數(shù)據(jù)。
深度學(xué)習(xí)模型和向量索引是神經(jīng)搜索的重要組成部分。

接下來(lái),我們用一個(gè)更為直觀的例子,向大家解釋神經(jīng)搜索的概念。
這是一組小貓跟小狗的圖片,第一眼看到這些圖片的時(shí)候,你會(huì)先注意到什么?

首先,大家可能跟我一樣,會(huì)注意到它們是小狗和小貓;其次,我們會(huì)發(fā)現(xiàn)它們還是挺可愛的。這些特征雖然顯而易見,但也非常重要。

現(xiàn)在我們?cè)倏纯唇酉聛?lái)這幾張圖片。這幾張圖片看起來(lái)可能就沒那么可愛了。

這些「非典型」寵物圖片,應(yīng)該放在圖結(jié)構(gòu)的哪個(gè)位置呢?雖然它們都屬于貓和狗,但我們認(rèn)為應(yīng)該增加一個(gè)維度,來(lái)描述它們的其他特征。

接下來(lái)就可以把它們放在圖中的恰當(dāng)位置。
深度學(xué)習(xí)中的常見術(shù)語(yǔ)
現(xiàn)在我們來(lái)學(xué)習(xí)幾個(gè)深度學(xué)習(xí)中常見的術(shù)語(yǔ)。
?維度?
表示圖結(jié)構(gòu)中數(shù)據(jù)存在的位置。上圖中只有兩個(gè)維度,它們可以是任意數(shù)字。
?向量?
嵌入圖結(jié)構(gòu)中的單個(gè)數(shù)據(jù)點(diǎn),可以用一組坐標(biāo)來(lái)表示。這個(gè)例子里只有兩個(gè)維度(cat-dog dimension 及 cute-scary dimension),因此向量?jī)H用兩個(gè)數(shù)字表示即可。
在我們的圖結(jié)構(gòu)中,每只寵物都有自己的向量,數(shù)量共計(jì)為 10
?索引?
這些向量匯集到一起,統(tǒng)稱為「索引」。

了解了這些術(shù)語(yǔ)后,再增加一些比較可愛的寵物圖片。如果我們想從動(dòng)物圖像數(shù)據(jù)集里,找到一只類似的狗,該怎么實(shí)現(xiàn)?

沒錯(cuò),我們剛剛找到了這只小狗的「最近鄰」,也就是另外一只可愛的、毛茸茸的小狗(右下角)。
人類神經(jīng)網(wǎng)絡(luò) vs 虛擬神經(jīng)網(wǎng)絡(luò)
上述例子這聽起來(lái)很簡(jiǎn)單,因?yàn)槲覀兊拇竽X每時(shí)每刻,都在自發(fā)地調(diào)用維度、向量和索引,通常情況下,我們甚至不會(huì)思考其中的原理。
人體大腦是一個(gè)由神經(jīng)元和突觸組成的網(wǎng)絡(luò),簡(jiǎn)而言之即神經(jīng)網(wǎng)絡(luò)。
與人體的神經(jīng)網(wǎng)絡(luò)類似,虛擬神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式也是如此。它會(huì)根據(jù)所給數(shù)據(jù)的維度,建立一個(gè)索引,并能根據(jù)最近鄰找到類似數(shù)據(jù),也就是用自己的神經(jīng)元來(lái)搜索數(shù)據(jù)。
接下來(lái)這個(gè)例子,比上述簡(jiǎn)單的二維圖結(jié)構(gòu)更加準(zhǔn)確。每次吃飯時(shí),大腦都在接收關(guān)于食物風(fēng)味的信號(hào),它是甜的還是咸的?是脆的還是軟的?
我們每次吃下的食物都基于咸淡、口感等維度,被嵌入神經(jīng)網(wǎng)絡(luò)中的索引;將 3D 物體模型輸入虛擬神經(jīng)網(wǎng)絡(luò)后,它也會(huì)根據(jù)模型的外觀、單點(diǎn)集中程度等建立索引。
神經(jīng)網(wǎng)絡(luò)的劣勢(shì)
所有神經(jīng)網(wǎng)絡(luò)都有優(yōu)勢(shì)和劣勢(shì)。
海豚和松鼠的大腦中都存在神經(jīng)網(wǎng)絡(luò)。但是,如果我們讓海豚去收集堅(jiān)果,或者讓松鼠去抓魚,它倆肯定誰(shuí)都做不好。
同樣,我們也無(wú)法用一個(gè)在視頻上訓(xùn)練的神經(jīng)網(wǎng)絡(luò)來(lái)搜索文本,或者用一個(gè)法語(yǔ)的神經(jīng)網(wǎng)絡(luò)來(lái)搜索中文。
那么,Jina 在這其中的作用是什么?

下期節(jié)目中,我們將探討 Jina 背后的一些關(guān)鍵概念,以及如何啟動(dòng)和運(yùn)行 Jina。
我們下期節(jié)目再見!