「番外篇」AI 領(lǐng)域相關(guān)的名詞解釋?zhuān)淙恢渌匀?/h1>
GPT
GPT:Generative Pre-trained Transformer(生成式預(yù)訓(xùn)練轉(zhuǎn)換模型),Generative 生成式是眾多人工智能模型中的一種,Pre-trained 預(yù)訓(xùn)練,指不為一個(gè)特定的目標(biāo)訓(xùn)練,而是預(yù)先訓(xùn)練一個(gè)通用模型,也就是先把大量的數(shù)據(jù)發(fā)送給機(jī)器,讓其進(jìn)行深度學(xué)習(xí)(GPT-3 有 1750 億個(gè)參數(shù)),如果我們有個(gè)特定的目標(biāo),可以在這個(gè)通用模型的基礎(chǔ)上進(jìn)行特定的訓(xùn)練,對(duì)其微調(diào)(Fine-Tuning)。Transformer 是一種深度學(xué)習(xí)模型,可用于處理數(shù)據(jù)間的轉(zhuǎn)換,比如輸入了 apple,通過(guò)編碼(encoder)給機(jī)器,機(jī)器處理后再解碼(decoder)輸出,這時(shí)的結(jié)果就可以是法語(yǔ) pomme(都是蘋(píng)果的意思)。
ChatGPT
ChatGPT:OpenAI 這個(gè)公司基于 GPT 通用大模型推出的一個(gè)聊天式應(yīng)用。為了助于理解,我們可以簡(jiǎn)單地打個(gè)比方,GPT 像是電腦里操作系統(tǒng),而 ChatGPT 就像是瀏覽器(已有插件市場(chǎng)),因?yàn)?GPT 這臺(tái)電腦對(duì)外開(kāi)放(現(xiàn)實(shí)是 GPT 對(duì)外提供 API),所以我們也可以基于它開(kāi)發(fā)各種應(yīng)用。這樣的關(guān)系很像是微軟,擁有 Windows 操作系統(tǒng),系統(tǒng)有自帶了個(gè)瀏覽器(以前的 IE,現(xiàn)在 Edge),很多開(kāi)發(fā)者在 Windows 系統(tǒng)上開(kāi)發(fā)軟件。然而不同的點(diǎn)在于,GPT 更加封閉,目前它只開(kāi)放它想開(kāi)放的,開(kāi)發(fā)者可進(jìn)行定制開(kāi)發(fā)的權(quán)限相對(duì)受限。目前幾個(gè)大公司都在訓(xùn)練自己的大模型(操作系統(tǒng)),從市場(chǎng)競(jìng)爭(zhēng)的角度看,這也是必然。
在 GPT-4 發(fā)布時(shí),有人稱(chēng)其為 iPhone 時(shí)刻,因?yàn)?iPhone 重新定義了手機(jī),拉開(kāi)了移動(dòng)互聯(lián)網(wǎng)的序幕。也有人稱(chēng)其為個(gè)人計(jì)算機(jī)出現(xiàn)的時(shí)刻,它讓計(jì)算機(jī)不再是科研機(jī)構(gòu)的工具,而是之后人人都能用得上的電腦。這些類(lèi)比只是為了說(shuō)明,一個(gè) AI 大爆發(fā)的時(shí)候已經(jīng)來(lái)臨。
Midjourney
Midjourney:它是一個(gè)文字生成圖像的模型,使用方式是在 Discord 上進(jìn)入其頻道,然后向機(jī)器人發(fā)送想要生成圖片的文字描述。
Stable Diffusion
Stable Diffusion:它是一個(gè)開(kāi)源的文字生成圖像模型,正因?yàn)殚_(kāi)源,很多公司或個(gè)人基于它開(kāi)發(fā)出了一系列的產(chǎn)品或插件。目前使用最多的就是 Stable Diffusion WebUI,它讓普通用戶也可以在電腦上安裝 Stable Diffusion,然后啟動(dòng)可視化的界面,進(jìn)行文生圖操作,甚至訓(xùn)練自己的模型。
再打個(gè)比方,Midjourney 就像是沒(méi)有 App store 的 iOS(iPhone 的操作系統(tǒng)) ,只能使用,不可開(kāi)發(fā)。而 Stable Diffusion 就像是 Android(安卓操作系統(tǒng)),因其開(kāi)源,所以發(fā)展迅速。
自然語(yǔ)言處理
(Natural Language Processing,簡(jiǎn)稱(chēng) NLP):是 AI 領(lǐng)域的一個(gè)子領(lǐng)域,旨在讓計(jì)算機(jī)能夠理解、處理、生成自然語(yǔ)言。
大語(yǔ)言模型(Large Language Model,簡(jiǎn)稱(chēng) LLM):是自然語(yǔ)言處理領(lǐng)域中的一種技術(shù)。LLM 可以基于深度學(xué)習(xí)算法構(gòu)建的模型,通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),可以對(duì)文本數(shù)據(jù)進(jìn)行學(xué)習(xí)和預(yù)測(cè)?!按蟆敝傅氖菂?shù)多、語(yǔ)料多。
特定語(yǔ)言模型(Specific Language Model):是一種針對(duì)特定語(yǔ)種和領(lǐng)域的自然語(yǔ)言處理模型。它在大語(yǔ)言模型的基礎(chǔ)上,使用特定領(lǐng)域的文本數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化,以提高模型在該領(lǐng)域中的預(yù)測(cè)和生成能力。
意圖檢測(cè)(Intention Detection):是 NLP 領(lǐng)域的一種技術(shù),旨在識(shí)別和理解用戶在一段文本中的意圖。在應(yīng)用中,意圖識(shí)別通常與語(yǔ)音識(shí)別和語(yǔ)音合成等技術(shù)相結(jié)合,以實(shí)現(xiàn)智能對(duì)話和交互。
實(shí)體檢測(cè)(Entity Detection):同樣是 NLP 領(lǐng)域的一種技術(shù),旨在從文本中識(shí)別出具有特定意義的實(shí)體,例如人名、地名、組織機(jī)構(gòu)、日期、數(shù)字等。
LLaMA
LLaMA (Large Language Model Meta AI) 是 Meta 于2月25日首次推出的大型語(yǔ)言模型,相當(dāng)于超快超小型GPT-3,參數(shù)量只有后者的10%,只需要單張 GPU 就能運(yùn)行。與 OpenAI 的 GPT-3 相比,Meta 在一開(kāi)始就將 LLaMA 定位成一個(gè)“開(kāi)源的研究工具”,該模型所使用的是各類(lèi)公開(kāi)可用的數(shù)據(jù)集(例如 Common Crawl、維基百科以及 C4)。LLaMA 的模型架構(gòu)基于 Transformer 有三項(xiàng)改動(dòng):前置 normalization、SwiGLU 激活函數(shù)和旋轉(zhuǎn)位置編碼。得益于模塊化特性,用戶可以通過(guò)模塊組合的方式構(gòu)成各種模型,也可以通過(guò)復(fù)用已有的模塊進(jìn)行少量修改來(lái)實(shí)現(xiàn)新的模型。
PaLM
Pathways 是 Google Brain 團(tuán)隊(duì)開(kāi)發(fā)的大型語(yǔ)言模型,是一個(gè)密集激活的 Transformer 語(yǔ)言模型,擁有 5400 億個(gè)參數(shù),能夠在多個(gè) TPU Pods 上進(jìn)行高效的訓(xùn)練。PaLM 在各種自然語(yǔ)言任務(wù)中使用 few-shot 學(xué)習(xí)取得了顯著的性能,這極大地減少了使模型適應(yīng)特定應(yīng)用所需的特定任務(wù)訓(xùn)練實(shí)例的數(shù)量。
Pathways 的目標(biāo)是通過(guò)將自然語(yǔ)言處理(NLP)和計(jì)算機(jī)視覺(jué)(CV)技術(shù)相結(jié)合,使計(jì)算機(jī)能夠理解和處理人類(lèi)語(yǔ)言和圖像。Pathways 的設(shè)計(jì)旨在解決現(xiàn)有系統(tǒng)的許多弱點(diǎn),并綜合它們的優(yōu)點(diǎn)。
通用人工智能(Artificial General Intelligence,AGI)
與目前大多數(shù)人工智能系統(tǒng)只能解決特定領(lǐng)域的問(wèn)題不同,AGI 可以具有類(lèi)似人類(lèi)的智能,能夠在多個(gè)領(lǐng)域中學(xué)習(xí)和應(yīng)用知識(shí),處理和理解不同類(lèi)型的信息,并具備自我學(xué)習(xí)和自我改進(jìn)的能力。AGI 被認(rèn)為是人工智能領(lǐng)域中最具挑戰(zhàn)性和最具科學(xué)意義的目標(biāo)之一。
圖靈測(cè)試(Turing Test)
一種測(cè)試人工智能是否具有智能的標(biāo)準(zhǔn)之一,由英國(guó)計(jì)算機(jī)科學(xué)家圖靈在 1950 年提出。