Essential Math for AI(機(jī)翻)-第二章(1/3)
第2章 數(shù)據(jù),數(shù)據(jù),數(shù)據(jù)
也許如果我知道這些數(shù)據(jù)從哪里來,為什么存在,我就會知道它們都走向何方,為什么會這樣。
數(shù)據(jù)是驅(qū)動大多數(shù)AI系統(tǒng)的燃料。在本章中,我們將了解如何處理數(shù)據(jù)以及設(shè)計(jì)從數(shù)據(jù)中提取有用且可操作信息的方法,這是感知AI的核心。 感知AI基于從數(shù)據(jù)中進(jìn)行統(tǒng)計(jì)學(xué)習(xí),其中AI代理或機(jī)器從環(huán)境中感知數(shù)據(jù),然后檢測這些數(shù)據(jù)中的模式,從而使其得出結(jié)論和/或做出決策。
感知AI與其他三種AI不同:
理解AI
其中AI系統(tǒng)理解它將圖像分類為椅子是用于坐的功能,它將圖像分類為癌癥意味著該人生病并需要進(jìn)一步的醫(yī)學(xué)關(guān)注,或者它閱讀的關(guān)于線性代數(shù)的教科書可以用于從數(shù)據(jù)中提取有用的信息。
控制AI
這涉及控制AI代理的物理部分,以便在空間中導(dǎo)航、開門、倒咖啡等。機(jī)器人在這方面取得了重大進(jìn)展。我們需要用包括感知AI和理解AI的“大腦”來增強(qiáng)機(jī)器人,并將它們連接到控制AI。理想情況下,像人類一樣,控制AI通過將信息傳遞給感知和理解系統(tǒng),從而從與環(huán)境的物理互動中學(xué)習(xí),這些系統(tǒng)又將控制命令傳遞給代理的控制系統(tǒng)。
意識AI
在這里,AI代理具有類似于人類體驗(yàn)的內(nèi)在體驗(yàn)。由于我們還不知道如何數(shù)學(xué)定義意識,因此在本書中根本不涉及這個概念。
理想情況下,真正的人類智能結(jié)合了這四個方面:感知、理解、控制和意識。本章以及接下來的幾章的主要關(guān)注點(diǎn)是感知AI回想一下,AI和數(shù)據(jù)已經(jīng)相互交織到如今常見的、盡管是錯誤的,將數(shù)據(jù)科學(xué)和AI視為同義詞的程度。
AI數(shù)據(jù)
在許多流行的機(jī)器學(xué)習(xí)模型中,包括高度成功的神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)在2012年的AlexNet中將人工智能帶回了公眾的視線,其中的核心是一個非常簡單的數(shù)學(xué)問題:將給定的數(shù)據(jù)點(diǎn)適配到恰當(dāng)?shù)暮瘮?shù)中(將輸入映射到輸出),從中提取出重要的信號并忽略噪聲,然后確保此函數(shù)在新數(shù)據(jù)上表現(xiàn)良好。
然而,復(fù)雜性和挑戰(zhàn)來自于不同的來源:
假設(shè)和特征
我們不知道生成數(shù)據(jù)的真實(shí)函數(shù)或它實(shí)際依賴的所有特征。我們只是觀察數(shù)據(jù),然后嘗試估計(jì)生成它的假設(shè)函數(shù)。我們的函數(shù)試圖學(xué)習(xí)哪些數(shù)據(jù)特征對我們的預(yù)測、分類、決策或一般目的很重要。它還學(xué)習(xí)這些特征如何相互作用以產(chǎn)生觀察到的結(jié)果。AI在這方面的巨大潛力之一是它能夠捕捉到人類不容易注意到的數(shù)據(jù)特征之間的微妙相互作用,因?yàn)槲覀兒苌瞄L觀察強(qiáng)特征,但可能會忽略更微妙的特征。例如,我們?nèi)祟惪梢钥闯鲆粋€人的月收入影響其償還貸款的能力,但我們可能不會注意到他們的日常通勤或早晨習(xí)慣也會有非常重要的影響。某些特征交互比其他交互簡單得多,如線性交互。其他交互則更加復(fù)雜,是非線性的。從數(shù)學(xué)的角度來看,無論我們的特征交互是簡單的(線性)還是復(fù)雜的(非線性),我們的目標(biāo)都是相同的:找到適合您的數(shù)據(jù)并能夠在新數(shù)據(jù)上做出良好預(yù)測的假設(shè)函數(shù)。這里還有一個額外的復(fù)雜問題:有許多假函數(shù)可以擬合相同的數(shù)據(jù)集,我們?nèi)绾沃肋x擇哪一個?
性能
即使計(jì)算出適合我們的數(shù)據(jù)的假設(shè)函數(shù),我們?nèi)绾沃浪谛碌暮臀唇?jīng)見過的數(shù)據(jù)上表現(xiàn)良好?我們?nèi)绾沃肋x擇哪個性能度量,以及在部署到真實(shí)世界后如何監(jiān)控這種性能?現(xiàn)實(shí)世界中的數(shù)據(jù)和場景并沒有全部用基準(zhǔn)標(biāo)記,因此我們不能輕易地衡量我們的AI系統(tǒng)是否表現(xiàn)良好并做出正確或合適的預(yù)測和決策。我們不知道衡量AI系統(tǒng)結(jié)果的標(biāo)準(zhǔn)。如果現(xiàn)實(shí)世界中的數(shù)據(jù)和場景都帶有基準(zhǔn),那么我們所有人都會失業(yè),因?yàn)槲覀儠涝诿糠N情況下該怎么做,地球上就會和平,我們將幸福地生活(事實(shí)上不是這樣,我希望它能這么簡單)。
數(shù)量
AI領(lǐng)域中幾乎所有的東西都是高維的!數(shù)據(jù)實(shí)例的數(shù)量,觀察到的特征以及要計(jì)算的未知權(quán)重可能在百萬級別,所需的計(jì)算步驟可能在十億級別。在這樣的數(shù)據(jù)量上進(jìn)行有效的存儲、傳輸、探索、預(yù)處理、結(jié)構(gòu)化和計(jì)算是中心目標(biāo)。此外,探索所涉及的高維數(shù)學(xué)函數(shù)的景觀是一項(xiàng)非常復(fù)雜的任務(wù)。
結(jié)構(gòu)
現(xiàn)代世界創(chuàng)造的大部分?jǐn)?shù)據(jù)都是非結(jié)構(gòu)化的。它沒有組織成易于查詢的表格,其中包含標(biāo)記字段,如姓名、電話號碼、性別、年齡、郵政編碼、房價、收入水平等。非結(jié)構(gòu)化數(shù)據(jù)無處不在:社交媒體帖子、用戶活動、文字文檔、PDF文件、圖像、音頻和視頻文件、協(xié)作軟件數(shù)據(jù)、交通或地震或天氣數(shù)據(jù)、GPS、軍事行動、電子郵件、即時消息、移動聊天數(shù)據(jù)等等。其中一些例子,如電子郵件數(shù)據(jù),可以被認(rèn)為是半結(jié)構(gòu)化的,因?yàn)殡娮余]件附帶的標(biāo)題包括電子郵件的元數(shù)據(jù):發(fā)件人、收件人、日期、時間、主題、內(nèi)容類型、垃圾郵件狀態(tài)等。此外,大量重要的數(shù)據(jù)不以數(shù)字格式提供,并分散在多個不相互通信的數(shù)據(jù)庫中。這里的例子包括歷史軍事數(shù)據(jù)、博物館檔案和醫(yī)院記錄。目前,我們的世界和城市數(shù)字化的勢頭很大,以利用更多的AI應(yīng)用程序??傮w而言,從結(jié)構(gòu)化和標(biāo)記數(shù)據(jù)中獲取見解比從非結(jié)構(gòu)化數(shù)據(jù)中獲取見解容易。挖掘非結(jié)構(gòu)化數(shù)據(jù)需要創(chuàng)新的技術(shù),這些技術(shù)目前是數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能領(lǐng)域的推動力量。
真實(shí)數(shù)據(jù)與模擬數(shù)據(jù)
當(dāng)我們處理數(shù)據(jù)時,了解真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)之間的區(qū)別非常重要。這兩種類型的數(shù)據(jù)對于人類的發(fā)現(xiàn)和進(jìn)步都非常有價值。
真實(shí)數(shù)據(jù)
這些數(shù)據(jù)是通過對現(xiàn)實(shí)世界的觀察收集的,使用測量設(shè)備、傳感器、調(diào)查、結(jié)構(gòu)化表格(如醫(yī)學(xué)問卷)、望遠(yuǎn)鏡、成像設(shè)備、網(wǎng)站、股票市場、受控實(shí)驗(yàn)等手段。由于測量方法和儀器的不準(zhǔn)確性和失效,這些數(shù)據(jù)通常是不完美且有噪聲的。從數(shù)學(xué)上講,我們并不知道生成實(shí)際數(shù)據(jù)的確切函數(shù)或概率分布,但我們可以使用模型、理論和模擬對其進(jìn)行假設(shè)。然后,我們可以測試我們的模型,并最終使用它們進(jìn)行預(yù)測。
模擬數(shù)據(jù)
這是使用已知函數(shù)生成的數(shù)據(jù),或者從已知概率分布中隨機(jī)抽樣的數(shù)據(jù)。在這里,我們有已知的數(shù)學(xué)函數(shù)或模型,然后將數(shù)值插入模型以生成數(shù)據(jù)點(diǎn)。例子有很多:模擬各種自然現(xiàn)象的偏微分方程的數(shù)值解,這些現(xiàn)象涉及各種不同的尺度,例如湍流流動、蛋白質(zhì)折疊、熱擴(kuò)散、化學(xué)反應(yīng)、行星運(yùn)動、斷裂材料、交通等等,甚至還包括增強(qiáng)迪士尼電影動畫,如模擬《海洋奇緣》中的自然水流動,或者《冰雪奇緣》中艾爾莎的頭發(fā)運(yùn)動。
在本章中,我們通過兩個關(guān)于人類身高和體重數(shù)據(jù)的例子來展示真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)之間的差異。在第一個例子中,我們訪問一個在線公共數(shù)據(jù)庫,然后下載和探索兩個包含真實(shí)個體身高和體重測量的真實(shí)數(shù)據(jù)集。在第二個例子中,我們基于一個我們假設(shè)的函數(shù)模擬我們自己的身高和體重數(shù)據(jù)集:我們假設(shè)一個人的體重與他們的身高呈線性關(guān)系。這意味著當(dāng)我們將體重數(shù)據(jù)與身高數(shù)據(jù)進(jìn)行繪圖時,我們期望看到一條直線或平坦的視覺模式。
數(shù)學(xué)模型:線性與非線性
線性依賴模型描繪了世界上的平坦性,如一維直線、二維平面(稱為平面)和高維超平面。線性函數(shù)的圖形,表示線性依賴關(guān)系,始終是平坦的,不會彎曲。每當(dāng)你看到一個平坦的物體,如桌子、棒子、天花板或一系列數(shù)據(jù)點(diǎn)緊密圍繞一條直線或平面時,你就知道它們的代表函數(shù)是線性的。任何不平坦的東西都是非線性的,所以圖形彎曲的函數(shù)是非線性的聚集在彎曲曲線或曲面周圍的數(shù)據(jù)點(diǎn)是由非線性函數(shù)生成的。
表示函數(shù)輸出與特征或變量之間的線性依賴關(guān)系的線性函數(shù)公式非常容易寫出。在公式中,特征本身不帶有冪或根,也沒有嵌套在函數(shù)中,如分?jǐn)?shù)的分母、正弦、余弦、指數(shù)、對數(shù)或其他微積分函數(shù)。它們只能被標(biāo)量(實(shí)數(shù)或復(fù)數(shù),而非向量或矩陣)相乘,并相互相加或相減。例如,一個與三個特征 x1、x2 和 x3 線性相關(guān)的函數(shù)可以寫成:

其中參數(shù)ω0、ω1、ω2 和 ω3 是標(biāo)量數(shù)。 權(quán)重ω1、ω2 和 ω3 線性組合特征, 在添加偏置項(xiàng)ω0 后得到 f(x1, x2, x3) 的結(jié)果。 換句話說, 結(jié)果是由特征 x1、x2 和 x3 之間的線性相互作用以及偏置產(chǎn)生的。
表示函數(shù)輸出與特征之間的非線性依賴關(guān)系的非線性函數(shù)公式也非容易識別。 一個或多個特征以 1 以外的冪出現(xiàn)在函數(shù)公式中, 或者與其他特征相乘或相除, 或嵌套在其他微積分函數(shù)中, 如正弦、余弦、指數(shù)、對數(shù)等。 以下是三個關(guān)于三個特征x1、x2 和 x3 的非線性函數(shù)的示例:

如您所見,我們可以提出各種非線性函數(shù),與我們能做什么以及我們可以使用非線性相互作用對多少世界進(jìn)行建模的可能性是無限的。實(shí)際上,神經(jīng)網(wǎng)絡(luò)之所以成功,是因?yàn)樗鼈兡軌虿蹲降綌?shù)據(jù)特征之間相關(guān)的非線性相互作用。
在整本書中,我們將使用先前的符號和術(shù)語,因此您將非常熟悉線性組合、權(quán)重、特征以及特征之間的線性和非線性相互作用等術(shù)語。
一個真實(shí)數(shù)據(jù)的例子
您可以在以下兩個示例中找到用于研究數(shù)據(jù)并生成圖形的Python代碼,這些代碼位于本書的GitHub頁面上。(https://github.com/halanelson/Essential-Math-For-AI)
結(jié)構(gòu)化數(shù)據(jù)
我們在這里將使用的關(guān)于身高、體重和性別的兩個數(shù)據(jù)集是結(jié)構(gòu)化數(shù)據(jù)集的例子。它們以行和列的形式組織。列包含特征,例如體重、身高、性別、健康指數(shù)等。行包含每個數(shù)據(jù)實(shí)例的特征分?jǐn)?shù),即在這種情況下,每個人的特征分?jǐn)?shù)。另一方面,一堆音頻文件、Facebook帖子、圖像或視頻等數(shù)據(jù)集都是非結(jié)構(gòu)化數(shù)據(jù)集的例子。
我從Kaggle網(wǎng)站下載了兩個數(shù)據(jù)科學(xué)家的數(shù)據(jù)集。這兩個數(shù)據(jù)集都包含了一定數(shù)量的個體的身高、體重和性別信息。我的目標(biāo)是了解一個人的體重如何取決于他們的身高。從數(shù)學(xué)上講,我想寫一個將體重表示為一個特征(即身高)的函數(shù)的公式:

這樣,如果有人給我一個新人的身高,我就能預(yù)測他們的體重。當(dāng)然,除了身高之外,一個人的體重還取決于其他特征,比如性別、飲食習(xí)慣、鍛煉習(xí)慣、遺傳傾向等。然而,對于我下載的數(shù)據(jù)集,我們只有身高、體重和性別數(shù)據(jù)。除非我們想要尋找更詳細(xì)的數(shù)據(jù)集,或者出去收集新數(shù)據(jù),否則我們只能用現(xiàn)有的數(shù)據(jù)。此外,本例的目標(biāo)僅僅是說明真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)之間的區(qū)別。當(dāng)我們有更復(fù)雜的目標(biāo)時,我們可以處理具有更多特征的更復(fù)雜的數(shù)據(jù)集。
對于第一個數(shù)據(jù)集(https://oreil.ly/aaSEl),我將體重列與身高列繪制在圖2-1中,得到的結(jié)果似乎完全沒有規(guī)律!

對于第二個數(shù)據(jù)集(https://oreil.ly/8bE36),我做了同樣的操作,在圖2-2中我可以直觀地觀察到明顯的線性依賴關(guān)系。數(shù)據(jù)點(diǎn)似乎聚集在一條直線附近! 那么,這是怎么回事?為什么我的第一個真實(shí)數(shù)據(jù)集沒有反映出人的身高和體重之間的任何依賴關(guān)系,而第二個數(shù)據(jù)集卻反映出線性依賴關(guān)系呢?我們需要深入了解數(shù)據(jù)。
這是處理真實(shí)數(shù)據(jù)的諸多挑戰(zhàn)之一。我們不知道是什么函數(shù)生成了數(shù)據(jù),也不知道為什么數(shù)據(jù)呈現(xiàn)出這樣的樣子。我們調(diào)查、獲取洞察、檢測模式(如果有的話),然后提出一個假設(shè)函數(shù)。接著我們測試我們的假設(shè),如果根據(jù)我們精心設(shè)計(jì)的性能度量表現(xiàn)良好,我們就將其部署到現(xiàn)實(shí)世界中。我們使用已部署的模型進(jìn)行預(yù)測,直到新數(shù)據(jù)告訴我們我們的假設(shè)不再有效。在這種情況下,我們會研究更新的數(shù)據(jù)并提出新的假設(shè)。只要我們的模型還在使用,這個過程和反饋循環(huán)就會繼續(xù)進(jìn)行。

在繼續(xù)討論模擬數(shù)據(jù)之前,讓我們解釋為什么第一個數(shù)據(jù)集似乎對個體的身高和體重之間的關(guān)系沒有任何見解。在進(jìn)一步檢查后,我們注意到該數(shù)據(jù)集中4和5分的個體過多,這些分?jǐn)?shù)分別表示肥胖和極度肥胖。因此,我決定按指數(shù)得分拆分?jǐn)?shù)據(jù),并繪制所有具有相似指數(shù)得分的個體的體重與身高的關(guān)系。這一次,在圖2-3中,身高和體重之間的線性依賴關(guān)系顯而易見,謎團(tuán)得以解開。通過根據(jù)個體的指數(shù)得分進(jìn)行條件處理,這可能會讓人覺得我們在作弊,追求線性關(guān)系。但在數(shù)據(jù)探索的名義下,一切都是公平的。

現(xiàn)在我們可以放心地假設(shè),體重與身高呈線性關(guān)系:

當(dāng)然,我們還需要尋找合適的ω0和ω1參數(shù)值。第3章將教我們?nèi)绾巫龅竭@一點(diǎn)。實(shí)際上,機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))的大部分活動都是從數(shù)據(jù)中學(xué)習(xí)這些ω值。在我們這個非常簡單的例子中,我們只需要學(xué)習(xí)兩個ω值,因?yàn)槲覀冎挥幸粋€特征,即身高,并且在觀察到真實(shí)數(shù)據(jù)中的線性模式后,我們假設(shè)線性依賴關(guān)系。在接下來的幾章中,我們將遇到一些需要學(xué)習(xí)數(shù)百萬個ω值的深度學(xué)習(xí)網(wǎng)絡(luò),然而我們將看到,問題的數(shù)學(xué)結(jié)構(gòu)實(shí)際上與我們將在第3章學(xué)到的結(jié)構(gòu)完全相同。
模擬數(shù)據(jù)的一個例子
在這個例子中,我模擬了自己的身高體重數(shù)據(jù)集。模擬我們自己的數(shù)據(jù)可以避免從網(wǎng)絡(luò)、現(xiàn)實(shí)世界甚至建立實(shí)驗(yàn)室以解決受控測量遇到的麻煩。當(dāng)所需數(shù)據(jù)不可用或者獲取成本非常高時,這是非常有價值的。它還可以通過僅改變函數(shù)中的數(shù)字來測試不同的情景,而不是創(chuàng)建新材料或建立實(shí)驗(yàn)室并進(jìn)行新的實(shí)驗(yàn)。模擬數(shù)據(jù)非常方便,因?yàn)槲覀冎恍枰粋€數(shù)學(xué)函數(shù),如果我們想要涉及隨機(jī)性和/或噪聲,還需要一個概率分布,以及一臺計(jì)算機(jī)。?
讓我們再次假設(shè)身高和體重之間存在線性依賴關(guān)系,所以我們將使用的函數(shù)是:

為了能夠模擬數(shù)值(height, weight)對,數(shù)據(jù)點(diǎn),我們必須為參數(shù)ω0和ω1假定數(shù)值。在沒有從真實(shí)數(shù)據(jù)中了解到這些ω值的正確選擇的情況下,我們只能根據(jù)問題的背景進(jìn)行有根據(jù)的猜測,并嘗試不同的值。注意,在本例中的身高體重案例中,我們碰巧擁有可以用來學(xué)習(xí)ω值的合適取值的真實(shí)數(shù)據(jù),第3章的目標(biāo)之一就是學(xué)習(xí)如何做到這一點(diǎn)。然而,在許多其他情況下,我們沒有真實(shí)數(shù)據(jù),所以唯一的辦法就是嘗試這些ω值的各種數(shù)值。
在以下模擬中,我們設(shè)置 ω0 = -314.5 和 ω1 = 7.07,因此函數(shù)變?yōu)椋?/p>
現(xiàn)在我們可以生成盡可能多的數(shù)值(身高、體重)對。例如,將height=60代入體重函數(shù)公式,我們得到weight = -314.5 + 7.07 × 60 = 109.7。因此,我們的線性模型預(yù)測身高為60英寸的人體重為109.7磅,我們可以在身高-體重圖上繪制的數(shù)據(jù)點(diǎn)坐標(biāo)為(60,109.7)。在圖2-4中,我們生成了5000個這樣的數(shù)據(jù)點(diǎn):我們?yōu)樯砀哌x擇54至79英寸之間的5000個值,并將它們代入體重函數(shù)。我們注意到,圖2-4中的圖形是一條完美的直線,模擬數(shù)據(jù)中沒有噪聲或變化,因?yàn)槲覀儧]有將它們納入我們的線性模型。
這是模擬數(shù)據(jù)的一個特點(diǎn):它會按照生成它的函數(shù)所做的那樣執(zhí)行。如果我們理解了用于構(gòu)建模擬的函數(shù)(稱為模型),并且我們的計(jì)算不會積累太多的數(shù)值誤差或失控的非常大的數(shù)值,那么我們就能理解模型生成的數(shù)據(jù),并可以以我們認(rèn)為合適的方式使用這些數(shù)據(jù)。這里沒有太多的驚喜空間。在我們的例子中,我們提出的函數(shù)是線性的,所以它的方程是一條直線,如圖2-4所示,生成的數(shù)據(jù)完美地落在這條直線上。

如果我們想模擬更真實(shí)的身高和體重數(shù)據(jù)呢?那么我們可以從人類人口身高更真實(shí)的分布中抽取身高值:鐘形的正態(tài)分布!同樣,我們知道我們抽樣所依據(jù)的概率分布,這與真實(shí)數(shù)據(jù)的情況不同。在我們抽取身高值之后,我們將其代入體重的線性模型,然后加入一些噪聲,因?yàn)槲覀兿MM數(shù)據(jù)更加真實(shí)。由于噪聲具有隨機(jī)性質(zhì),我們還必須選擇它將從哪個概率分布中抽取。我們再次選擇鐘形的正態(tài)分布,但我們本可以選擇均勻分布來模擬均勻隨機(jī)波動。我們更真實(shí)的身高體重模型變?yōu)椋?br>

我們得到了圖2-5中所展示的結(jié)果。

現(xiàn)在將包含我們模擬的身高-體重數(shù)據(jù)的圖2-5與包含我們使用的第二個數(shù)據(jù)集中5000名女性的真實(shí)身高-體重數(shù)據(jù)的圖2-6進(jìn)行比較??紤]到生成這些數(shù)據(jù)只需要五分鐘的編碼時間,而不是收集真實(shí)數(shù)據(jù),這個比較還不算太糟糕!如果我們花更多時間調(diào)整我們的ω值,以及我們添加的正態(tài)分布噪聲的參數(shù)(均值和標(biāo)準(zhǔn)差),我們會得到一個更好看的模擬數(shù)據(jù)集。然而,我們將在此結(jié)束這個模擬,因?yàn)楹芸煳覀兊恼麄€關(guān)注點(diǎn)將集中在學(xué)習(xí)我們假設(shè)模型的適當(dāng)參數(shù)值上。

數(shù)學(xué)模型:仿真與人工智能
我們總是可以調(diào)整我們的數(shù)學(xué)模型,使它們更接近現(xiàn)實(shí)。我們是設(shè)計(jì)者,所以我們決定這些模型中包含的內(nèi)容。通常情況下,模型越是模仿自然,就會包含越多的數(shù)學(xué)對象。因此,在建立數(shù)學(xué)模型時,通常需要在接近現(xiàn)實(shí)、模型的簡單性和可計(jì)算性之間進(jìn)行權(quán)衡。不同的設(shè)計(jì)者會提出不同的數(shù)學(xué)模型,有些模型比其他模型更能捕捉到某些現(xiàn)象。隨著對捕捉自然行為的探索不斷深入,這些模型將不斷改進(jìn)和發(fā)展。值得慶幸的是,我們的計(jì)算能力在過去的幾十年里得到了顯著提高,使我們能夠創(chuàng)建和測試更復(fù)雜、更真實(shí)的數(shù)學(xué)模型。
自然既細(xì)致入微又浩瀚無垠。自然中的相互作用范圍從亞原子的量子領(lǐng)域一直到星際尺度。我們作為人類,一直在努力理解自然,捕捉其錯綜復(fù)雜的組成部分以及它們之間多的相互聯(lián)系和相互影響。我們這樣做的原因各種各樣,包括對生命和宇宙起源的純粹好奇、創(chuàng)造新技術(shù)、增強(qiáng)通信系統(tǒng)、設(shè)計(jì)藥物和發(fā)現(xiàn)疾病治愈方法、建造武器和防御系統(tǒng),以及前往遠(yuǎn)的星球,甚至在未來可能居住在那里。數(shù)學(xué)模型為我們提供了一種極好且?guī)缀跎衿娴姆椒?,用?shù)字、函數(shù)、方程以及在面對不確定性時通過概率引入量化的隨機(jī)性來描述自然的所有細(xì)節(jié)。計(jì)算模擬這些數(shù)學(xué)模型使我們能夠研究和可視化建模系統(tǒng)或現(xiàn)象的各種簡單和復(fù)雜行為。反過來,計(jì)算機(jī)模擬的洞察力有助于模型的改進(jìn)和設(shè)計(jì),同時還提供了更深入的數(shù)學(xué)見解。這種極積極的反饋循環(huán)使得數(shù)學(xué)建模和模擬成為一種不可或缺的工具,隨著我們計(jì)算能力的增強(qiáng),這種工具的作用得到了極大的提高。
這是宇宙的一個奧秘,即其各種現(xiàn)象可以用數(shù)學(xué)這種抽象語言準(zhǔn)確地建模。而人類思維的奇跡在于能夠發(fā)現(xiàn)和理解數(shù)學(xué),以及構(gòu)建功能強(qiáng)大的技術(shù)設(shè)備,這些設(shè)備適用于各種應(yīng)用。同樣令人印象深刻的是,這些設(shè)備在其核心上僅僅是在計(jì)算或傳輸數(shù)學(xué),更具體地說,是一堆零和一。
人類能夠?qū)唵螖?shù)字的理解推廣到各種規(guī)模的自然現(xiàn)象的數(shù)學(xué)建模和應(yīng)用,這是對所學(xué)知識進(jìn)行概括的一個壯觀例子,也是人類智能的標(biāo)志。在AI領(lǐng)域,通用AI(類人和超級AI)和窄AI(特定任務(wù)導(dǎo)向)的共同目標(biāo)是泛化:AI代理將所學(xué)能力泛化到新的和未知的情境。在第三章中,我們將了解窄AI和任務(wù)導(dǎo)向AI的這一原則:AI代理從數(shù)據(jù)中學(xué)習(xí),然后為新的和未見過的數(shù)據(jù)生成良好的預(yù)測。AI與數(shù)學(xué)模型和模擬交互有三種方式:
數(shù)學(xué)模型和模擬為AI系統(tǒng)提供訓(xùn)練數(shù)據(jù)。
自動駕駛汽車被一些人認(rèn)為是AI的一個基準(zhǔn)測試。在汽車的AI系統(tǒng)學(xué)會這些是需要避免的不利事件之前,讓智能汽車原型駛下懸崖、撞上行人或撞入新的工作區(qū)將是非常不便的。在這里,使用模擬數(shù)據(jù)進(jìn)行訓(xùn)練尤為有價值,因?yàn)槟M可以在將汽車投放到道路上之前,為汽車創(chuàng)造各種危險的虛擬情境進(jìn)行訓(xùn)練。同樣,模擬數(shù)據(jù)對于火星探測器、藥物發(fā)現(xiàn)、材料設(shè)計(jì)、天氣預(yù)報、航空、軍事訓(xùn)練等領(lǐng)域的AI系統(tǒng)培訓(xùn)也非常有幫助。
AI增強(qiáng)了現(xiàn)有的數(shù)學(xué)模型和模擬。
AI在很多傳統(tǒng)上對數(shù)學(xué)模型和模擬具有挑戰(zhàn)性和限制的領(lǐng)域具有很大的潛力,例如學(xué)習(xí)模型中涉及的參數(shù)的適當(dāng)值、適當(dāng)?shù)母怕史植?、離散化方程時的網(wǎng)格形狀和大?。?xì)網(wǎng)格捕捉各種空間和時間尺度的細(xì)節(jié)和微妙行為),以及將計(jì)算方法擴(kuò)展到更長的時間或具有復(fù)雜形狀的更大領(lǐng)域。諸如導(dǎo)航、航空、金融、材料科學(xué)、流體動力學(xué)、運(yùn)籌學(xué)、分子和核科學(xué)、大氣和海洋科學(xué)、天體物理學(xué)、物理和網(wǎng)絡(luò)安全等領(lǐng)域都嚴(yán)重依賴數(shù)學(xué)建模和模擬。將AI能力整合到這些領(lǐng)域已經(jīng)開始取得非常積極的成果。在本書后面的章節(jié)中,我們將看到AI增強(qiáng)模擬的例子。
AI本身就是一個數(shù)學(xué)模型和模擬。
AI的一個重大愿景是計(jì)算地復(fù)制人類智能。成功的機(jī)器學(xué)習(xí)系統(tǒng),包括所有架構(gòu)和變體的神經(jīng)網(wǎng)絡(luò),都是旨在模擬人類智能相關(guān)任務(wù)的數(shù)學(xué)模型,例如視覺、模式識別和泛化、自然語言交流和邏輯推理。理解、情感體驗(yàn)、同情心和協(xié)作也與智能相關(guān),并為人類的成功和統(tǒng)治做出了巨大貢獻(xiàn),因此,如果我們想實(shí)現(xiàn)通用AI,同時深入了解智能的本質(zhì)和人腦的工作原理,我們也必須找到復(fù)制它們的方法。這些領(lǐng)域的努力已經(jīng)在進(jìn)行中。我們要牢記的是,在所有這些領(lǐng)域,機(jī)器所做的都是計(jì)算。機(jī)器計(jì)算文檔的含義以進(jìn)行自然語言處理,組合和計(jì)算數(shù)字圖像像素以進(jìn)行計(jì)算機(jī)視覺,將音頻信號轉(zhuǎn)換為數(shù)字向量并計(jì)算新音頻以進(jìn)行人機(jī)交互等。因此,很容易看出軟件AI是一個大型數(shù)學(xué)模型和模擬。隨著我們在本書的深入,這一點(diǎn)將變得更加明顯。