Essential Math for AI(機翻)

第1章 為什么學(xué)習(xí)AI的數(shù)學(xué)?
直到有人說:“這是智能的,”我才停止尋找,并開始關(guān)注。 —H.
人工智能,簡稱AI,已經(jīng)來到我們身邊。它已經(jīng)滲透到我們生活的方方面面,并越來越多地參與到重要決策的制定中。很快,它將在我們社會的每個領(lǐng)域得到應(yīng)用,支持我們大部分的日常操作。這項技術(shù)正在迅速發(fā)展,投資也在飛速增長。與此同時,我們似乎正身處一個AI狂潮之中。每天我們都會聽到關(guān)于AI新的成就:AI在圍棋比賽中擊敗了最優(yōu)秀的人類選手;AI在分類任務(wù)中表現(xiàn)超過了人類視覺;AI制作了深度偽造;AI生成了高能物理數(shù)據(jù);AI解決了模擬自然現(xiàn)象的世界中的困難偏微分方程。自動駕駛汽車已經(jīng)上路,送貨無人機已經(jīng)在世界某些地區(qū)盤旋。
在這場狂潮中,現(xiàn)實、猜測、夸張、愿景和純粹的虛構(gòu)之間的界限變得模糊,我們首先需要至少在本書的背景下定義AI。然后我們將討論它的一些局限性,它的發(fā)展方向,并為當(dāng)今AI中使用的數(shù)學(xué)概念搭建舞臺。我希望當(dāng)你了解了這些數(shù)學(xué)知識后,能夠從一個相對深入的角度看待這個主題,使得虛構(gòu)、現(xiàn)實以及二者之間的模糊界限變得更加清晰。你還將學(xué)習(xí)到AI中最先進數(shù)學(xué)背后的主要思想,為你使用、改進甚至創(chuàng)建全新的AI系統(tǒng)提供必要的信心。
什么是AI?
至今,我還沒有遇到一個統(tǒng)一的AI定義。如果我們問兩位AI專家,我們會聽到兩個不同的答案。甚至如果我們在兩個不同的日子問同一個專家,他們可能會給出兩個不同的定義。這種不一致性和看似無法定義AI的原因是,直到現(xiàn)在,智能的定義還不清楚。智能是什么?是什么讓我們成為獨一無二的人類?是什么讓我們意識到自己的存在?我們大腦中的神經(jīng)元是如何聚集微小的電脈沖并將它們轉(zhuǎn)化為圖像、聲音、感覺和思想的?這些廣泛的話題吸引了哲學(xué)家、人類學(xué)家和神經(jīng)科學(xué)家數(shù)個世紀(jì)。在這本書中,我不會試圖深入探討這些問題。然而,我會從AI代理的角度來討論人工智能,并列出以下用于本書的定義原則。在2022年,一個AI代理可以包括以下一個或多個方面:
AI代理可以是純軟件,也可以有一個物理機器人身體。
AI代理可以針對特定任務(wù),也可以作為一個靈活的代理,探索和操縱其環(huán)境,有目標(biāo)或無目標(biāo)地建立知識。
AI代理通過經(jīng)驗學(xué)習(xí),即隨著對某項任務(wù)的實踐越多,它在執(zhí)行任務(wù)的能力會變得越來越好。
AI代理感知其環(huán)境,然后為這個環(huán)境構(gòu)建、更新和/或演變模型。
AI代理感知、建模、分析并作出有助于實現(xiàn)其目標(biāo)的決策。這個目標(biāo)可以是預(yù)先定義的、固定的,也可以是隨著輸入的增加而變化的。
AI代理理解因果關(guān)系,能夠區(qū)分模式和原因。
每當(dāng)一個AI的數(shù)學(xué)模型受到我們大腦工作方式的啟發(fā)時,我會指出類比,從而在不必定義它們的情況下,保持AI和人類智能的比較。盡管如今的AI與人類智能相去甚遠(yuǎn),除了特定任務(wù)如圖像分類、AlphaGo等,但近年來許多人類大腦已匯聚到AI領(lǐng)域,這個領(lǐng)域注定會在未來幾年取得增長和突破。
同樣重要的是要注意,有些人將人工智能、機器學(xué)習(xí)和數(shù)據(jù)科學(xué)這三個術(shù)語互相替換使用。這三個領(lǐng)域存在重疊,但它們并不相同。第四個非常重要但稍微不那么被炒作的領(lǐng)域是機器人學(xué),其中物理部件和運動技能必須融入學(xué)習(xí)和推理過程,將機械工程、電氣工程、生物工程與信息和計算機工程相結(jié)合。關(guān)于這些領(lǐng)域的互聯(lián)性的一個快速思考方式是:數(shù)據(jù)推動機器學(xué)習(xí)算法,而這些算法反過來為許多熱門的AI和/或機器人系統(tǒng)提供動力。本書中的數(shù)學(xué)知識對這四個領(lǐng)域都有用,只是使用比例不同。
簡而言之,AI的定義仍然是一個有爭議的話題,因為智能的定義尚不明確。在這本書中,我們通過描述AI代理的特性來探討人工智能。AI代理可以是軟件或具有物理機器人身體,可以專注于特定任務(wù)或靈活探索環(huán)境,通過經(jīng)驗學(xué)習(xí),感知并建模環(huán)境,并作出有助于實現(xiàn)其目標(biāo)的決策。人工智能、機器學(xué)習(xí)、數(shù)據(jù)科學(xué)和機器人學(xué)是相互關(guān)聯(lián)但不完全相同的領(lǐng)域,本書中的數(shù)學(xué)知識在不同程度上對這些領(lǐng)域都有幫助。
為什么現(xiàn)在AI如此受歡迎?
在過去的十年里,AI因成功結(jié)合以下幾個因素而引起了全球關(guān)注:
大量數(shù)據(jù)的產(chǎn)生和數(shù)字化 這可能包括文本數(shù)據(jù)、圖像、視頻、健康記錄、電子商務(wù)、網(wǎng)絡(luò)和傳感器數(shù)據(jù)。社交媒體和物聯(lián)網(wǎng)在這方面發(fā)揮了非常重要的作用,它們不斷傳輸大量的數(shù)據(jù)。
計算能力的進步 通過并行和分布式計算以及硬件創(chuàng)新,實現(xiàn)了大量復(fù)雜結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的高效且相對便宜的處理。
神經(jīng)網(wǎng)絡(luò)在處理大數(shù)據(jù)方面的最近成功 AI在某些任務(wù)上已經(jīng)超越了人類的表現(xiàn),如圖像識別和圍棋游戲。2012年,AlexNet贏得了ImageNet大規(guī)模視覺識別挑戰(zhàn)賽,這激發(fā)了卷積神經(jīng)網(wǎng)絡(luò)(由圖形處理單元支持)的大量活動;2015年,PReLU-Net(ResNet)首次在圖像分類上超越了人類。
當(dāng)我們研究這些因素時,我們意識到今天的AI與科幻小說中的AI并不相同。今天的AI以大數(shù)據(jù)(各種類型的數(shù)據(jù))、機器學(xué)習(xí)算法為核心,主要針對執(zhí)行單一任務(wù)的極致優(yōu)化,而不是根據(jù)周圍環(huán)境發(fā)展和適應(yīng)不同的智能類型和目標(biāo)。
AI能做什么?
AI可以成功應(yīng)用的領(lǐng)域和行業(yè)比AI專家能夠滿足的需求還要多。人類一直在努力實現(xiàn)流程自動化,而AI正好有望在大規(guī)模層面上實現(xiàn)這一目標(biāo)。大大小小的公司都有大量的原始數(shù)據(jù),他們希望分析這些數(shù)據(jù)并將其轉(zhuǎn)化為利潤、最佳策略和資源分配的洞察。醫(yī)療行業(yè)嚴(yán)重缺乏醫(yī)生,AI在這里有無數(shù)的應(yīng)用和無限的潛力。全球金融系統(tǒng)、股票市場和銀行業(yè)一直嚴(yán)重依賴我們做出良好的預(yù)測,當(dāng)這些預(yù)測失敗時,它們就會遭受巨大的損失。隨著我們計算能力的不斷提高,科學(xué)研究取得了顯著的進展,如今我們正處于一個新的黎明,AI的進步使得幾十年前被認(rèn)為是不可能的大規(guī)模計算成為可能。從電力網(wǎng)、交通、供應(yīng)鏈到森林和野生動物保護、抗擊世界饑荒、疾病和氣候變化,各個領(lǐng)域都需要高效的系統(tǒng)和運作。甚至在AI本身,人們也在尋求自動化,一個AI系統(tǒng)可以自發(fā)地決定最佳的流程、算法和參數(shù),直接為給定任務(wù)產(chǎn)生所需的結(jié)果,從而完全消除了人類監(jiān)督的需求。
AI代理的特定任務(wù)
在這本書中,在討論數(shù)學(xué)時,我將關(guān)注AI在特定任務(wù)中的熱門應(yīng)用領(lǐng)域。然而,有益的數(shù)學(xué)思想和技巧可以輕松地跨不同應(yīng)用領(lǐng)域進行轉(zhuǎn)移。這種看似容易且廣泛適用的原因是我們正處于AI實現(xiàn)的時代,這意味著處理某些任務(wù)的主要思想已經(jīng)被開發(fā)出來,只需稍作調(diào)整,就可以應(yīng)用于各種行業(yè)和領(lǐng)域。我們的AI主題和/或任務(wù)包括:
模擬和實際數(shù)據(jù) 我們的AI代理處理數(shù)據(jù),提供洞察力,并根據(jù)這些數(shù)據(jù)(使用數(shù)學(xué)和算法)做出決策。
大腦新皮質(zhì) AI中的神經(jīng)網(wǎng)絡(luò)是根據(jù)新皮質(zhì)或新大腦進行建模的。這是我們大腦負(fù)責(zé)高級功能的部分,如感知、記憶、抽象思維、語言、自愿的身體動作、決策、想象和意識。新皮質(zhì)有很多層,其中六層可以明顯區(qū)分。它具有很強的靈活性和學(xué)習(xí)能力。舊大腦和爬行動物大腦位于新皮質(zhì)之下,負(fù)責(zé)情感以及更基本和原始的生存功能,如呼吸、調(diào)節(jié)心跳、恐懼、侵略、性沖動等。舊大腦記錄導(dǎo)致良好或不良感覺的行為和經(jīng)驗,形成我們的情感記憶,影響我們的行為和未來行動。我們的AI代理以非?;镜姆绞侥7滦缕べ|(zhì),有時還模仿舊大腦。
計算機視覺 我們的AI代理通過攝像頭、傳感器等感知并識別其環(huán)境。它可以查看我們的日常圖片和視頻,到我們的MRI掃描,再到遙遠(yuǎn)星系的圖像。
自然語言處理?
我們的AI代理與其環(huán)境進行溝通,并自動執(zhí)行繁瑣且耗時的任務(wù),如文本摘要、語言翻譯、情感分析、文件分類和排序、為圖像添加標(biāo)題以及與用戶聊天。
金融系統(tǒng)?
我們的AI代理檢測我們?nèi)粘=灰字械钠墼p行為,評估貸款風(fēng)險,并提供關(guān)于我們金融習(xí)慣的24小時反饋和見解。
網(wǎng)絡(luò)和圖表?
我們的AI代理處理網(wǎng)絡(luò)和圖表數(shù)據(jù),如動物社交網(wǎng)絡(luò)、基礎(chǔ)設(shè)施網(wǎng)絡(luò)、專業(yè)合作網(wǎng)絡(luò)、經(jīng)濟網(wǎng)絡(luò)、交通網(wǎng)絡(luò)、生物網(wǎng)絡(luò)等等。
社交媒體?
我們的AI代理要感謝社交媒體提供了其學(xué)習(xí)所需的大量數(shù)據(jù)。作為回報,我們的AI代理試圖刻畫社交媒體用戶,識別他們的模式、行為和活躍網(wǎng)絡(luò)。
供應(yīng)鏈?
我們的AI代理是優(yōu)化專家。它幫助我們預(yù)測每個生產(chǎn)鏈級別的最佳資源需求和分配策略。它還尋找解決世界饑餓問題的方法。
調(diào)度和人員配置?
我們的AI代理方便我們的日常運作。
天氣預(yù)報?
我們的AI代理解決了用于天氣預(yù)報和預(yù)測的偏微分方程。
氣候變化?
我們的AI代理試圖應(yīng)對氣候變化。
教育?
我們的AI代理提供個性化的學(xué)習(xí)體驗。
道德?
我們的AI代理努力做到公平、平等、包容、透明、無偏見,并保護數(shù)據(jù)安全和隱私
AI的局限性是什么??
盡管AI取得了令人矚目的成就,并有很大的潛力改進或徹底改變整個行業(yè),但該領(lǐng)域仍需克服一些真正的局限。一些最緊迫的局限性包括:
智能?
當(dāng)前的AI甚至與我們?nèi)祟惇毺氐闹悄芟嗖钌踹h(yuǎn)。盡管AI在無數(shù)任務(wù)中表現(xiàn)得比人類更好,但它不能自然地切換并適應(yīng)新任務(wù)。例如,一個訓(xùn)練有素的識別圖像中的人類的AI系統(tǒng),在沒有重新訓(xùn)練的情況下無法識別貓,或者在不改變其架構(gòu)和算法的情況下無法生成文本。在關(guān)于AI的三種類型的背景下,我們到目前為止只部分實現(xiàn)了狹義人工智能,它具有有限的能力范圍。我們既沒有實現(xiàn)與人類能力相當(dāng)?shù)娜斯ねㄓ弥悄?,也沒有實現(xiàn)比人類更有能力的人工超級智能。此外,現(xiàn)今的機器無法體驗到任何美好的人類情感,如愛情、親密、幸福、自豪、尊嚴(yán)、關(guān)愛、悲傷、失落等等。模仿情感與真正體驗和給予情感是有區(qū)別的。在這個意義上,機器離取代人類還差得很遠(yuǎn)。
大量標(biāo)記數(shù)據(jù)?
大多數(shù)熱門AI應(yīng)用需要大量標(biāo)記的數(shù)據(jù),例如,MRI圖像可以標(biāo)記為癌癥或非癌癥,YouTube視頻可以標(biāo)記為兒童安全或不安全,或者房屋價格可以根據(jù)房屋所在區(qū)域、臥室數(shù)量、家庭收入中位數(shù)等特征獲得,這種情況下房屋價格就是標(biāo)簽。局限性在于,訓(xùn)練系統(tǒng)所需的數(shù)據(jù)通常不是現(xiàn)成的,獲取、標(biāo)記、維護或存儲數(shù)據(jù)都不便宜。大量的數(shù)據(jù)是機密的、無組織的、無結(jié)構(gòu)的、有偏見的、不完整的和未標(biāo)記的。獲取數(shù)據(jù)、策劃數(shù)據(jù)、預(yù)處理數(shù)據(jù)和標(biāo)記數(shù)據(jù)成為了需要大量時間和資源投入的主要障礙。
多種方法和超參數(shù)?
對于某個AI任務(wù),有時有許多方法或算法可以完成它。每個任務(wù)、數(shù)據(jù)集和/或算法都有參數(shù),稱為超參數(shù),在實施過程中可以調(diào)整,而這些超參數(shù)的最佳值并不總是明確的。解決特定AI任務(wù)的多種方法和可用超參數(shù)意味著不同的方法可能產(chǎn)生極為不同的結(jié)果,而人們需要評估依賴哪些方法的決策。在某些應(yīng)用中,例如為某個客戶推薦的裙子款式,這些差異可能無關(guān)緊要。在其他領(lǐng)域,基于AI的決策可能會改變?nèi)说纳睿焊嬖V患者他們沒有某種疾病,而實際上他們確實患有;一個囚犯被錯誤地標(biāo)記為極有可能再犯,結(jié)果假釋被拒絕;或者一個有資格的人貸款被拒。關(guān)于如何解決這些問題的研究正在進行中,我將在本書后面的部分詳細(xì)介紹。
資源限制?
人類的能力和潛力受到我們大腦能力、生物體能力以及地球上和宇宙中可供我們操縱的資源的限制。這些再次受到我們大腦的能力和容量的限制。AI系統(tǒng)同樣受到支持AI軟件的系統(tǒng)的計算能力和硬件能力的限制。最近的研究表明,計算密集型的深度學(xué)習(xí)正在接近其計算極限,需要新的想法來提高算法和硬件效率,或者發(fā)現(xiàn)全新的方法。AI的進步在很大程度上依賴于計算能力的大幅提高。然而,這種能力并非無限,對于處理大量數(shù)據(jù)集的大型系統(tǒng)而言,成本非常高,而且不能忽視其巨大的碳足跡,例如,運行和冷卻數(shù)據(jù)倉庫、個人設(shè)備、保持云連接等所需的電力。此外,數(shù)據(jù)和算法軟件并不存在于真空中。計算機、手機、平板電腦、電池以及存儲、傳輸和處理數(shù)據(jù)和算法所需的倉庫和系統(tǒng)都是由地球上實際物質(zhì)制成的。地球花了數(shù)百萬年來制造這些材料,而永遠(yuǎn)支持這些技術(shù)所需的無限供應(yīng)并不存在。
安全成本?
安全、隱私和對抗性攻擊一直是AI的主要關(guān)注點,尤其是在互聯(lián)系統(tǒng)的出現(xiàn)之際。大量的研究和資源正被用來解決這些重要問題。由于當(dāng)前大多數(shù)AI是軟件,大多數(shù)數(shù)據(jù)是數(shù)字化的,所以這個領(lǐng)域的軍備競賽永無止境。這意味著AI系統(tǒng)需要不斷監(jiān)控和更新,需要雇傭更昂貴的AI和網(wǎng)絡(luò)安全專家,可能需要的成本遠(yuǎn)遠(yuǎn)超過了最初的自動化規(guī)模目的。
更廣泛的影響
AI研究和實施行業(yè)迄今為止,將自己視為與其先進技術(shù)的經(jīng)濟、社會和安全后果略有分離。通常,這些AI工作的道德、社會和安全影響被認(rèn)為是重要的并且需要關(guān)注,但超出了工作本身的范圍。隨著AI得到廣泛部署,其對社會、市場和潛在威脅的結(jié)構(gòu)和性質(zhì)的影響越來越強烈,整個領(lǐng)域必須更有目的地關(guān)注這些至關(guān)重要的問題。從這個意義上講,AI發(fā)展社區(qū)在分配資源來解決其新技術(shù)實施和部署的更廣泛影響方面是有限的??偨Y(jié),雖然AI在許多方面取得了顯著的成果,但仍然存在許多局限性。這些局限性包括智能、大量標(biāo)記數(shù)據(jù)、多種方法和超參數(shù)、資源限制、安全成本和更廣泛的影響。AI領(lǐng)域需要努力克服這些限制,以便更好地實現(xiàn)其潛力并推動各行各業(yè)的進步。
當(dāng)AI系統(tǒng)失敗時會發(fā)生什么??
學(xué)習(xí)AI的一個非常重要的部分是了解其事故和失敗。這有助于我們在設(shè)計自己的AI并部署到現(xiàn)實世界之前,預(yù)見和避免類似的結(jié)果。如果AI在部署后失敗,后果可能是極其令人不悅、危險,甚至是致命的。
一個名為AI事故數(shù)據(jù)庫的在線知識庫收錄了超過一千起此類事故。該網(wǎng)站的一些示例包括:?
一輛自動駕駛汽車撞死行人。?
自動駕駛汽車與公司的服務(wù)器失去聯(lián)系長達20分鐘,導(dǎo)致所有車輛在舊金山街頭同時停滯(2022年6月28日和5月18日)。?
交易算法導(dǎo)致市場閃崩,數(shù)十億美元在各方之間自動轉(zhuǎn)移。?
面部識別系統(tǒng)導(dǎo)致無辜的人被捕。?
微軟臭名昭著的聊天機器人Tay在發(fā)布僅16小時后就被關(guān)閉,因為它迅速學(xué)習(xí)并發(fā)表了攻擊性、種族主義和極具煽動性的言論。?
這些糟糕的結(jié)果可以減輕,但需要深入了解這些系統(tǒng)如何在生產(chǎn)各個層面上工作,以及了解它們所服務(wù)的環(huán)境和用戶。理解AI背后的數(shù)學(xué)原理是這一識別過程的關(guān)鍵一步。
AI的未來發(fā)展方向是什么??
為了能回答或推測AI的發(fā)展方向,最好回顧一下自誕生以來該領(lǐng)域的原始目標(biāo):模擬人類智能。這個領(lǐng)域誕生于20世紀(jì)50年代?;仡欉^去70年的發(fā)展歷程,可能會告訴我們一些關(guān)于其未來方向的信息。此外,研究這個領(lǐng)域的歷史和趨勢使我們能夠從鳥瞰的角度來看待AI,將所有事物都放在一個背景下,提供更好的視角。這也使得學(xué)習(xí)AI中涉及的數(shù)學(xué)變得不那么壓力重重。下面是一個非常簡短、非技術(shù)性的概述,介紹了AI的演變及其最終成為焦點的原因,這要歸功于最近深度學(xué)習(xí)取得的令人矚目的進步。
一開始,AI研究試圖通過規(guī)則和邏輯來模擬智能。當(dāng)時的想法是,我們所需要做的就是向機器提供事實和關(guān)于這些事實的邏輯推理規(guī)則(我們將在第12章看到這種邏輯結(jié)構(gòu)的例子)。這里沒有強調(diào)學(xué)習(xí)過程。挑戰(zhàn)在于,為了捕捉人類知識,規(guī)則和約束太多,對于編碼者來說難以處理,這種方法看似不切實際。
在20世紀(jì)90年代末和21世紀(jì)初,各種機器學(xué)習(xí)方法開始流行。機器學(xué)習(xí)不再基于預(yù)先編程的規(guī)則來編程,也不再基于這些預(yù)先編程的規(guī)則來得出結(jié)論和決策,而是從數(shù)據(jù)中推斷出規(guī)則。一個機器學(xué)習(xí)系統(tǒng)能夠處理和處理的數(shù)據(jù)越多,其性能就越好。數(shù)據(jù)及其以經(jīng)濟、高效的方式處理和學(xué)習(xí)大量數(shù)據(jù)的能力成為主要目標(biāo)。當(dāng)時流行的機器學(xué)習(xí)算法有支持向量機、貝葉斯網(wǎng)絡(luò)、遺傳算法、決策樹、隨機森林、回歸、邏輯回歸等。這些算法現(xiàn)在仍然受歡迎。
2010年之后,特別是2012年,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在AlexNet的卷積神經(jīng)網(wǎng)絡(luò)在圖像識別方面取得成功后席卷而來。最近五年里,隨著DeepMind的AlphaGo在非常復(fù)雜的古老中國圍棋游戲中擊敗世界冠軍,強化學(xué)習(xí)開始受到歡迎。請注意,這段歷史的回顧非常粗糙:回歸分析可以追溯到19世紀(jì)初的勒讓德和高斯,而第一個人工神經(jīng)元和神經(jīng)網(wǎng)絡(luò)則出現(xiàn)在20世紀(jì)40年代末和50年代初,與之相關(guān)的人物有神經(jīng)生理學(xué)家沃倫·麥克盧洛克、數(shù)學(xué)家沃爾特·皮茨、心理學(xué)家唐納德·赫布和弗蘭克·羅森布拉特。圖靈測試(最初稱為模仿游戲)由計算機科學(xué)家、密碼分析家、數(shù)學(xué)家和理論生物學(xué)家艾倫·圖靈于1950年在他的論文《計算機器與智能》中提出。圖靈提議,如果機器的回應(yīng)與人類無法區(qū)分,那么這臺機器就具有人工智能。因此,一臺機器被認(rèn)為是智能的,如果它能模仿人類的反應(yīng)。然而,對于計算機科學(xué)領(lǐng)域以外的人來說,圖靈測試在定義智能方面聽起來有些局限,我不禁想知道,圖靈測試是否無意中限制了AI研究的目標(biāo)或方向。
盡管機器在一些特定任務(wù)中已經(jīng)能夠模仿人類智能,但模擬人類智能的最初目標(biāo)尚未實現(xiàn),因此可以安全地假設(shè)這就是該領(lǐng)域的發(fā)展方向,盡管可能涉及重新發(fā)現(xiàn)舊觀念或發(fā)明全新觀念。目前該領(lǐng)域的投資水平,加上研究和公眾興趣的爆發(fā),注定會帶來新的突破。然而,近期AI取得的突破已經(jīng)在革新整個行業(yè),這些行業(yè)都渴望實現(xiàn)這些技術(shù)。這些現(xiàn)代AI進步涉及了許多重要的數(shù)學(xué)知識,我們將在本書中逐步探討。
AI領(lǐng)域當(dāng)前的主要貢獻者是誰?
主要的AI競爭一直在美國、歐洲和中國之間進行。科技行業(yè)的世界領(lǐng)導(dǎo)者包括美國的谷歌及其母公司Alphabet、亞馬遜、Facebook、微軟、英偉達和IBM,英國和美國的DeepMind(Alphabet旗下公司),以及中國的百度和騰訊。學(xué)術(shù)界也有很多重要的貢獻者,但這里難以一一列舉。如果您是該領(lǐng)域的新手,了解大型參與者的名稱、歷史和貢獻以及他們目前正在追求的目標(biāo)是很有幫助的。了解他們工作周圍的爭議(如果有的話)也是非常有價值的。隨著您在AI領(lǐng)域不斷深入和積累經(jīng)驗,這些通識知識將派上用場。
AI中通常涉及哪些數(shù)學(xué)內(nèi)容?
當(dāng)我說到“數(shù)學(xué)”這個詞時,你腦海中出現(xiàn)的是哪些主題和科目?
無論您是數(shù)學(xué)專家還是初學(xué)者,您想到的回答這個問題的任何數(shù)學(xué)主題很可能都與AI有關(guān)。這里有一個常用的列表,列出了AI實現(xiàn)中最有用的數(shù)學(xué)科目:微積分、線性代數(shù)、優(yōu)化、概率和統(tǒng)計;然而,在AI領(lǐng)域取得成功并不需要您成為所有這些領(lǐng)域的專家。您確實需要對這些數(shù)學(xué)科目中選取的某些有用主題有深入的理解。根據(jù)您的具體應(yīng)用領(lǐng)域,您可能需要來自以下領(lǐng)域的特殊主題:隨機矩陣?yán)碚?、圖論、博弈論、微分方程和運籌學(xué)。
在本書中,我們將遍覽這些主題,而不是對每一個主題都進行教科書式的講解。AI應(yīng)用和實現(xiàn)是這些多樣化且密切相關(guān)的數(shù)學(xué)科目的統(tǒng)一主題。采用這種方法,我可能會因為過分簡化許多技術(shù)定義或省略整個定理和細(xì)微的細(xì)節(jié)而冒犯一些數(shù)學(xué)專家,同樣,我也可能冒犯AI或?qū)I(yè)行業(yè)專家,因為省略了涉及某些應(yīng)用和實現(xiàn)的細(xì)節(jié)。然而,我們的目標(biāo)是使本書保持簡單易讀,同時涵蓋大部分對AI應(yīng)用重要的數(shù)學(xué)主題。有興趣的讀者希望深入了解數(shù)學(xué)或AI領(lǐng)域的話,可以閱讀更多關(guān)于他們想要關(guān)注的特定領(lǐng)域的深入書籍。
我希望這本書是一個簡潔的總結(jié)和全面的概述,因此讀者在此之后可以自信地進入他們感興趣的AI數(shù)學(xué)領(lǐng)域或AI應(yīng)用領(lǐng)域。
總結(jié)和展望
人類智能在感知、視覺、自然語言交流、推理、決策、合作、同理心、建模和操縱周圍環(huán)境、跨人群和代際傳遞技能和知識以及將先天和學(xué)習(xí)到的技能推廣到新的和未知領(lǐng)域等方面體現(xiàn)出來。人工智能渴望復(fù)制人類智能的所有方面。在目前的狀態(tài)下,AI一次只能解決一個或幾個方面的智能。即使存在這種局限性,AI也取得了令人印象深刻的成就,如建模蛋白質(zhì)折疊和預(yù)測蛋白質(zhì)結(jié)構(gòu),這些結(jié)構(gòu)是生命的基石。這一AI應(yīng)用(眾多應(yīng)用之一)對理解生命本質(zhì)和抗擊各種疾病的影響是無窮的。
進入AI領(lǐng)域時,重要的是要始終關(guān)注您正在開發(fā)或使用的智能方面。是感知?視覺?自然語言?導(dǎo)航?控制?推理?然后自然而然地關(guān)注哪些數(shù)學(xué)以及為什么,因為您已經(jīng)知道自己在AI領(lǐng)域的位置。然后就很容易關(guān)注開發(fā)AI特定方面的社區(qū)所使用的數(shù)學(xué)方法和工具。本書的方法類似:首先是AI類型和應(yīng)用,然后是數(shù)學(xué)。
在本章中,我們討論了一些一般性問題。什么是AI?AI能做什么?AI的局限性是什么?AI的發(fā)展方向是什么?AI是如何工作的?我們還簡要介紹了重要的AI應(yīng)用,企業(yè)在試圖將整合到系統(tǒng)中時通常遇到的問題,系統(tǒng)實施不當(dāng)時可能發(fā)生的事故,以及AI實施通常需要的數(shù)學(xué)科目。
在下一章中,我們將深入研究數(shù)據(jù),并確認(rèn)其與AI的密切關(guān)系。談到數(shù)據(jù),我們還會談到數(shù)據(jù)分布,這將直接引入概率論和統(tǒng)計學(xué)。