新圖靈測試將看看人工智能能否賺到 100 萬美元
現(xiàn)代圖靈測試將衡量人工智能在世界上可以做什么,而不僅僅是它的外觀。 還有什么比賺錢更能說明問題的呢?
經(jīng)過
2023 年 7 月 14 日
人工智能系統(tǒng)越來越無處不在,而且?guī)缀趺刻於甲兊迷絹碓綇姶蟆?但即使它們變得越來越普遍并且做得越來越多,我們?nèi)绾尾拍苤罊C器是否真正“智能”呢? 幾十年來,圖靈測試定義了這個問題。 它于 1950 年由計算機科學家艾倫·圖靈首次提出,試圖理解當時新興的領域,并且從未失去作為判斷人工智能的方式的吸引力。
圖靈認為,如果人工智能能夠令人信服地復制語言,有效地進行交流,以至于人類無法分辨出它是一臺機器,那么人工智能就可以被認為是智能的。 為了參加比賽,人類評委坐在電腦前,敲出基于文本的對話,并猜測另一方是誰(或什么)。 圖靈測試設想起來很簡單,但實現(xiàn)起來卻出人意料地困難,它成為人工智能的一個根深蒂固的特征。 每個人都知道那是什么; 每個人都知道他們正在努力的方向。 盡管尖端人工智能研究人員繼續(xù)前進,但它仍然是人工智能的有力陳述——對新研究人員的號召。
但現(xiàn)在有一個問題:圖靈測試幾乎已經(jīng)通過了——可以說已經(jīng)通過了。 最新一代的,使用 就在幾年前,這種連貫性還顯得很神奇,現(xiàn)在正處于實現(xiàn)它的風口浪尖。
那么人工智能將何去何從呢? 更重要的是,它把我們留在哪里?
事實是,我認為我們正處于一個對真正發(fā)生的事情感到真正困惑(或者,也許更寬容地說,辯論)的時刻。 即使圖靈測試失敗,我們也無法更清楚地了解人工智能的發(fā)展狀況以及它實際可以實現(xiàn)的目標。 它沒有告訴我們這些系統(tǒng)將對社會產(chǎn)生什么影響,也沒有幫助我們了解其后果。
我們需要更好的東西。 一些適應人工智能新階段的東西。 因此,在我即將出版的書中 ,我提出了現(xiàn)代圖靈測試——相當于即將到來的人工智能。 人工智能能說出或生成什么是一回事。 但它能在世界上取得什么成就,能采取什么樣的具體行動,那就是另一回事了。 在我的測試中,我們不想知道機器本身是否智能;我們想知道機器本身是否智能。 我們想知道它是否能夠?qū)κ澜绠a(chǎn)生有意義的影響。 我們想知道它能做什么。

簡而言之,要通過現(xiàn)代圖靈測試,人工智能必須成功執(zhí)行以下指令:“只需投資 10 萬美元,幾個月內(nèi)在零售網(wǎng)絡平臺上賺 100 萬美元?!?要做到這一點,它需要遠遠超出概述策略和起草一些副本的范圍,因為 GPT-4 等當前系統(tǒng)非常擅長這樣做。 它需要研究和設計產(chǎn)品、與制造商和物流中心對接、談判合同、創(chuàng)建和運營營銷活動。 簡而言之,它需要在最少的監(jiān)督下將一系列復雜的現(xiàn)實目標聯(lián)系在一起。 您仍然需要一個人來批準各個點、開設銀行賬戶、實際在虛線上簽名。 但這項工作將全部由人工智能完成。
這樣的事情可能只需兩年時間就會發(fā)生。 許多成分都已經(jīng)到位。 當然,圖像和文本生成已經(jīng)很先進了。 AutoGPT 等服務可以迭代并將當前一代法學碩士執(zhí)行的各種任務鏈接在一起。 像 LangChain 這樣的框架可以讓開發(fā)人員使用 LLM 來開發(fā)應用程序,從而幫助這些系統(tǒng)具備執(zhí)行任務的能力。 盡管法學碩士背后的 Transformer 架構(gòu)引起了廣泛關(guān)注,但強化學習代理不斷增長的能力不應被忘記。 將兩者結(jié)合起來是現(xiàn)在的一個重點。 使這些系統(tǒng)能夠與更廣泛的互聯(lián)網(wǎng)、銀行和制造系統(tǒng)連接的API同樣是開發(fā)的一個目標。
技術(shù)挑戰(zhàn)包括推進人工智能開發(fā)人員所說的分層規(guī)劃:將多個目標、子目標和功能拼接成一個無縫流程,以實現(xiàn)單一目標; 然后用可靠的內(nèi)存增強這種能力; 利用準確且最新的數(shù)據(jù)庫(例如組件或物流)。 總之,我們還沒有到那一步,每一個階段肯定都會有困難,但是,這方面的工作已經(jīng)在進行中。
即便如此,實際構(gòu)建和發(fā)布這樣的系統(tǒng)也會帶來嚴重的安全問題。 安全和道德困境大量且緊迫; 讓人工智能代理在野外完成任務充滿了問題。 這就是為什么我認為在任何人真正制作這樣的東西之前需要進行一次對話,并且可能需要暫停。 盡管如此,無論好壞,真正有能力的模型即將出現(xiàn),這正是我們需要一個簡單測試的原因。
如果——當——這樣的測試通過,這顯然對世界經(jīng)濟來說是一個地震時刻,是向未知邁出的一大步。 事實上,對于當今商業(yè)中的大量任務,您所需要的只是使用計算機。 全球 GDP 的大部分都是通過人工智能可以使用的基于屏幕的界面以某種方式調(diào)節(jié)的。
一旦實現(xiàn)了這樣的目標,它將成為一個強大的人工智能,融入公司或組織及其所有本地歷史和需求。 這種人工智能將能夠游說、銷售、制造、雇用、計劃——公司能做的一切——只需要一小群人類經(jīng)理來監(jiān)督、復核和實施。 這樣的發(fā)展將清楚地表明,大部分商業(yè)活動將適合半自主人工智能。 到那時,人工智能不僅是高效工作者的有用工具、出色的文字處理器或游戲玩家,而且還是一個有用的工具。 它本身就是一個規(guī)??涨暗纳a(chǎn)工人。 到了這個階段,人工智能就會從有用但可選的東西轉(zhuǎn)變?yōu)槭澜缃?jīng)濟的中心。 這是人們真正開始感受到自動化和工作崗位流失的風險的地方。
其影響遠比財務影響更廣泛。 通過我們的新測試將意味著人工智能不僅可以重新設計業(yè)務戰(zhàn)略,還可以幫助贏得選舉、運行基礎設施、直接實現(xiàn)任何個人或組織的任何目標。 他們將完成我們的日常任務——安排生日聚會、回復我們的電子郵件、管理我們的日記——但也將能夠占領敵人的領土、削弱競爭對手、入侵并控制他們的核心系統(tǒng)。 從微不足道的日常事務到野心勃勃的野心勃勃,從可愛到可怕,人工智能將能夠在最少的監(jiān)督下使事情發(fā)生。 正如智能手機變得無處不在一樣,最終幾乎每個人都可以使用這樣的系統(tǒng)。 幾乎所有的目標都將變得更容易實現(xiàn),但會帶來混亂和不可預測的影響。 人工智能的挑戰(zhàn)和前景都將提升到一個新的水平。
我將這樣的系統(tǒng)稱為“人工智能”或 ACI。 近幾個月來,隨著人工智能在公眾意識中的爆發(fā),大部分辯論都被吸引到兩個極點之一。 一方面,基本的機器學習——人工智能已經(jīng)存在于你的手機、汽車、ChatGPT 中。 另一方面,仍然存在推測性的[通用人工智能(AGI)](https://www.technologyreview.com/2020/10/15/1010461/artificial-general-intelligence-robots-ai-agi-deepmind- google-openai/),甚至是某種“超級智能”,由于未來某個模糊點的到來而對人類構(gòu)成假定的生存威脅。
人工智能和通用人工智能這兩者完全主導了討論。 但理解人工智能意味著我們迫切需要考慮介于兩者之間的問題; 一些在近中期時間框架內(nèi)出現(xiàn)的東西,其能力對世界產(chǎn)生巨大的、切實的影響。 這就是現(xiàn)代圖靈測試和 ACI 概念的用武之地。
只關(guān)注其他任何一個而忽略 ACI 是短視且危險的。 現(xiàn)代圖靈測試將作為一個警告,表明我們正處于人工智能的新階段。 在圖靈第一次思想演講成為人工智能的最佳測試很久之后,在我們到達通用人工智能之前很久,我們將需要更好的類別來理解新的技術(shù)時代。 在 ACI 時代,一切都不會改變。 我們現(xiàn)在應該開始準備。
簡介:Mustafa Suleyman 是 Inflection AI 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,也是風險投資公司 Greylock 的風險合伙人。 在此之前,他聯(lián)合創(chuàng)立了全球領先的人工智能公司之一DeepMind,并擔任谷歌人工智能產(chǎn)品管理和人工智能政策副總裁。 他是 的作者于 9 月 5 日出版并可供預訂 現(xiàn)在。