未來(lái)幾年會(huì)如何發(fā)展?
從700萬(wàn)年前人類開(kāi)始直立行走之后,人類開(kāi)始展現(xiàn)出與其他動(dòng)物的不同之處,其中最關(guān)鍵的不同是能夠制造和使用工具,也就是人類有能力將他們周圍的事物轉(zhuǎn)化為可以用來(lái)完成特定任務(wù)的工具。從舊石器時(shí)期的石斧和弓箭,到現(xiàn)在的飛機(jī)和火箭,人類一直在制造越來(lái)越強(qiáng)大的工具。
而人類對(duì)這些工具的終極期望,是這些工具可以去自動(dòng)完成所有的工作,也就是"全面自動(dòng)化"。對(duì)于"全面自動(dòng)化"的設(shè)想,人類過(guò)去就曾經(jīng)提出過(guò)。在1977年,蘋(píng)果公司推出了早期的個(gè)人計(jì)算機(jī)Apple II,這款產(chǎn)品在當(dāng)時(shí)震驚了整個(gè)計(jì)算機(jī)行業(yè)。在當(dāng)時(shí),有很多專家預(yù)測(cè)二十年之后人類將進(jìn)入"全面自動(dòng)化"時(shí)代,到時(shí)候人人都會(huì)成為程序員。比如,如果你是一名農(nóng)民,你可以用個(gè)人計(jì)算機(jī)去編程,然后將程序輸入給機(jī)器,讓機(jī)器去幫你完成播種的工作。如果你是一名醫(yī)生,你可以給機(jī)器編程然后讓機(jī)器給病人做手術(shù)。如果你是廚師,你可以編程讓機(jī)器去把飯菜做出來(lái)。如果你是畫(huà)家,你可以編程讓機(jī)器把畫(huà)畫(huà)出來(lái)。當(dāng)然,二十年后這種設(shè)想并沒(méi)有成為現(xiàn)實(shí),因?yàn)檫@些專家大大低估了普通人成為程序員的門檻。不然也就不會(huì)有Windows這種操作系統(tǒng)了,圖形界面就是為了讓普通人也能使用計(jì)算機(jī)。
但是,隨著人工智能深度學(xué)習(xí)的發(fā)展,程序員的門檻將會(huì)降得足夠低,讓"人人都是程序員"成為現(xiàn)實(shí)。OpenAI推出的ChatGPT已經(jīng)展現(xiàn)出強(qiáng)大的自然語(yǔ)言處理能力,這樣的語(yǔ)言模型能夠?qū)⒆匀徽Z(yǔ)言(也就是我們?nèi)粘Uf(shuō)話用的語(yǔ)言)轉(zhuǎn)化成計(jì)算機(jī)的程序代碼,這樣普通人即使只用自然語(yǔ)言也能給機(jī)器編程。
微軟現(xiàn)在把ChatGPT集成進(jìn)了必應(yīng)搜索引擎,而這僅僅是一個(gè)開(kāi)始,接下來(lái)在2023年里,會(huì)有很多軟件接入這樣的語(yǔ)言模型,比如微軟的Word、PowerPoint、Excel、電子郵件等等。但是,只靠語(yǔ)言模型還不能實(shí)現(xiàn)"人人都是程序員",因?yàn)橄胍獙?shí)現(xiàn)"人人都是程序員"就要保證自然語(yǔ)言轉(zhuǎn)化的程序代碼必須準(zhǔn)確且高效,只靠語(yǔ)言模型的文字內(nèi)容是無(wú)法實(shí)現(xiàn)的。人類社會(huì)和自然界有太多東西是無(wú)法只靠文字表達(dá)的,必須要通過(guò)視覺(jué)、聽(tīng)覺(jué)以及其他感知能力才能理解。所以接下來(lái)就需要多模態(tài)模型了,除了自然語(yǔ)言模型的文字處理,還能處理圖片、視頻、音頻等不同的內(nèi)容。
所以我預(yù)測(cè),在2023年會(huì)有很多軟件接入語(yǔ)言模型。到了2024年,會(huì)出現(xiàn)強(qiáng)大的多模態(tài)模型,然后會(huì)接入大多數(shù)的軟件以及一些硬件(包括各種機(jī)器設(shè)備)。到了2025年,會(huì)有更多的硬件接入多模態(tài)模型。到了2026年,"人人都是程序員"就可以變成現(xiàn)實(shí)。