人工智能(AI)的賽道與工具
“一個(gè)運(yùn)作良好的思想市場(chǎng),培育寬容,將使中國(guó)經(jīng)濟(jì)的發(fā)展以知識(shí)為動(dòng)力,更具可持續(xù)性,而更為重要的是,通過與多樣性的現(xiàn)代世界相互作用和融合,這能使中國(guó)復(fù)興。”——科斯
隨著ChatGPT的火爆,帶動(dòng)了大家對(duì)于人工智能(AI)的關(guān)注,各種項(xiàng)目也如雨后春筍般蓬勃興起。
對(duì)于ChatGPT還不熟悉的,可以先看這篇文章:
教程 | ChatGPT 完全上手指南
但是由于目前的AI項(xiàng)目過于雜亂,今天想通過一些分類方法,總結(jié)一下目前AI的賽道與工具。
在展開分類和正文之前,先把結(jié)論前置。
任何一項(xiàng)新的技術(shù),在奇點(diǎn)到來之前,都還沒有徹底取代舊的技術(shù)或者是進(jìn)入大眾的工作和生活。就好像收音機(jī)沒有取代報(bào)紙,電視沒有取代收音機(jī),結(jié)果在汽車普及之后,電臺(tái)反而在早晚高峰堵車的時(shí)候市占率回暖了。
AI也是一樣,在一段時(shí)間內(nèi),都還只是提升人類工作效率的工具而已,而這個(gè)工具的使用和掌握,還是需要一些門檻的,那么能夠更好地使用好這些工具的人,無疑工作效率要略高一些。在AI浪潮來臨的時(shí)候,除了想想哪些股票和AI有關(guān),怎么蹭上這個(gè)風(fēng)口,怎么通過AI制服,不如先想想,怎么能夠讓這些工具更好地輔助自己的工作和生活。
畫了一張小圖:

這其中包括升維、平維與降維(姑且這樣簡(jiǎn)單分類吧,沒找到更好的分類方法)。
平維或升維:
文字到文字(Text to Text, T2T)
文字到語(yǔ)音(Text to Audio,T2A)
文字到圖片(Text to Image, T2I)
文字到視頻(Text to Video, T2V)
圖片到圖片(Image to Image, I2I)
圖片到視頻(Image to Video, I2V)
視頻到視頻(Video to Video, V2V)
降維:
目前降維的使用場(chǎng)景并不如平維或升維的多??赡鼙热缯f,一篇很長(zhǎng)的文章,我想讓AI幫我總結(jié)一下要點(diǎn)。一個(gè)很長(zhǎng)的連續(xù)劇,我想讓AI幫我總結(jié)一下有哪些啟發(fā)等。
語(yǔ)音到文字(Audio to Text, A2T)
圖片到文字(Image to Text,I2T)
圖片到語(yǔ)音(Image to Audio, I2A)
視頻到文字(Video to Text,V2T)
視頻到語(yǔ)音(Video to Audio,V2A)
視頻到圖片(Video to Image,V2I)
這里說明一下,圖片到視頻和圖片到動(dòng)畫的區(qū)別,
當(dāng)然未來的AI,肯定都是集大成者,現(xiàn)在也有一些AI直接可以語(yǔ)音控制,而且文字到語(yǔ)音和語(yǔ)音到文字這個(gè)過程已經(jīng)相對(duì)比較成熟了。那么如果達(dá)成了語(yǔ)音到文字和文字到圖像,其實(shí)也就相當(dāng)于打通了語(yǔ)音到圖像。那么接下來就針對(duì)重點(diǎn)賽道分別介紹一下常用的工具,由于現(xiàn)在這類項(xiàng)目蓬勃展開,有缺失的,還希望大家留言補(bǔ)充。
一、文字到文字:
目前大火的ChatGPT,就屬于文字到文字這一賽道。其實(shí)文字到文字是一切AI邏輯上的基礎(chǔ),通過理解人類的文字表達(dá)進(jìn)行處理,這種技術(shù)細(xì)分叫自然語(yǔ)言處理(NLP)。
一文看懂自然語(yǔ)言處理-NLP(4個(gè)典型應(yīng)用+5個(gè)難點(diǎn)+6個(gè)實(shí)現(xiàn)步驟)
當(dāng)然這其中又可以細(xì)分為很多類,比如說文字到代碼、文字潤(rùn)色、文字提煉和總結(jié)等等。
二、文字到圖片:
學(xué)畫畫的老徐總結(jié)了六款A(yù)I生成圖片的工具:

學(xué)畫畫的老徐
大學(xué)教師,退休后零基礎(chǔ)學(xué)畫。用自己的原創(chuàng)作品,與您分享我的習(xí)畫歷程、分享畫家故事及名畫欣賞。
公眾號(hào)
介紹幾款 AI 圖片生成器:
這18個(gè)AI繪畫工具,一定不要錯(cuò)過!
設(shè)計(jì)領(lǐng)域革命,全球人工智能繪畫大盤點(diǎn)|動(dòng)察
再選重點(diǎn)的介紹一下(排名分先后):
Midjourney
一些 Midjourney 的入門指南與繪畫經(jīng)驗(yàn)
目前Midjourney還只能通過Discord互動(dòng)的形式實(shí)現(xiàn)。
2. Stable Diffusion
Stable Diffusion的入門介紹和使用教程
Stable Diffusion的優(yōu)點(diǎn)是可以自己部署自己的AI,缺點(diǎn)是比較吃機(jī)器的性能。
1秒出圖,全球最快的開源Stable Diffusion出爐
還有小白不會(huì)用stable diffusion?史上最全的stable diffusion環(huán)境配置指南
人工智能,丹青圣手,構(gòu)建Stable-Diffusion-WebuiAI繪畫教程(Python3.10/Pytorch1.13)
3. DALL·E 2
Dall·E 2是與ChatGPT同一公司OpenAI的產(chǎn)品。是一個(gè)AI圖片生成器。
AI畫圖師- DALLE 2
Chatgpt+Dalle2到底有多強(qiáng)
4. DeepAI
吹爆這個(gè)AI,3秒鐘完成黑白照片上色,就連素描畫都可以
https://deepai.org/machine-learning-model/text2img
DeepAI好像在黑白圖片上色方面比較出眾。
5. ArtBreeder
Artbreeder只會(huì)捏臉?作品集成果圖1分鐘完成,這些工具網(wǎng)站別錯(cuò)過了!
https://www.artbreeder.com/
結(jié)語(yǔ):做好了文字到文字、文字到語(yǔ)音、文字到圖片,那么可能剩下的就簡(jiǎn)單了。關(guān)鍵是一些細(xì)節(jié)的處理,比如說現(xiàn)在的ChatGPT,也有胡謅的時(shí)候。想要用好工具的第一步,是得去——用。