天鼎投顧:AI繪畫能不能聽懂需求? 離國際水平還有多遠?
2023年在AI繪畫領域可謂是大事件頻出,先是3月17日百度發(fā)布文心一言,再是3月18日美國Midjourney公司宣布第五版AI圖像生成服務在AI繪畫領域再掀波瀾。兩個系統(tǒng)前后腳發(fā)布,就免不了被比較一番??偟膩碚f,文心一言能根據(jù)簡單的指令生成圖片,不過遇到有歧義的詞句時,系統(tǒng)就會出現(xiàn)失誤。而Midjourney則幾乎沒有這類問題,給出的形容越準確,生成的圖片就越符合要求。
文心一言能理解的文字長度有限,過于精確的描述可能會適得其反,致使其生成不符合要求的圖片或是胡亂生成,目前還處于分辨指令語義的初級階段。而Midjourney則恰恰相反,它不僅能準確理解指令,在繪畫細節(jié)的處理上已經(jīng)較為成熟。不過,可以預見的是,2023年將會是AI繪畫迎來爆發(fā)的一年。
不少業(yè)內(nèi)人士稱,文心一言在算法、算力、數(shù)據(jù)方面都和Midjourney相去甚遠。從數(shù)據(jù)上來看,中文本身就存在著字與字之間沒有間距的問題,這就需要龐大的人力來進行分詞。在算法上,相關人士估計,文心一言在底層大模型的使用層數(shù)上可能與Midjourney存在十倍左右的差距。在算力上,Midjourney和文心一言正處于不同的發(fā)展階段。Midjourney自從2022年3月面世以來已經(jīng)迭代了五代,而文心一言的AI?做圖功能文心一格雖然在2022年8月就已面世,但至今還沒有相關升級迭代的消息。
我們距離國際水平,還有多遠的距離?相關人士指出,雖然算力的差距短時間內(nèi)很難迎頭趕上,但是在系統(tǒng)上下功夫,還是很有希望的。AI繪畫走向更廣闊的舞臺已經(jīng)是大勢所趨,各大企業(yè)也正全力以赴在這條賽道上奔跑,未來成果如何,拭目以待。

文章部分數(shù)據(jù)及觀點來源:深燃(shenrancaijing)
舒曉飛投顧編號:A1150613120001
以上數(shù)據(jù)、信息均來源市場公開消息,觀點僅供參考學習,不構成投資建議,操作風險自擔。