Midjourney年收千萬用戶上億美金
人工智能技術(shù)得到了快速的發(fā)展,最近?ControlNet的出現(xiàn)也將會對文生圖的工作流程進(jìn)行更深層次的突破。而未來的多模態(tài)AIGC必然會對現(xiàn)有的內(nèi)容形式產(chǎn)生更大的沖擊。而憑借其獨(dú)特定位獲得了大量用戶和活躍的社區(qū)的Midjourney,作為一個應(yīng)用型產(chǎn)品,暫時是無法形成強(qiáng)大的技術(shù)壁壘的。
Midjourney是一個自主研發(fā)的實(shí)驗(yàn)室它可以讓使用者在 Discord上和 Midjourney bot進(jìn)行交互,然后提交“Prompt”來快速獲取所需的圖像。Midjourney采用訂閱付費(fèi)系統(tǒng),在冷啟動時,用戶可以自由免費(fèi)制作25幅圖片?,F(xiàn)在只有在訂閱后,用戶才可以使用 midjourney制作的照片的版權(quán)。
由于是最先公開測試的AI繪畫產(chǎn)品,它可以用簡單的 prompt制作出具有藝術(shù)性的圖片,這吸引了大批的早期用戶。Midjourney的用戶數(shù)量迅速增加,收益也非常可觀。該公司在 Discord上部署了該公司的bot,其頻道超過1千萬人,是 Discord目前使用人數(shù)最多的頻道,每年的收入將達(dá)到1億美金。Midjourney的概要短小精悍,充滿了科幻感,由于畫面精致,更具商業(yè)價值,鎖定了龐大的客戶群體,并有強(qiáng)烈的付費(fèi)意愿,經(jīng)過大量的實(shí)踐,有效地提升了工作效率。
而與之相比,DALL-E2是現(xiàn)實(shí)主義的, Stable Diffusion沒有任何的偏愛,但是為了得到好的畫面,還需要更多的時間和更多的努力。社區(qū)的建立是?Midjourney火爆的一個重要的因素,互動的方式也是吸引和留住用戶的重要因素。現(xiàn)在, Midjourney已經(jīng)是 Discord中最大的頻道。
Midjourney的商業(yè)化部分采用每月10到60美元的 訂閱服務(wù)。雖然沒有公布具體的付費(fèi)用戶數(shù)目,但是從客戶的談話中可以看出,他們的支付意愿很高。以現(xiàn)在的用戶規(guī)模來看,每年的收入將會達(dá)到1億美金左右。
如果和可畫的用戶相比,以 Midjourney的訂閱價格,他們的收入將在23億美金左右。2022年以前,文生圖的模式主要是生成對抗網(wǎng)絡(luò)(GANs)。
但是由于實(shí)際操作有很大的缺陷,不如直接使用 Photoshop之類的工具進(jìn)行創(chuàng)作,而不能應(yīng)用到商業(yè)上。隨著 Disco Diffusion、 Stable Diffusion、DALL-E2、 Midjourney等公共文生圖軟件在公共場合進(jìn)行了公開測試,并在社會媒體上引起了大量的討論和作品的展示,使文生圖的應(yīng)用真正在 C端落地。除了像 Midjourney這樣的普通的文生圖軟件之外,垂直類的應(yīng)用程序也不斷涌現(xiàn)。
不同的產(chǎn)業(yè)對圖像生成的需求也不盡相同,并且都需要具體的數(shù)據(jù)集合來進(jìn)行培訓(xùn),這為垂直領(lǐng)域的初創(chuàng)公司帶來了機(jī)遇。比如NovelAI專注于二次元的創(chuàng)作, Scenario專注于創(chuàng)造游戲資產(chǎn), Lensa則專注于制作頭部。
這些垂直類軟件現(xiàn)在還不太可能成為大型企業(yè),但是它們的利潤卻很高,比如 Lensa在上市后的幾個星期里就實(shí)現(xiàn)了4,000萬到5,000萬美元的收入。一方面, Discord bot可以減少用戶的體驗(yàn)門檻;另一方面,圖像創(chuàng)作是一種不斷重復(fù)的討論,對他人的作品的鑒賞也有助于啟發(fā)。
Holz還在采訪中說,之所以沒有直接開發(fā) iOS應(yīng)用程序,是因?yàn)榇蠹叶己芟硎苓@種創(chuàng)意。Midjourney很快就成為了 Discord上最受歡迎的服務(wù)器,其社區(qū)成員超過1千萬。Midjourney最近擴(kuò)展了它的應(yīng)用領(lǐng)域,使得每個人都能在自己的 Discord服務(wù)器中安裝 Midjourney,從而擴(kuò)展了 Midjourney的應(yīng)用能力。
在文生圖軟件中,迭代的速度是很關(guān)鍵的。SaaS的產(chǎn)品模型使得它的收益依賴于圖像的效果和費(fèi)用。隨著基礎(chǔ)技術(shù)的快速發(fā)展,模型的更新也是必不可少的。事實(shí)上,數(shù)據(jù)的質(zhì)量和標(biāo)注的質(zhì)量,比模型更重要。
2022年3月V1版本中,仍然有大量的開放源碼模式被引用;4、7、11月分別推出了V2、V3、V4,并在此基礎(chǔ)上進(jìn)行了迭代。第四章補(bǔ)充了生物、地點(diǎn)等信息;提高了對細(xì)節(jié)的辨識和多個對象/多個角色的視覺效果??偟膩碚f,每一次迭代都是對產(chǎn)品性能的一次飛躍。在 ToC平臺上,可以讓工作流程變得簡單,比如幫著設(shè)計師或者外包公司,為自己的社交媒體制作照片。
近期國內(nèi)廠商推出了一款名為?metamind 的APP進(jìn)行內(nèi)測,metamind不僅可以體驗(yàn)類 Midjourney繪畫能力,還支持多模態(tài)AIGC創(chuàng)作能力,包括類 ChatGPT對話聊天,AI繪畫,AI寫作,AI視頻創(chuàng)作等。Midjourney類產(chǎn)品的發(fā)展也存在著諸如著作權(quán)等潛在的風(fēng)險。DavidHolz承認(rèn), Midjourney所使用的公開資料中有數(shù)以百萬計的未獲作者許可的作品,這是很危險的一件事?,F(xiàn)在,有 prompt的學(xué)習(xí)和交換網(wǎng)站,比如 promptoMANIA,在社區(qū)里也有公開的 prompt文檔和教程。因?yàn)槭褂貌煌?prompt得到的照片有很大的差別,以至于有了 prompt交易平臺。
PromptBase是一種交易平臺,包括 Midjourney,DALL-E2,GPT-3。目前 PromptBase擁有超過1萬人的用戶,其最流行的是商標(biāo)、網(wǎng)站、服裝等商業(yè)化設(shè)計場景,可以銷售數(shù)百至數(shù)千次。盡管該小組已經(jīng)表明了他們不在乎財政收益,但是 Midjourney卻是一個非常賺錢的公司。現(xiàn)在, Midjourney公司的利潤是80%左右。
Discord將 Midjourney建立在 Discord上, Discord將收取大約10%的費(fèi)用。盡管 Midjourney的模型培訓(xùn)費(fèi)用并不明確,但是在 Stable Diffusion中,總共有256個NvidiaA100,花費(fèi)150000個小時,花費(fèi)60,000美金。每一幅圖片產(chǎn)生的推理都是在 GPU上進(jìn)行的,制作一幅圖片的花費(fèi)大約為0.5美元,而且以后的費(fèi)用還會繼續(xù)縮減。與訂閱收益相比,制作一張照片的花費(fèi)可以被忽略。
雖然我們現(xiàn)在還不能看到這個產(chǎn)業(yè)的結(jié)局,但是我們相信, Midjourney以其特有的畫面風(fēng)格和藝術(shù)效果,以及活躍的 Discord社區(qū)所提供的良好的用戶體驗(yàn),也使我們對其未來的發(fā)展充滿信心。另外大家想要體驗(yàn)國產(chǎn)最新的類 Midjourney產(chǎn)品的侯抬私我,希望國內(nèi)在?AI方面能有更大的突破!