一幀秒創(chuàng):將用戶一小時(shí)的工作變成一分鐘

ChatGPT爆火以來,幫助文本、視頻等內(nèi)容創(chuàng)作者提高工作效率的AI輔助創(chuàng)作工具大量涌現(xiàn),備受關(guān)注。娛樂資本論訪談了秘塔寫作貓、一覽運(yùn)營(yíng)寶、一幀秒創(chuàng)三款產(chǎn)品的開發(fā)商,試圖向讀者揭示此類應(yīng)用的發(fā)展現(xiàn)狀、商業(yè)模式和未來走向。
一幀秒創(chuàng)是一款“智能AI內(nèi)容生成”工具,以”文生視頻“為核心功能,把初始的一段話擴(kuò)展成為視頻腳本,再根據(jù)腳本的文字內(nèi)容,在視頻素材庫(kù)中內(nèi)匹配一些跟文字相對(duì)的視頻片段,省略了人們手動(dòng)搜索視頻和剪輯的過程。最近,產(chǎn)品升級(jí)了文字?jǐn)U寫【文生文】、文生圖等AI內(nèi)容模塊的能力。
一幀秒創(chuàng)的開發(fā)商新壹科技脫胎于秒創(chuàng)和小咖秀母公司一下科技,也由此擁有大量視頻資源來充實(shí)素材庫(kù)。公司CEO雷濤介紹說,視頻方面的“小白用戶”可以低成本、快速生成視頻,剪輯時(shí)間可以從小時(shí)級(jí)別縮短到分鐘級(jí)別。
01?對(duì)視頻素材打標(biāo)簽,意在精準(zhǔn)匹配?
娛樂資本論:請(qǐng)介紹一下“一幀秒創(chuàng)”的起源。?
雷濤:2021年12月份,我們啟動(dòng)了一幀秒創(chuàng)項(xiàng)目,但當(dāng)時(shí)還不知道這叫“AIGC”。我們最開始的目的,是希望文字類創(chuàng)作者都能低成本的制作視頻。當(dāng)時(shí)移動(dòng)視頻行業(yè)競(jìng)爭(zhēng)白熱化,很多長(zhǎng)相漂亮,擅長(zhǎng)聊天的人容易跟上潮流,但很多文字工作者卻缺乏捕捉這個(gè)浪潮的技能和精力。
產(chǎn)品上,我們的視頻界面簡(jiǎn)單,沒有時(shí)間軸、對(duì)軌這些概念,用戶能用填空的方式自助替換素材。在相對(duì)可標(biāo)準(zhǔn)化和可量化的視頻生成上,比如新聞或科普視頻的視頻化,可能創(chuàng)作者過去的剪輯工作量是1個(gè)小時(shí),現(xiàn)在可以縮短到分鐘級(jí)別。
一幀秒創(chuàng)的首個(gè)版本于2022年6月份發(fā)布,前期做了一段時(shí)間的研發(fā)工作,比如素材結(jié)構(gòu)化。
娛樂資本論:視頻素材的來源主要是??
雷濤:以前秒拍、小咖秀的UGC?公版素材,還有一部分是我們合作的專有版權(quán)渠道,我們會(huì)根據(jù)用戶實(shí)際使用素材的頻率與版權(quán)方收益共享。
娛樂資本論:你們的技術(shù)路線是什么??
雷濤:我們前期做了兩套產(chǎn)品系統(tǒng),一個(gè)是大家看到的線上產(chǎn)品,另一個(gè)是專門針對(duì)場(chǎng)景、流程的視頻標(biāo)注系統(tǒng)。處理視頻時(shí),我們先通過算法拆分它的場(chǎng)景、鏡頭,形成素材,再通過多模態(tài)識(shí)別素材,把它灌進(jìn)我們的標(biāo)注系統(tǒng)里。另一部分對(duì)素材打的標(biāo)簽,我們叫客觀標(biāo)簽,比如角色名稱。這兩部分內(nèi)容占了我們70%左右的時(shí)間精力,相當(dāng)于用了大半年初步建立了垂直行業(yè)的視頻生成模型。
我們的產(chǎn)品會(huì)對(duì)用戶意圖進(jìn)行分析,判斷用戶意圖是偏向于文本匹配,還是視頻生成。內(nèi)部做了一套引擎用來調(diào)度開源模型和自研模型,為了豐富素材,降低用戶的使用難度,我們也接入了GPT和其它一些開源的模型。
娛樂資本論:請(qǐng)介紹下你們最近上線的內(nèi)容輔助生成工具。?
雷濤:AI成文產(chǎn)品是我們希望用戶只需要寫一個(gè)標(biāo)題,內(nèi)容就能生成出來;文生圖是希望用戶在缺乏視頻素材時(shí)也能用圖片素材進(jìn)行替換。聲音方面,我們給用戶提供了幾十種風(fēng)格的?AI?聲音選擇,后面也會(huì)開放權(quán)限讓用戶通過AI訓(xùn)練自己的聲音。而文生視頻可以把以上的模塊綜合調(diào)用起來。
為了滿足用戶出鏡的需求,我們也會(huì)推出數(shù)字人??紤]到成本,目前會(huì)偏向于2D數(shù)字人來替代用戶出鏡。諸如一些播報(bào)場(chǎng)景,能做一些簡(jiǎn)單的動(dòng)作。
02?為垂直行業(yè)和企業(yè)定制專屬視頻素材庫(kù)??
娛樂資本論:請(qǐng)概括你們的用戶群體和商業(yè)模式。?
雷濤:C端用戶主要是對(duì)剪輯沒概念,沒用過剪輯工具的“小白”。B端主要是服務(wù)營(yíng)銷類行業(yè)。比如營(yíng)銷公司需要生成大量不同表述方式的文案,我們可以極大地降低他們的工作量。對(duì)于視頻質(zhì)量要求不是特別高的情形基本都能滿足,比如醫(yī)美行業(yè)的種草視頻生成。
從目前的一些數(shù)據(jù)看,B端付費(fèi)客戶目前主要分布在東南沿海地帶??破铡蕵飞钚袠I(yè)的客戶反饋比較正向,而家具、中藥等細(xì)分垂類行業(yè)是我們還需要努力的方向。
當(dāng)然,作為一款通用型產(chǎn)品來講,我們目前也很難涵蓋到所有用戶使用的素材量,因?yàn)橐曨l廣度太大了。解決方案是用戶可以自己上傳專有素材,我們幫你做結(jié)構(gòu)化處理。我們的產(chǎn)品現(xiàn)在很難做到一鍵生成后不修改直接過,而是類似“輔助駕駛”,輔助用戶創(chuàng)作這樣的定位。
此外,我們也給企業(yè)提供私人定制化解決方案,能把我們庫(kù)里的視頻移到他們的媒資庫(kù),也可以為他們的素材做結(jié)構(gòu)化處理,給他們做視頻化長(zhǎng)尾詞的搜索引擎優(yōu)化。我們后端是一套視頻搜索機(jī)制,像搜索引擎一樣,他們搜視頻標(biāo)題,我們能搜到畫面幀數(shù)。
目前來看,一些營(yíng)銷端、自媒體、融媒體機(jī)構(gòu)的需求比較集中,相對(duì)聚焦在餐飲、快消、小家電這幾個(gè)領(lǐng)域。至于具備場(chǎng)景開發(fā)能力的客戶,我們可以協(xié)助他進(jìn)行自己的視頻素材存儲(chǔ)和開發(fā)。
近期,我們還會(huì)發(fā)布一個(gè)面向政務(wù)的垂直模型。
娛樂資本論:ChatGPT出現(xiàn)后,給你們帶來什么影響?
雷濤:激發(fā)了大家對(duì)同類產(chǎn)品的興趣。我也看到一些人,會(huì)誤以為AI馬上要統(tǒng)治人類了,實(shí)際上AIGC目前更多是輔助內(nèi)容生產(chǎn)。
娛樂資本論你們主要盈利點(diǎn)在B端還是C端?
雷濤:從商業(yè)前景來講是偏重于B端。我們計(jì)劃后續(xù)開辟專門的板塊,幫助KOL接入駐的營(yíng)銷公司比如本地生活,快消、種草的商單,實(shí)現(xiàn)商業(yè)變現(xiàn)的服務(wù)。目前,我們B端需求處于積壓狀態(tài)。至于C端我們也計(jì)劃開發(fā)類似的出海產(chǎn)品。
娛樂資本論:平臺(tái)為什么會(huì)把商單給你們呢??
雷濤:過去是集中于對(duì)頭部?KOL?的投放,現(xiàn)在驗(yàn)證了在很多場(chǎng)景下,這種策略是無效的,因此投放趨勢(shì)是往下沉去走,尤其是在流量日趨碎片化的趨勢(shì)下。
很多KOC的訂單單價(jià)低,比如200塊錢,但是量大,廣告主或平臺(tái)需要對(duì)接大量的創(chuàng)作者。我們通過聚集這些零散的創(chuàng)作者,讓平臺(tái)找我們性價(jià)比更高,省時(shí)省力。
娛樂資本論:如果平臺(tái)察覺AI生成的內(nèi)容同質(zhì)化嚴(yán)重時(shí),會(huì)降低創(chuàng)作者的權(quán)重,你們有應(yīng)對(duì)方法嗎??
雷濤:我們產(chǎn)品的核心不在于跟算法對(duì)抗。要讓視頻效果越來越好,提高它“類人”的程度。AIGC內(nèi)容就是會(huì)沖擊原有社區(qū)的真人氛圍,這種影響難以避免。
平臺(tái)自身也會(huì)積極擁抱AIGC,這對(duì)他們有好處。假設(shè)技術(shù)能力不被別人甩開的情況下,AIGC能讓平臺(tái)更好地控制內(nèi)容,以滿足用戶需要。很多用戶就不在乎內(nèi)容是不是真人做。平臺(tái)能跳過真人,直接對(duì)接到用戶需求、生產(chǎn)內(nèi)容,用戶粘度會(huì)更高。
互聯(lián)網(wǎng)的“視頻化”已經(jīng)通過人完成了80%,剩下?20%?如果是通過AIGC去完成的,最終互聯(lián)網(wǎng)的視頻化會(huì)走向100%。那時(shí)它的承載介質(zhì)不一定是手機(jī),未來如何,值得期待。