最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

理性認識百度研究院“新品”:VidPress給出了視頻生產新方向

2020-04-23 20:50 作者:Alter聊  | 我要投稿


擁抱短視頻,可能是最近自媒體圈中最為流行的關鍵詞。

單是微信視頻號的灰度測試,就讓媒體圈重度地震,原本隱藏在文字背后的“中年大叔”們勇敢出鏡,試圖抓住新生的機會窗口。和媒體朋友們日常聊天的話題,也不自覺地拐向了短視頻,有人購置了專業(yè)的影像設備,有人連忙招聘熟悉視頻剪輯的助理……

于是當百度研究院推出AI合成短視頻平臺VidPress的消息傳出后,媒體圈里再次炸開了鍋,排著隊通過百度創(chuàng)作大腦進行測試申請,爭先將自己剛剛寫就的深度文轉化為有聲有色的短視頻。畢竟VidPress的“果子”不可謂不誘人,只要輸入一個圖文內容的鏈接,就能自動生成相應的視頻內容,極大地節(jié)約了成本和心力。

一番嘗鮮后,有人給了VidPress高分評價,也有人對效果的不滿意而詬病。鑒于兩種或贊或罵的態(tài)度,這里分享一下個人對VidPress的思考,到底是理想又一次敗給了現實,還是一開始就期許過高?

01 智能化內容生產的原理

VidPress詮釋的視頻生產方式,足以用“智能”一詞來形容。

用戶輸入圖文內容的鏈接后,VidPress將在9分鐘的時間內完成視頻素材的聚合、解說詞生成、語音合成、音視頻對齊和渲染導出等一連串的“騷操作”,平均每天可以生產500到1000條視頻,妥妥秒殺了整條街的“剪刀手”。

這樣的內容生產方式夸張嗎?不妨先來看看“黑魔法”背后的技術原理。

整個內容生產過程可以分為三個環(huán)節(jié):

第一個環(huán)節(jié)是音頻內容的生成,平臺基于多種語言模型對圖文內容的文字部分進行處理,然后自動生成一篇字數符合要求且適合視頻呈現的解說詞,再通過文字轉音頻服務(TTS)合成解說詞語音;

同步進行的環(huán)節(jié)是視頻內容的生成,平臺會對圖文內容進行語義理解,根據文章內容自動搜索相關素材,再通過計算機視覺技術對素材進行分析和理解,然后精選出合適的素材進行智能剪輯合成;

最后一個環(huán)節(jié)是音視頻的對齊,這就涉及到百度的第二代時間軸對齊算法,選取文本中的興趣點,再將視頻片段與興趣點的相關度進行打分,優(yōu)質的視頻片段將優(yōu)先放入時間軸,最終進行渲染輸出。

對于熟悉百度技術體系或產品體系的朋友來說,恐怕不會驚訝VidPress的存在邏輯。單是百度大腦已經對外開放的技能中,諸如自然語言理解、語音合成、計算機視覺相關的技能就占了不小的比重。聚焦到產品上,小度智能音箱的語音問答、動態(tài)播報、人臉識別等等,都不難在VidPress找到相似的技術。

只是短視頻內容的生產從來都不是純粹的技術工作,素材、創(chuàng)意、選題等都影響著最后的視頻質量。VidPress的價值在于利用算法和模型降低了素材搜集、整理、匹配、剪輯的時間成本,與當下大多數落地應用的人工智能產品相似,尚未實現取代人工甚至完勝人工的智能化程度。

也就是說,現階段的VidPress還只是輔助人工合成視頻,降低了短視頻剪輯的門檻和成本,本質上是為內容生產提供了新的思路。

02 視頻合成中的制約因素

有些遺憾的是,不少媒體朋友看到新聞后對VidPress進行了測試,然后出現了一些負面的過度解讀。

為什么會出現視頻合成效果不盡如意的現象?還是要回到視頻內容生成的環(huán)節(jié)。就技術層面來說,素材的智能識別、匹配、剪輯等過程已經沒有太大的技術瓶頸,問題恰恰出在了內容素材的廣度上。

畢竟現階段的人工智能遠未達到自主生產視頻內容的程度,VidPress也需要對網上的內容進行搜索匹配,扮演了內容“搬運工”的角色。對應的一幕就是:在科技、娛樂、軍事等內容素材豐富的領域,VidPress的表現不乏可圈可點之處,也不難看到一些精彩的視頻案例;在一些新聞素材比較少的冷門領域,合成視頻的效果也就打了折扣。

舉兩個通俗易懂的例子。

倘若你上傳的是娛樂圈和某明星相關的內容,不難在網上搜羅出豐富的素材,畢竟可以找到海量的電影、電視劇、綜藝等資源,VidPress可以在人臉識別算法、時間軸對齊算法的基礎上,對素材內容進行精準識別、匹配、合成,內容豐富度和流暢度上恐怕不輸于專業(yè)的視頻剪輯團隊。

如果圖文內容屬于情感、公益、社會相關的冷門內容,話題本身就比較寬泛,其中還有較大比重的敏感內容,可以使用的內容素材也就相對有限,導致平臺可以聚合的內容素材數量偏低,即便技術和算法進一步優(yōu)化,也難逃“巧婦難為無米之炊”的困境。

歸根結底,內容素材的豐富度才是VidPress場景應用時的制約因素。

同時需要思考的恰恰是我們對內容生產的態(tài)度,VidPress的基本價值在于工具,提供了一種有別于傳統(tǒng)人工的視頻合成思路,降低了視頻內容生產的難度值??蓪τ诿襟w人來說,仍然需要躬身打磨內容輸出有價值的觀點,繼而利用VidPress實現價值的最大化,畢竟視頻只是傳播的載體,優(yōu)質內容永遠是話語權的關鍵。

或許對VidPress也是一種啟示,經過了前期的試錯后,還需要對產品的定位進行調整,比如在定制化與垂直品類上增加力度,在適用場景上進行選擇,盡可能避開小眾內容在素材上的限制,打造通用的解決方案。

03 未來可能的產品方向

站在百度的立場上,在短視頻的風口期推出AI合成短視頻平臺,恐怕不是為了秀技術吸引眼球。

從圖文到短視頻再到直播,內容的傳播方式越來越多元化,但在傳播載體不斷進化的時候,內容的生產方式似乎有些陳舊。從博客時代到公眾號時代,從長視頻時代到短視頻時代,內容的表達越來越個性化,可內容生產一直是“笨拙”的人工。

內容傳播載體的進化制造了一個又一個風口,當內容創(chuàng)作方式同步進化時,卻可能改變一個時代,所能創(chuàng)造的想象空間同樣不可小覷。截止到目前,VidPress還處于小批量免費試用的階段,與百度內部人士進行溝通后發(fā)現,等待VidPress可能會有工具和平臺兩種產品方向。

從工具的方向來看,VidPress大概率會以SaaS服務的形態(tài)存在,可以在百度智能云上部署運營,也可以進行私有化部署。前一種可以服務大部分內容創(chuàng)作者,提供視頻快速剪輯合成的線上工具,并且可以與內容版權方進行跨界合作,為創(chuàng)作者提供一站式的視頻內容生產服務;后一種則是將能力賦予專業(yè)化的內容團隊,以人工智能的技術優(yōu)勢幫助創(chuàng)作團隊提升效率、降低成本。

從平臺的方向上看,VidPress將在現有工具屬性的基礎上,與百家號、好看視頻、百度聯盟等內容生態(tài)打通,形成視頻內容生產、分發(fā)、變現的完整產業(yè)鏈。只是生態(tài)化布局的前提是解決內容版權的局限,當前VidPress還僅是邀請測試,并不涉及商業(yè)用途,正式開放后就需要百度提供免費的版權視頻庫,與一些第三方視頻版權庫合作,并設計出一套按需付費的商業(yè)模式。

當然,上述的種種可能只是猜測,最終的產品演化方向還要靠百度的產品經理們給出回答。但這樣的產品出現,對媒體的影響要遠大于某個內容平臺的崛起,我們不僅要思考下一波流量在哪里,還需要深入思索自身的核心競爭力在哪里,如何與人工智能進行分工協同,在未來的內容生態(tài)中準確找到自身的定位。

幾乎可以篤定,傳統(tǒng)純消耗腦力和時間的內容生產終將被被顛覆,卻也是VidPress的第二代或者第三代產品的使命,現階段還有些“稚嫩”。

04 寫在最后

相較于被下一個風口拋棄的焦慮,不妨多花點時間思考內容消費的內在邏輯:當一個熱點出現時,需要多維度的觀察的報道,需要讓受眾客觀的了解事件的始末,也就需要多種不同的聲音。輸出有價值的信息,可以說是內容創(chuàng)作最基本的競爭力,剩下的無非是基于成本、效率和用戶口味的權衡。

VidPress試圖呈現的正是降低“發(fā)聲”的門檻,推動互聯網內容的多樣性。只是現階段還要先延遲一些期待,靜待VidPress后續(xù)的能力輸出。


理性認識百度研究院“新品”:VidPress給出了視頻生產新方向的評論 (共 條)

分享到微博請遵守國家法律
广水市| 西峡县| 菏泽市| 正镶白旗| 金乡县| 青州市| 新沂市| 东丽区| 盘锦市| 崇文区| 正宁县| 顺昌县| 乐山市| 灵寿县| 高台县| 利津县| 靖远县| 明溪县| 通海县| 灯塔市| 马鞍山市| 吉木乃县| 如东县| 建阳市| 托克逊县| 宜川县| 延长县| 巴南区| 华亭县| 蒙自县| 道真| 行唐县| 吴川市| 县级市| 苏尼特左旗| 和顺县| 德清县| 左权县| 渝北区| 屏东市| 阿瓦提县|