打字幕本身是個累人的技術(shù)活,如今點幾下鼠標就搞定了


大家好我是T哥。
曾經(jīng),有個叫“字幕組”的東西,聽起來他們干的活很簡單,就是給視頻加上字幕,實際上,以前給視頻加字幕,跟如今比起來,就是一個技術(shù)活。你得會字幕軟件,得會時間軸。而早期的字幕軟件,即便是圖形化的界面,我接觸過,沒有教程是完全不懂的…自己瞎摸索,也摸索不懂到底怎么折騰。
而如今的字幕軟件,同樣是圖形界面,真正做到了傻瓜式的操作,我自己摸索了10分鐘,已經(jīng)會從嵌入文本到順利出產(chǎn)字幕的全過程,簡單方便易懂。

但是,在那個時候,并不是說精通了字幕軟件的操作,就可以讓效率事半功倍了。就算你精通字幕軟件,一樣需要一句話一句話的對軸,這是沒有任何捷徑可走的,因為你對軸的是視頻的內(nèi)容,也就是語音,你打的字幕和語音沒辦法靠著某種捷徑關(guān)聯(lián),不如說打字幕本身就是這個對齊的過程,所以可以說是相當(dāng)費時了。我自己制作視頻,所以知道其中的痛苦。如果制作一個5分鐘左右的解說視頻,可以說有30分鐘甚至更久的時間是花費在對齊字幕和時間軸的過程中。如果是填滿1個小時30分鐘的劇場版動畫的字幕,加上校正,那的確是一個費時費力的工程。

而如今的字幕軟件,結(jié)合了AI語音識別的功能,也就是說,把視頻的內(nèi)容中,聲音的部分,和你的文本的部分打通了……把對齊字幕時間軸這個事情完全自動化完成。這就讓我目瞪口呆了。也就是說,如今的字幕軟件,只需要你嵌入已經(jīng)寫好的文本,利用語音識別,就能完成。原本需要一條條對軸的事情,現(xiàn)在,點幾下鼠標就完成了。這大大節(jié)省了制作字幕的時間。
而且我試了,識別對軸的準確率非常高,基本只需要做一下輕微的調(diào)整,就能完成字幕的制作??吹竭@里我自己都傻了,都不知道為什么以前要花這么多時間在視頻字幕的制作上……

不過你也肯定想問了,這個語音識別豈不是只能應(yīng)用于語音和文本是同一國的語言情況下,才能對齊語音和文本的時間軸?話是沒錯,但這個軟件ARCTIME PRO甚至還整合了翻譯機的功能。比如說,有一段日文的內(nèi)容,你想做翻譯的字幕,它可以自動識別日語的語音,然后自動生成日文的字幕,再用機翻完成翻譯。當(dāng)然你會說 ,如今的機翻還是沒有人工翻譯這么流暢和準確,但我覺得機翻這個功能還是有使用場景的。如果語法特別正式,例如產(chǎn)品發(fā)布會、新聞報道等場合,用到的一些標準的詞匯,那么機翻再稍加修飾基本就是可用的狀態(tài)。而且隨著機翻功能的迭代,它的效果一定會越來越好。
當(dāng)然,這是機翻的不夠成熟的導(dǎo)致的,而不是語音識別的或者說邏輯上的不合理導(dǎo)致的,目前的AI輔助字幕軟件,我覺得已經(jīng)消滅了字幕軟件能想得到的所有痛點,并且給了你想要的一切功能……曾經(jīng)在打字幕這件事上覺得備受折騰的我,此時淚流滿面。

字幕軟件的AI化輔助,是我最近在生活中對于AI改變生活的強感知。以前可能需要一支團隊來完成的字幕注入,現(xiàn)在可能只需要翻譯一個人就能操作。大幅節(jié)省了人員和時間成本的投入。
還有剛才提到的機翻。

以上是我用的機翻軟件,Deep L2,以前的機翻給人的印象就是,填詞造句生硬,甚至狗屁不通,但如今的機翻,我說了,只要有合適的場景,它就可以獲得理想的效果,我用機翻去外文網(wǎng)站學(xué)習(xí),和老外用英文進行交流,即便是硬核話題也可以做到互相理解。其實我自己也不知道我說的對不對,但從上下文來看,我覺得老外們肯定是讀懂了我的意思…我有日語基礎(chǔ),也可以確信我和日本人用機翻可以順利地溝通…我覺得這個世界都因為這些技術(shù)的躍騰,變得越來越近,沒有距離。
AI技術(shù)的迭代,給生活帶來的是飛躍式的遞進。再打個比方,寄快遞,或者說X寶發(fā)貨,每次都要填寫繁瑣的姓名、地址、電話的信息,非常麻煩。如今的AI填寫,你只需要把這些信息一股腦粘貼上去,AI算法會幫你自動填寫到姓名欄、地址欄、城市、電話號碼的不同欄目中,你需要做的只是確認一下信息就可以順利下單。這種技術(shù)的應(yīng)用大幅提升了發(fā)快遞的體驗,真的是“一鍵完成”。

AI技術(shù)的如此快速的發(fā)展,很多事情都是2-3年前都想不到的。AI技術(shù)大幅節(jié)約了人們的勞動時間,提升了勞動效率。但也會有人擔(dān)心,照這個發(fā)展的速度,AI全面替代人們繁瑣的勞動,社會的結(jié)構(gòu)是否也會發(fā)生改變?我覺得,這事情還是留給布局的人們?nèi)ニ伎?,我們即便胡思亂想,也改變不了這個趨勢,所以,享受AI帶來的便利就是我們需要做的。