【聊點兒別的】白日做夢-空想了兩種白嫖AI字幕的手段(RainWay)
最近想到一個白嫖AI字幕的歪點子,我知道這樣白嫖人家服務(wù)器算力是不對的,但我就是想白嫖!??!
現(xiàn)在AI轉(zhuǎn)文字的算法很成熟,恰巧我又非常懶,配字幕這種效率極為低下的重復(fù)工作就應(yīng)該交給機(jī)器,不然一條條的就分割時間軸再配上字幕,太浪費時間了,我的視頻本就是有文稿的,只需要做最后的校對工作就可以,所以我就去找了語音轉(zhuǎn)文字的AI字幕軟件,結(jié)果發(fā)現(xiàn)都要收費,這就非常蛋疼!?。偱瓢?,割我韭菜是不可能的!你還是死了這條心吧!然后我死心了,不給視頻配字幕了!?。〉乔瓣囎用腿幌肫饋硪患?,讓萬念俱灰的我猛然頓悟,我TM直接死灰復(fù)燃飛出大氣層!簡稱升天!
最初的靈感來自于和朋友聊天,朋友打字老是使用輸入法的語音轉(zhuǎn)文字功能,非常便捷,而這個輸入法語音轉(zhuǎn)文字的功能,本質(zhì)上和我們AI生成字幕沒有區(qū)別,但它是免費的?。?!只不過字幕多出了一個時間軸,然后就成了收費功能?就很迷惑?!所以我們可以有這樣一個解決思路來白嫖。
語音轉(zhuǎn)文字主要分為三個階段,第一個階段錄音并把錄音文件上傳到云服務(wù)器,第二個階段通過云端服務(wù)器的算法把錄音轉(zhuǎn)換成文字,第三個階段則是把轉(zhuǎn)換好的文字返回到用戶設(shè)備上。既然語音轉(zhuǎn)文字的功能在輸入法軟件上是免費的,那我們?yōu)槭裁床豢梢詣油崮X筋打這個輸入法的主意?不考慮逆向工程和破解加密的難度,我們可以截取輸入法的語音轉(zhuǎn)文字API(接口),通過本地程序?qū)⑿枰帜坏囊纛l分好時間軸,然后將音頻拆成一小塊一小塊上傳到我們截取的語音轉(zhuǎn)文字接口,獲取返回值,自動填充到對應(yīng)時間軸上,成功白嫖AI字幕!那可以供我們惦記的軟件有哪些?一大堆輸入法都有這個功能,不再列舉,我們還可以打語音助手的主意,比如小米的小愛同學(xué),蘋果的Siri,微軟的小娜等等,甚至我們可以把手伸到騰訊頭上,比如QQ和微信內(nèi)置的語音轉(zhuǎn)文字,當(dāng)然,實現(xiàn)這一切的前提我們能拿到他們的接口并破解加密,不然為什么會有這么多付費的AI字幕軟件?
OK,上面這個思路看起來可行性很高,但難度過大,那我還有個切實可行的思路,傳值!直接破解不行,是吧?難度高還有違法的風(fēng)險,那我們就換個合法的途徑來白嫖!既然我不能破解你,那我就正兒八經(jīng)的使用你!
我們還是利用軟件將需要配字幕的音頻劃好時間軸,不同的是,這次我們要利用輸入法,開啟輸入法的語音轉(zhuǎn)文字功能,將劃好時間軸的音頻拆分成一小段一小段的傳給輸入法,讓輸入法轉(zhuǎn)換成文字,然后自動填充到對應(yīng)時間軸,問題解決,成功白嫖!
當(dāng)然,這些終歸是我個人的猜想,說的直接點就是白日做夢,具體可行性有待驗證,大家就當(dāng)個樂子,我也不建議大家去做,尤其是開發(fā)者,在違法的邊緣瘋狂試探,這太危險了!還是希望視頻平臺都給力點吧,盡快推出自家的AI字幕軟件,方便創(chuàng)作者。

?