短視頻系統(tǒng)開發(fā)變速功能,如何避免音頻變調(diào)?
隨著短視頻系統(tǒng)的發(fā)展,短視頻內(nèi)容的錄制時(shí)長(zhǎng)已經(jīng)不局限于十幾秒了,這就讓幾十秒甚至幾分鐘的短視頻越來越多,不少用戶在觀看此類視頻時(shí),會(huì)有倍速播放的需求,所以在短視頻系統(tǒng)開發(fā)時(shí)變速功能不可或缺,不過在實(shí)現(xiàn)變速功能時(shí)要如何避免音頻變調(diào)問題呢?

一、聲音的三要素
短視頻系統(tǒng)開發(fā)的變速功能,涉及視頻變速和音頻變速,其中音頻變速主要圍繞聲音進(jìn)行,所以我們要全面了解聲音,首先需要了解的就是聲音的三要素:
1、響度
在短視頻系統(tǒng)開發(fā)中,響度通常是指聲音能量的強(qiáng)弱,主要取決于振幅的大小。
2、音調(diào)
聲音的音調(diào)通常取決于聲波基頻的高低,一般不同樂器基頻不同、不同性別基頻也不同。
3、音色
聲音主要是由發(fā)生物體振動(dòng)產(chǎn)生,在聲音產(chǎn)生時(shí),主體振動(dòng)發(fā)出的是基音,其余部分振動(dòng)產(chǎn)生的是泛音,而音色則取決于這些泛音。

二、如何實(shí)現(xiàn)變速但不變調(diào)
在短視頻系統(tǒng)開發(fā)變速功能時(shí),為避免音頻變調(diào)問題會(huì)用到以下兩種算法:
1、時(shí)域壓擴(kuò)
在短視頻系統(tǒng)開發(fā)中,音頻分析處理領(lǐng)域可以分為時(shí)域和頻域,時(shí)域壓擴(kuò)主要是在時(shí)域上對(duì)音頻信號(hào)進(jìn)行處理:
(1)分幀處理:分幀單元控制在20ms-50ms周期波;幀與幀之間需要實(shí)現(xiàn)50%-75%的重疊,以保證幀間的平滑過度。
(2)加窗處理:分幀處理后需要對(duì)每幀做加窗處理以避免頻譜泄露;
(3)合幀處理:經(jīng)過合幀處理后就可以實(shí)現(xiàn)變速了。
2、波形相似疊加
在短視頻系統(tǒng)開發(fā)時(shí),只使用時(shí)域壓擴(kuò)算法雖然可以實(shí)現(xiàn)變速功能,但加窗函數(shù)在緩解波形不連續(xù)問題的同時(shí),還卻會(huì)帶來相位跳躍失真問題,所以為避免該情況需要在短視頻系統(tǒng)開發(fā)時(shí),將時(shí)域壓擴(kuò)算法與波形相似疊加算法組合使用。

在短視頻系統(tǒng)開發(fā)的短視頻功能中,聲音是傳遞有效信息的重要方式之一,我們?cè)趦?yōu)化用戶的使用體驗(yàn)時(shí),不能以犧牲聲音質(zhì)量為前提,所以在短視頻系統(tǒng)開發(fā)變速功能時(shí),做通過正確的方法處理好音頻變速不變調(diào)問題。
聲明:本文由云豹科技原創(chuàng),轉(zhuǎn)載請(qǐng)注明作者名及原文鏈接,否則視為侵權(quán)