POLY博詣如何讓遠(yuǎn)程溝通高效順暢?
智慧生活從點(diǎn)進(jìn)【惠普】嗶哩嗶哩開始,歡迎大家!惠普哥在這里恭候多時啦,想知道更多產(chǎn)品背后的研發(fā)細(xì)節(jié)?想了解更多科技生活可能?
?從本月起,惠普哥將會定期開設(shè)科普學(xué)院欄目,為大家?guī)硪幌盗谢萜胀黄菩援a(chǎn)品技術(shù)的深度解讀,揭秘產(chǎn)品背后的巧思與妙想,探索科技生活的更多便利與溫暖。

在一場“溝通”中,溝通對象雙方傳遞和交換的并不僅僅只有文字信息。這也就是為何我們常常會使用察言觀色、言外之意等成語來形容那些隱含在文字和對話之外的信息傳遞。
?
一、?溝通中的大部分信息傳遞,都是非語言性的
早在1872年,英國生物學(xué)家查爾斯·羅伯特·達(dá)爾文(Charles Robert Darwin)就提出了「非語言溝通」的概念。他認(rèn)為,在人際溝通過程中,部分信息是「通過非語言途徑所呈現(xiàn)的信息」,這其中包括語調(diào)、肢體語言等重要部分?。
?

科技的進(jìn)步,讓遠(yuǎn)程溝通的需求通過語音、視頻通話等方式實(shí)現(xiàn)。但遠(yuǎn)程溝通的效率依然會受到視頻或音頻設(shè)備能力的限制,如畫面顯示的清晰度問題,環(huán)境噪音的干擾,導(dǎo)致溝通雙方無法完整的接受對方的全部信息,如表情、肢體語言甚至是語氣語調(diào)。最后使得溝通成本增加、降低了溝通的效率。
?
那么有沒有什么辦法,能夠提升溝通效率,讓人們的遠(yuǎn)程溝通更加高效?
?
二、?POLY博詣如何讓遠(yuǎn)程會議身臨其境?
1、?機(jī)器識別配合聲源定位算法,確保表情動作清晰呈現(xiàn)
POLY博詣將機(jī)器學(xué)習(xí)和音頻定位融入攝像頭之中,并根據(jù)用戶使用場景設(shè)計獨(dú)家算法,打造獨(dú)特的「Director AI技術(shù)」,以多個取景模式實(shí)現(xiàn)對參會人員表情、動作的真實(shí)捕捉,力求將視頻會議變得更加高效。
?

首先,Director AI會利用機(jī)器學(xué)習(xí)算法掃描視野,對鏡頭畫面進(jìn)行人像頭部檢測,僅用于識別與會人員的方位、數(shù)量等信息,不對人物身份進(jìn)行識別,而且不做數(shù)據(jù)存儲。這樣做,既可以避免人臉信息的數(shù)據(jù)傳輸,同時也能提高攝像頭的追蹤性能。此外,攝像頭還會對參會者的位置關(guān)系、傾斜程度、真實(shí)程度等情景進(jìn)行實(shí)時分析演算,盡可能地不遺漏任何一個與會者。
?
此外,POLY博詣還會在特定模式配合專門的聲源定位算法(SSL)識別聲音方位和來源陣列,以協(xié)同配合鎖定發(fā)言人、并調(diào)用攝像頭進(jìn)行取景,來實(shí)現(xiàn)更為精準(zhǔn)的視頻切換與追蹤。
聲源定位算法(SSL)會采用專有的拾音單元計算出聲音來源位置,同時基于頭部數(shù)據(jù)、聲音等關(guān)鍵因素進(jìn)行綜合判斷:如果捕捉到的數(shù)據(jù)是較傾斜的側(cè)面人臉,算法會判定為此人不在會議中或不屬于重要發(fā)言位置,則不會對此側(cè)面人臉畫面進(jìn)行拾取并傳輸給遠(yuǎn)端;如果捕捉到的是正面人臉,算法則會自動鎖定正面人臉并將畫面?zhèn)鬟f給遠(yuǎn)端。
?
正是通過Director AI技術(shù)的多種取景模式,使得攝像頭更加智能,猶如有一位導(dǎo)播在對會議進(jìn)行實(shí)時操作和畫面切換,帶給用戶更加智能化、平等的會議體驗(yàn)。
?
以群組取景模式為例,POLY博詣攝像頭先會基于模式識別算法識別出不同人臉,并給予不同大小的識別框。這些識別框,會用于進(jìn)行畫面的傳輸和裁剪。
?

其中,綠色框內(nèi)的人臉是POLY博詣攝像頭判斷的中心,而藍(lán)色框內(nèi)則是設(shè)備輸出給遠(yuǎn)端的實(shí)際圖像畫面,藍(lán)色框會基于綠色框內(nèi)人臉的實(shí)時變化而進(jìn)行變化,這樣能讓所有與會者保持在畫面中央,進(jìn)而展現(xiàn)更加清晰的與會者畫面。攝像頭還會根據(jù)與會者人數(shù)自動縮小或者放大畫面。
?
在「人物取景」模式中,POLY攝像頭可以將同一畫面的幾位與會者分為獨(dú)立的單個畫面?zhèn)魉徒o遠(yuǎn)端,也可以將獨(dú)立的個人畫面合成一個畫廊。舉個例子,一共有5個人參與了遠(yuǎn)程視頻會議,但由于屏幕的限制導(dǎo)致與會者無法看清每個人,這時候攝像頭給會議室中的每一位參與者特寫鏡頭,并通過技術(shù)處理,將所有特寫鏡頭的畫面放在一個畫面中。
?

?
根據(jù)不同的使用場景,用戶還可以設(shè)置將單流畫面分成多流畫面,讓處于同一空間、共享一個攝像頭的不同參會者也能以不同用戶的身份參與到會議中。
?
此外,POLY還推出了專門的「發(fā)言人追蹤」模式,發(fā)言人取景與發(fā)言人追蹤模式所用到的聲源定位算法原理類似,但也有所區(qū)別。發(fā)言人取景模式下,聲源定位算法會實(shí)時檢測聲源位置;發(fā)言人追蹤模式下,算法會周期性地檢測聲源的位置,如果出現(xiàn)無人發(fā)聲的情況,將鎖定當(dāng)前識別的人臉畫面并且進(jìn)行追蹤。這也是發(fā)言人追蹤模式的特別之處,主講人就算不出聲、只是進(jìn)行肢體移動,攝像頭也不會丟失追蹤焦點(diǎn),確保時刻聚焦的出色視頻體驗(yàn)。
?

2、拾音魔墻(Acoustic Fence)加持,真實(shí)傳達(dá)語音語調(diào)
?

POLY不止聚焦于視頻技術(shù)的精進(jìn),針對聲音傳輸環(huán)節(jié),POLY早在7-8年前就推出了拾音魔墻Acoustic Fence功能。拾音魔墻Acoustic Fence功能通過排列主麥克風(fēng)和Fence麥克風(fēng)的位置,再用算法識別用戶周圍的聲音,對有效聲音進(jìn)行拾取、對噪音進(jìn)行過濾。這就像為用戶豎起了一堵隱形的噪音屏蔽墻。
?
拾音魔墻Acoustic Fence的主麥克風(fēng)負(fù)責(zé)拾取收音范圍內(nèi)的音頻并進(jìn)行傳輸,F(xiàn)ence麥克風(fēng)則負(fù)責(zé)接收環(huán)境噪音、將圍欄外的聲音進(jìn)行過濾。在拾音范圍內(nèi)的聲音,算法會判定為有效聲音,主麥克風(fēng)會對有效聲音進(jìn)行拾取并傳輸;針對拾音范圍外的聲音,算法會對噪音進(jìn)行有效消除;如同時有噪音和用戶的人聲,算法會對噪音抑制 – 10~12db,凸顯演講者的聲音。用戶可以自行設(shè)定設(shè)備的有效拾音范圍,來決定這堵墻的屏蔽區(qū)域,以實(shí)現(xiàn)個人和團(tuán)隊(duì)會議不同的拾音需求。
?

拾音魔墻Acoustic Fence在不同的設(shè)備上的樣式也各有差異,比如在音箱產(chǎn)品的Sound Bar上的陣列是自定義扇形,用戶可以自行設(shè)定扇形的角度,根據(jù)使用需求靈活調(diào)整扇形的覆蓋角度;在更加復(fù)雜的會議室場景中采用模塊化的會議室解決方案時,可以通過連接多個處于不同平面的麥克風(fēng)的形式,在空間中打造一個更為立體的復(fù)雜的拾音魔墻,以滿足對于不同聲場環(huán)境的適配。
?
此外,POLY博詣還充分發(fā)揮Director AI技術(shù)和拾音魔墻Acoustic Fence的協(xié)同作用,拾音魔墻可以輔助Director?AI進(jìn)行演講者識別,幫助其更加準(zhǔn)確地識別當(dāng)前演講人、給到特寫;當(dāng)Director AI將鏡頭切換到對應(yīng)演講者,拾音魔墻Acoustic Fence的范圍也會調(diào)整到當(dāng)前的以演講者為中心。用戶無需手動調(diào)整鏡頭和耳機(jī),算法會自動進(jìn)行運(yùn)算和更新。舉個例子,用戶從一張椅子移動到另一張椅子,攝像頭會同步對畫面進(jìn)行切換,拾音魔墻Acoustic Fence也會將隱形隔音墻移動到另一張椅子,將拾音范圍外的噪音屏蔽。
?

3、通過混合式降噪(ANC)技術(shù),讓發(fā)言者細(xì)微的語氣也能被聽眾感知
雙向的溝通除了能看能說,還少不了聆聽這個重要環(huán)節(jié)。而這部分,就需要在接收端進(jìn)行努力。
市面上已經(jīng)有許多耳機(jī)使用「主動降噪」功能。其原理就是通過環(huán)境麥克風(fēng)搜集環(huán)境噪音,隨后通過揚(yáng)聲器產(chǎn)生一個響度一致、頻率相反的音波,來抵消掉對應(yīng)噪音的音波,實(shí)現(xiàn)降噪的目的。
?

在具體的技術(shù)實(shí)現(xiàn)上,市面上常見的主動降噪技術(shù)(也被稱為ANC,Active Noise Cancellation)有三種,分為后饋ANC、前饋ANC和混合ANC。POLY博詣利用其超過50年的遠(yuǎn)程溝通研發(fā)經(jīng)驗(yàn),充分將包含辦公室、機(jī)場等多種環(huán)境下的常見噪音考慮在內(nèi),精進(jìn)混合式ANC技術(shù),結(jié)合后饋式ANC和前饋式ANC的優(yōu)點(diǎn),給用戶帶來更好的語音通話體驗(yàn)。接下來,惠普哥就簡單給大家講講,這三種ANC技術(shù)有什么不同。
?
前饋式ANC是將麥克風(fēng)放在耳機(jī)外部,用來搜集耳機(jī)外部的全部音頻噪音,由于它相對于揚(yáng)聲器處于更外邊,可以更早地檢測到環(huán)境噪聲,進(jìn)行降噪處理,但缺點(diǎn)是無法確認(rèn)人耳最終聽到的是否依然還有漏網(wǎng)的噪聲,且只對類似汽車?yán)?、嬰兒哭聲、門鈴、鑰匙、吹口哨等1-2千赫的噪音起作用。而且在通話時,由于其降噪麥克風(fēng)位于耳機(jī)外側(cè),很容易將人的說話聲也當(dāng)成噪音進(jìn)行處理,因此會在耳邊聽到自己的回音。
?
而后饋式ANC技術(shù)是將麥克風(fēng)放置于耳朵的一側(cè),通過檢測人耳實(shí)際聽到的噪音來進(jìn)行對應(yīng)的降噪,因此它不會處理那些不會被聽到的噪音,相比較而言處理更準(zhǔn)確,但缺點(diǎn)是降噪效果和耳機(jī)的佩戴準(zhǔn)確程度息息相關(guān),且不能處理門鈴、鑰匙聲等超過800Hz的噪音,以及容易讓人感受到耳邊有雜音。
?
此外,針對后饋式ANC,雖然麥克風(fēng)接收到的雜音都來源于耳朵一側(cè),但它無法分辨究竟是耳朵能聽到的聲音、還是來源于人在說話時產(chǎn)生的骨骼共振,因此會讓人在說話時也會誤啟動降噪,從而讓人反而感覺到耳邊總有雜音。
?
針對前饋式ANC降噪不徹底、后饋式ANC在語音通話時的不足,POLY博詣以其豐富的研發(fā)經(jīng)驗(yàn),使用混合式ANC技術(shù),改善前饋式ANC和后饋式ANC的缺點(diǎn),為用戶帶來更清晰的通話體驗(yàn)。
?

混合式ANC 麥克風(fēng)被置于耳罩內(nèi)外側(cè),所需的麥克風(fēng)數(shù)量是反饋 ANC 的 2 倍以上,可同時監(jiān)控用戶聽到的聲音和背景噪音,從而生成相對舒適的降噪聲波。在耳機(jī)內(nèi)部,POLY博詣通過專門算法,將人說話時產(chǎn)生的骨骼共振雜音也考慮到降噪音波的生成中,從而降低說話過程中的耳邊雜音。此外,耳機(jī)外部的麥克風(fēng)也會同步收集來自外部的噪音來源,兩方相合,能夠產(chǎn)生相對準(zhǔn)確且自然的降噪聲波。優(yōu)質(zhì)的音頻傳輸,也會減少溝通的成本,提高聆聽效率,幫助用戶保持專注和高效。
?
此外,用戶還能通過手機(jī)APP、電腦客戶端對降噪等級進(jìn)行調(diào)整,實(shí)現(xiàn)更好的降噪體驗(yàn)。
?
這就是POLY博詣在實(shí)現(xiàn)高效溝通方面作出的努力。如果你也在為遠(yuǎn)程溝通場景尋找一個趁手外設(shè),那么以下產(chǎn)品,不容錯過:
?
用于個人音頻降噪:
【Voyager Focus 2】
https://item.jd.com/100025055636.html?
用于團(tuán)隊(duì)視頻會議:
【Poly Studio R30】
https://www.poly.com/cn/zh/products/video-conferencing/studio/studio-r30
?
還想知道惠普更多的產(chǎn)品背后的科技與故事?歡迎關(guān)注「惠普」官方嗶哩嗶哩賬號、關(guān)注「科普學(xué)院」專欄,我們下期見~!?
<廣告>