小米這款智能眼鏡:48小時完成開發(fā),專為視障人群打造
一副眼鏡,讓視障人士也能感知到周圍的物體;一塊屏幕,可以讓聽障人士「看」到周圍聲音的方向和類別……
從零開始設(shè)計并制作出這樣的智能設(shè)備,最少需要多長時間?
答案是:不到48小時。

第四屆小米黑客馬拉松活動開放日上,從比賽中脫穎而出的隊伍們展示了他們的成果。
參加比賽的76個團(tuán)隊需要在48小時內(nèi)完成從設(shè)計開發(fā)到樣品制作的完整流程。
經(jīng)過激烈的角逐,產(chǎn)生了1個一等獎、2個二等獎、3個三等獎、6個優(yōu)秀獎與4個繁星計劃特別獎。
活動現(xiàn)場,16支獲獎隊伍中的8支對他們的成果進(jìn)行了展示,并與觀眾交流。
「無障礙設(shè)計」頗受青睞
從前沿科技到日常生活,這些成果涉及到了眾多領(lǐng)域。
值得一提的是,其中許多都與無障礙應(yīng)用有關(guān)。
AI「識物眼鏡」
獲得比賽一等獎的是一款A(yù)I「識物眼鏡」。
有了這款眼鏡,視障人士也能判斷周圍存在哪些物體,甚至是它們彼此間的關(guān)系。

這是一套基于語義理解的視覺系統(tǒng)。
它同時支持多模態(tài)輸入和輸出,可以識別物品、識別熟人,甚至能點菜、看藥品。

在現(xiàn)場,我們看到體驗者在研發(fā)團(tuán)隊的說明之下,問了一些問題。

連無糖可樂和普通可樂這種細(xì)微的差別,這副眼鏡也能分辨出來。

不僅如此,可樂的價格也能脫口而出。

只能說,一塊錢一罐的快樂水,確實是酸了。
而技術(shù)層面,這款「識物眼鏡」共分為了硬件、服務(wù)端、算法端和語言模型四個部分。

這些模塊分別負(fù)責(zé)實現(xiàn)人或物體的識別、指令的識別和理解,以及回答的生成等功能。
用手勢「控制一切」
控制家中的智能設(shè)備,用一只手就可以搞定了。
這就是我們接下來要介紹的這個獲得二等獎的「小黑盒」。
它的大名叫「小米隨心控」,通過它就能用手勢隨意控制家中的設(shè)備。
而且無需把設(shè)備置于它的視野范圍之內(nèi)。

在現(xiàn)場,我們看到體驗者將手掌對著臺燈的方向并做握拳的姿勢。
大約1秒鐘之后,亮著的臺燈就被關(guān)閉了。

硬件層面,「隨心控」由主板、相機(jī)和音箱三個部分組成。

被控制設(shè)備的位置信息預(yù)先存儲在了「隨心控」當(dāng)中。
當(dāng)攝像頭檢測到手時,系統(tǒng)會通過計算角度等信息判斷手是否指向某一設(shè)備。
接著,系統(tǒng)會對手勢進(jìn)行識別,并轉(zhuǎn)換成相應(yīng)的指令傳遞給智能音箱。
最后,控制的結(jié)果會通過音箱,以語音的形式進(jìn)行反饋。

讓聲音「看得見」
我們生活在一個充滿聲音的世界,但同樣有很多聽障人士感知不到聲音的存在。
在與人交流時,他們還可以使用手語或文字,但其他的聲音該怎么辦?
這個獲得三等獎的「聲音透視」項目,或許能給我們答案。
它可以辨別聲音的種類傳來的方向,精度約為15度角。
交談聲、警報聲、門鈴聲……會以不同的圖標(biāo)在雷達(dá)圖上顯示。

在馬路上,這項技術(shù)將能幫助聽障人士識別潛在的危險信息,比如汽車?yán)取?/p>
此外,對一般人,它也能有所幫助。
比如當(dāng)你戴著耳機(jī),聚精會神地打著游戲,與世隔絕般地屏蔽了外界的一切。
此時如果出現(xiàn)需要關(guān)注的聲音,這項技術(shù)都能識別并及時發(fā)出提醒。

技術(shù)層面,這一項目采用了聲音事件檢測算法和陣列拾音算法。
當(dāng)麥克風(fēng)捕捉到聲音信號時,系統(tǒng)對其響度、方向同時進(jìn)行計算,并對判斷聲音的種類。
三項結(jié)果會通過Websocket同步輸出到前端。
如果結(jié)合手機(jī)或智能穿戴中的接口,還可以讓提醒的形式更加豐富,比如應(yīng)用推送,甚至智能設(shè)備的振動等等。
團(tuán)隊成員也介紹,「相比于整個系統(tǒng)的設(shè)計,這將是一件很容易的事」。

此外,現(xiàn)場展示的獲獎項目還有:
全息投影虛擬人「遇?-全息智能伴侶」(二等獎)
AR交互式運動APP「趣味運動健身」(三等獎)
兒童故事聊天機(jī)器人「思維?爆發(fā)(Storykids)」(三等獎)
足球比賽分析系統(tǒng)「踢球啦」(優(yōu)秀獎)
AI智慧農(nóng)業(yè)項目「米農(nóng)」(特別獎)
你最看好哪一個項目呢?