一種基于YOLO物體識別的彩六直播方式
本人沒有太多時間、精力進行相關(guān)方法的實現(xiàn),只是記錄下個人的想法。也歡迎有能力實現(xiàn)這個方案的大佬嘗試下把這個想法變成現(xiàn)實~
當然,這篇文章也只是提出一個假設(shè),我并沒有嘗試過這樣究竟能不能行

YOLO是一種性能優(yōu)異的圖像識別算法,可以識別圖片內(nèi)的物體并將其標記出來。

我們的目的,即是:通過模型把一張彩六的圖像轉(zhuǎn)化成一個個帶有標記的方框。
此時,我們將原視頻的畫面用純白替代(或者用基于動態(tài)視力的直播方式替代),前景使用標記出來的方框(還可以加上姿態(tài)識別,這樣看得更清楚些),即可進行彩六的直播。
對于音頻方面,可以使用語音轉(zhuǎn)文字的模型,需要專門訓練一個槍聲的模型,這樣音頻也轉(zhuǎn)化為文字,可以在屏幕上顯示出來。至于槍聲的方向,以及是不是直播者自己的槍聲都可以通過訓練其他的模型解決。
總之,這套方案完全拋棄了圖像,試圖以文字代替圖像,給每一個游戲中的物體打上標簽,物體的貼圖自然可以由觀眾腦補。這樣單幀來看的話就只有一些方框和文字,沒有準確的畫面來確定到底是不是在播彩六。
標簽: