一種基于YOLO物體識別的彩六直播方式

2023-08-13 15:49 作者:莫的昵稱改了 0人讀過 | 我要投稿

本人沒有太多時間、精力進行相關(guān)方法的實現(xiàn)，只是記錄下個人的想法。也歡迎有能力實現(xiàn)這個方案的大佬嘗試下把這個想法變成現(xiàn)實~

當然，這篇文章也只是提出一個假設(shè)，我并沒有嘗試過這樣究竟能不能行

YOLO是一種性能優(yōu)異的圖像識別算法，可以識別圖片內(nèi)的物體并將其標記出來。

我們的目的，即是：通過模型把一張彩六的圖像轉(zhuǎn)化成一個個帶有標記的方框。

此時，我們將原視頻的畫面用純白替代（或者用基于動態(tài)視力的直播方式替代），前景使用標記出來的方框（還可以加上姿態(tài)識別，這樣看得更清楚些），即可進行彩六的直播。

對于音頻方面，可以使用語音轉(zhuǎn)文字的模型，需要專門訓練一個槍聲的模型，這樣音頻也轉(zhuǎn)化為文字，可以在屏幕上顯示出來。至于槍聲的方向，以及是不是直播者自己的槍聲都可以通過訓練其他的模型解決。

總之，這套方案完全拋棄了圖像，試圖以文字代替圖像，給每一個游戲中的物體打上標簽，物體的貼圖自然可以由觀眾腦補。這樣單幀來看的話就只有一些方框和文字，沒有準確的畫面來確定到底是不是在播彩六。

標簽：

一種基于YOLO物體識別的彩六直播方式的評論 (共條)