04 了解AI計算機視覺

計算機視覺是 AI 的一個領(lǐng)域,它負責(zé)處理視覺對象。 讓我們了解一下計算機視覺帶來的一些可能性。
Seeing AI 應(yīng)用是一個很好的計算機視覺示例。 Seeing AI 應(yīng)用專門面向盲人和弱視群體,它利用 AI 的力量來打開視覺世界,描述附近的人、文字和物體。
觀看以下視頻,詳細了解 Seeing AI。

若要了解詳細信息,請查看?Seeing AI 網(wǎng)頁。
計算機視覺模型和功能
大多數(shù)計算機視覺解決方案都基于機器學(xué)習(xí)模型,這些模型可應(yīng)用于來自相機、視頻或圖像的視覺輸入。 下表描述了常見的計算機視覺任務(wù)。
任務(wù)說明
圖像分類

圖像分類涉及訓(xùn)練機器學(xué)習(xí)模型,使其根據(jù)圖像內(nèi)容對圖像進行分類。 例如,你可以在交通監(jiān)控解決方案中使用圖像分類模型,根據(jù)圖像所包含的車輛類型(例如出租車、公共汽車、騎自行車的人等)對圖像進行分類。
物體檢測

對象檢測機器學(xué)習(xí)模型經(jīng)過訓(xùn)練,可以對圖像中的單個對象進行分類,并使用邊界框確定其位置。 例如,交通監(jiān)控解決方案可使用對象檢測來識別不同類別車輛的位置。
語義分割

語義分割是一種高級機器學(xué)習(xí)技術(shù),其中圖像中的各個像素根據(jù)其所屬的對象進行分類。 例如,交通監(jiān)控解決方案可能會在交通圖像上覆蓋“蒙版”圖層,以使用特定顏色突出顯示不同的車輛。
圖像分析

你可以創(chuàng)建結(jié)合使用機器學(xué)習(xí)模型和高級圖像分析技術(shù)從圖像中提取信息的解決方案,包括可以幫助對圖像進行歸類的“標(biāo)簽”,甚至可以歸納總結(jié)圖像中所示場景的描述性標(biāo)題。
人臉檢測、分析和識別

人臉檢測是對象檢測的一種特殊形式,可以在圖像中找出人臉。 這可以與分類和面部幾何分析技術(shù)相結(jié)合,用于根據(jù)他們的面部特征來識別個人。
光學(xué)字符識別 (OCR)

光學(xué)字符識別是一種用于檢測和讀取圖像中文本的技術(shù)。 你可以使用 OCR 讀取照片中的文字(例如:路標(biāo)或店面),或從掃描的文檔中提取信息,例如字母、發(fā)票或表格。
Microsoft Azure 中的計算機視覺服務(wù)
Microsoft Azure 提供了以下認(rèn)知服務(wù)來幫助你創(chuàng)建計算機視覺解決方案:
服務(wù)功能
計算機視覺:你可以使用此服務(wù)來分析圖像和視頻,提取說明、標(biāo)記、對象和文本。
自定義視覺:通過此服務(wù),你可以使用自己的圖像訓(xùn)練自定義圖像分類和對象檢測模型。
人臉:人臉服務(wù)讓你能夠構(gòu)建人臉檢測和面部識別解決方案。
表單識別器:你可以使用此服務(wù)從掃描的表單和發(fā)票中提取信息。