手機站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » 04 了解AI計算機視覺

04 了解AI計算機視覺

2023-07-26 10:03 作者:A4人生網(wǎng) 0人讀過 | 我要投稿

計算機視覺是 AI 的一個領(lǐng)域，它負責(zé)處理視覺對象。讓我們了解一下計算機視覺帶來的一些可能性。

Seeing AI 應(yīng)用是一個很好的計算機視覺示例。 Seeing AI 應(yīng)用專門面向盲人和弱視群體，它利用 AI 的力量來打開視覺世界，描述附近的人、文字和物體。

觀看以下視頻，詳細了解 Seeing AI。

若要了解詳細信息，請查看?Seeing AI 網(wǎng)頁。

計算機視覺模型和功能

大多數(shù)計算機視覺解決方案都基于機器學(xué)習(xí)模型，這些模型可應(yīng)用于來自相機、視頻或圖像的視覺輸入。下表描述了常見的計算機視覺任務(wù)。

任務(wù)說明

圖像分類

圖像分類涉及訓(xùn)練機器學(xué)習(xí)模型，使其根據(jù)圖像內(nèi)容對圖像進行分類。例如，你可以在交通監(jiān)控解決方案中使用圖像分類模型，根據(jù)圖像所包含的車輛類型（例如出租車、公共汽車、騎自行車的人等）對圖像進行分類。

物體檢測

對象檢測機器學(xué)習(xí)模型經(jīng)過訓(xùn)練，可以對圖像中的單個對象進行分類，并使用邊界框確定其位置。例如，交通監(jiān)控解決方案可使用對象檢測來識別不同類別車輛的位置。

語義分割

語義分割是一種高級機器學(xué)習(xí)技術(shù)，其中圖像中的各個像素根據(jù)其所屬的對象進行分類。例如，交通監(jiān)控解決方案可能會在交通圖像上覆蓋“蒙版”圖層，以使用特定顏色突出顯示不同的車輛。

圖像分析

你可以創(chuàng)建結(jié)合使用機器學(xué)習(xí)模型和高級圖像分析技術(shù)從圖像中提取信息的解決方案，包括可以幫助對圖像進行歸類的“標(biāo)簽”，甚至可以歸納總結(jié)圖像中所示場景的描述性標(biāo)題。

人臉檢測、分析和識別

人臉檢測是對象檢測的一種特殊形式，可以在圖像中找出人臉。這可以與分類和面部幾何分析技術(shù)相結(jié)合，用于根據(jù)他們的面部特征來識別個人。

光學(xué)字符識別 (OCR)

光學(xué)字符識別是一種用于檢測和讀取圖像中文本的技術(shù)。你可以使用 OCR 讀取照片中的文字（例如：路標(biāo)或店面），或從掃描的文檔中提取信息，例如字母、發(fā)票或表格。

Microsoft Azure 中的計算機視覺服務(wù)

Microsoft Azure 提供了以下認(rèn)知服務(wù)來幫助你創(chuàng)建計算機視覺解決方案：

服務(wù)功能

計算機視覺：你可以使用此服務(wù)來分析圖像和視頻，提取說明、標(biāo)記、對象和文本。

自定義視覺：通過此服務(wù)，你可以使用自己的圖像訓(xùn)練自定義圖像分類和對象檢測模型。

人臉：人臉服務(wù)讓你能夠構(gòu)建人臉檢測和面部識別解決方案。

表單識別器：你可以使用此服務(wù)從掃描的表單和發(fā)票中提取信息。

標(biāo)簽：人工智能 AI 計算機視覺