計(jì)算機(jī)視覺CS131 :1-引言

本專輯背景
目的:系統(tǒng)性整理和復(fù)習(xí)一下計(jì)算機(jī)視覺的基本原理和發(fā)展歷程。
行動(dòng):內(nèi)容主要是斯坦福的CS131課程(CS131 Computer Vision: Foundations and Applications),北郵的魯鵬有講授該課程。但是,上述兩個(gè)資料在自學(xué)過程中,還是遇到了很多疑問,所以,這個(gè)專欄筆記中,會(huì)加上自己額外搜集(包括部分chatGPT的解釋)和整理的資料和理解作為補(bǔ)充。
主要研究資料:
CS131官網(wǎng):http://vision.stanford.edu/teaching/cs131_fall2223/
計(jì)算機(jī)視覺(本科) 北京郵電大學(xué) 魯鵬:https://www.bilibili.com/video/BV1nz4y197Qv/
chatGPT等對某專業(yè)術(shù)語的解釋。

CS131課程的知識大綱如下:

開始正文:
本節(jié)知識點(diǎn)
計(jì)算機(jī)視覺起源
人類視覺系統(tǒng)
色彩物理學(xué)
圖像在計(jì)算機(jī)中表示方法
顏色空間

1 計(jì)算機(jī)視覺起源:
計(jì)算機(jī)視覺的起源可以追溯到1966年麻省理工學(xué)院的本科暑期項(xiàng)目,當(dāng)時(shí)人們認(rèn)為計(jì)算機(jī)視覺可以在一個(gè)夏天解決。

2 人類視覺系統(tǒng)
人眼雖然能夠迅速理解圖像主題,但是容易忽視“不重要”的細(xì)節(jié)改變,比如如下兩幅圖,你能快速發(fā)現(xiàn)兩者的差異嗎?


此外,人眼容易產(chǎn)生錯(cuò)誤的判定。如下,A和B區(qū)域的顏色看上去是不是“肯定”不一樣?

實(shí)際上是一模一樣:


3 色彩物理學(xué)
電磁波:
從科學(xué)的角度來說,電磁波是能量的一種,屬于一種波,就像機(jī)械波,引力波和物質(zhì)波(概率波)一樣,凡是高于絕對零度的物體,都會(huì)釋出電磁波,且溫度越高,放出的電磁波頻率就越高,波長就越短,這種電磁波稱之為黑體輻射。正像人們一直生活在空氣中而眼睛卻看不見空氣一樣,除光波外,人們也看不見無處不在的其他電磁波。
電磁波如何產(chǎn)生的?:
基本粒子間帶電粒子周圍存在電場,運(yùn)動(dòng)的電場形成磁場,運(yùn)動(dòng)的磁場又轉(zhuǎn)化為電場,互相轉(zhuǎn)化的電磁場以光速向外傳播,形成電磁波。
比如:電子繞原子核高速旋轉(zhuǎn),就會(huì)輻射電磁波,就是光譜輻射。電子在電感電容回路中受變化電場作用而不停震蕩,就會(huì)對外輻射無線電波。電子束撞擊金屬表面,就會(huì)產(chǎn)生X射線。以上的可見光譜、無線電波、X射線都是電磁波,都是電子運(yùn)動(dòng)狀態(tài)發(fā)生變化造成的。更廣泛的說,電磁波是空間位移電荷變化而產(chǎn)生的。
可見光:
可見光(visible light)指的是電磁波的一部分。電磁波根據(jù)其波長不同可以劃分為不同波段,一般而言波長在 380 ~ 700 nm 之間的波段被稱為可見光,因?yàn)檫@一波段的電磁波可以被人類的眼睛以光的形式接收。不同人類個(gè)體接收可見光的波長范圍可能略有差異,但基本上在上述波長范圍附近。
為什么這一波段的電磁波能被人“看見”:
簡單說,就是人眼中的視黃醛分子(一個(gè)維生素 A 分子氧化后得到),在可見光照射下,會(huì)導(dǎo)致視黃醛輔基從視蛋白上脫離,后續(xù)一系列反應(yīng)產(chǎn)生神經(jīng)電信號,通過視神經(jīng)傳入大腦,讓我們產(chǎn)生了視覺。
什么是顏色?
顏色是環(huán)境中物理光與我們視覺系統(tǒng)之間相互作用的結(jié)果。顏色不是光的物理屬性。我們的視覺體驗(yàn)是心理屬性。

4 圖像在計(jì)算機(jī)中的表示方法
如下是圖像的一種表示方法:左邊是一張灰度圖,右邊是一個(gè)2維矩陣,二維矩陣的取值范圍為[0, 255]中的整數(shù),代表灰度值的強(qiáng)度。

如果要計(jì)算機(jī)屏幕顯示一張彩色圖像,那么根據(jù)光學(xué)成像原理,通過R,G,B三種顏色光疊加即可,所以,一張彩色圖像可以用一個(gè)3維矩陣表示,如下:


5 顏色空間
顏色空間:是用來描述和表示圖像顏色的數(shù)學(xué)模型。在計(jì)算機(jī)視覺和數(shù)字圖像處理中,顏色空間是非常重要的概念,因?yàn)樗鼈冊试S我們將圖像顏色轉(zhuǎn)換為不同的表示形式,從而使圖像處理更加靈活和有效。
顏色空間有很多種,舉2個(gè)常用的顏色空間如下:
(1)RGB顏色空間:RGB是最常見的顏色空間之一,它使用紅色、綠色和藍(lán)色三個(gè)顏色通道來描述顏色。在這個(gè)空間中,每個(gè)像素由三個(gè)分量值來表示,分別代表紅色、綠色和藍(lán)色分量的亮度。

(2)HSV顏色空間:HSV顏色空間(色相、飽和度、亮度)使用色相、飽和度和亮度三個(gè)參數(shù)來描述顏色。Hue色調(diào), Saturation飽和, Value明暗度,是根據(jù)顏色的直觀特性由A. R. Smith在1978年創(chuàng)建的一種顏色空間。旨在反映更傳統(tǒng)和直觀的混色模型(例如油漆混合)。
色調(diào)(H):色相表示顏色的基本色調(diào)。角度度量,取值范圍為0°~360°。
飽和度(S):飽和度表示顏色的純度。通常取值范圍為0%~100%,值越大,顏色越飽和。
亮度(V):亮度表示顏色的亮度,通常取值范圍為0%(黑)到100%(白)。
