核磁機(jī)器學(xué)習(xí) | 基于機(jī)器學(xué)習(xí)的fMRI分類

導(dǎo)讀
本文通過提取最顯著的特征,將大腦圖像分類為正常和異常,并對大腦各種狀態(tài)的磁共振成像(MRI)進(jìn)行了研究。本文描述了一種基于小波變換的方法,首先對圖像進(jìn)行分解,然后使用各種特征選擇算法從MRI圖像中提取最顯著的大腦特征。演示了如何使用不同的分類器從公開的神經(jīng)成像數(shù)據(jù)集中檢測異常的大腦圖像?;谛〔ǖ奶卣魈崛。缓笫褂弥鞒煞址治?PCA)/二次判別分析(QDA)選擇最顯著的特征,并使用基于學(xué)習(xí)的分類器進(jìn)行分類。與先前報告的研究相比,本研究結(jié)果的準(zhǔn)確率有了顯著提高,并且有助于更好地了解大腦異常情況。
磁共振成像(MRI)
磁共振成像(MRI)是一種用于神經(jīng)成像和臨床研究的先進(jìn)技術(shù),是研究人腦各種狀態(tài)的有效工具。MRI圖像提供了大腦各種狀態(tài)的豐富信息,可用于對大腦進(jìn)行研究、診斷和臨床分析,以確定大腦是否正常或異常,以及處于哪種狀態(tài)。從圖像中提取的原始數(shù)據(jù)集非常大,很難對數(shù)據(jù)進(jìn)行分析以得出結(jié)論。在這種情況下,可以使用各種圖像分析工具對MRI圖像進(jìn)行分析,并提取結(jié)論性的診斷信息來對大腦異常進(jìn)行分類。MRI圖像的細(xì)節(jié)水平正在迅速提高,該技術(shù)能夠提供體內(nèi)各器官的二維(2D)和三維(3D)圖像。當(dāng)需要進(jìn)行軟組織描繪時,MRI通常是醫(yī)學(xué)成像方法的首選。MR成像最重要的優(yōu)點(diǎn)是它是一種非侵入性技術(shù)。目前,計算機(jī)技術(shù)在醫(yī)療決策支持中的應(yīng)用十分普遍。基于MRI的正常和病變?nèi)四X的全自動分類對于臨床研究具有重要意義。有研究表明,通過人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVMs)等監(jiān)督技術(shù),以及結(jié)合特征提取技術(shù)的自組織映射(SOM)和模糊c均值聚類等非監(jiān)督分類技術(shù),可以對人腦MR圖像中的異常情況進(jìn)行分類。其他監(jiān)督分類技術(shù),如k-最近鄰(k-NN),也根據(jù)每個特征圖像中的相似性對像素進(jìn)行分組,并且可用于分類正常/病理性T2加權(quán)MRI圖像。本研究采用有監(jiān)督的機(jī)器學(xué)習(xí)算法將圖像分為兩類:正?;虍惓?。利用MRI圖像進(jìn)行診斷的方法多種多樣,MRI可以產(chǎn)生高分辨率圖像,用于圖像分割和從MRI圖像中識別大腦異常情況。MRI還用于在不同醫(yī)療條件下生成不同器官的詳細(xì)、準(zhǔn)確的圖像。使用高場和低場MRI圖像還可以使醫(yī)生看到非常小的撕裂以及韌帶和肌肉損傷。MRI是基于電磁頻譜無無線電范圍內(nèi)的能量吸收和發(fā)射。從2D醫(yī)學(xué)圖像數(shù)據(jù)中獲得的精確3D解剖模型,可提供關(guān)于關(guān)鍵解剖結(jié)構(gòu)與病理之間空間關(guān)系的精確信息,而這些關(guān)系通常是肉眼無法區(qū)分的。Corso等人(2008)使用貝葉斯公式將軟模型分配納入親和度的計算中,并使用加權(quán)聚合算法將得到的模型感知親和度集成到多級分割中,隨后應(yīng)用于檢測和分割多通道磁共振(MR)體積中的大腦異常。
本文介紹了研究者開展的關(guān)于大腦各種狀態(tài)的MRI研究,通過提取最顯著的特征來分類為正常和異常的大腦圖像。本研究提出了一種基于小波變換的方法,首先對圖像進(jìn)行初步分解,然后使用各種特征選擇算法從MRI圖像中提取出最顯著的大腦特征。通過使用不同的分類器從公開的神經(jīng)成像數(shù)據(jù)集中檢測大腦圖像的異常,研究結(jié)果發(fā)現(xiàn),與先前的研究報告相比,采用基于小波的特征提取的原則方法,然后使用PCA/QDA技術(shù)選擇最顯著的特征,并使用基于學(xué)習(xí)的分類器進(jìn)行分類,準(zhǔn)確率有了顯著提高。
相關(guān)背景
兩種類型的乘性噪聲通常會出現(xiàn)在幾種成像模式中:散斑噪聲和泊松噪聲。這兩種類型都被稱為乘性噪聲,是因?yàn)樗鼈兊姆讲畈皇呛愣ǖ?,而是取決于要估計的參數(shù)。MRI掃描后噪聲去除方法的最終目標(biāo)是在保持組織邊界的同時,在均勻組織區(qū)域獲得分段常數(shù)或緩慢變化的信號。在文獻(xiàn)顯示,統(tǒng)計方法和擴(kuò)散濾波方法都被用于去除數(shù)字圖像中的噪聲。有研究對小波在生物醫(yī)學(xué)圖像處理中的應(yīng)用進(jìn)行了綜述,包括一些關(guān)于fMRI的早期工作,通過檢測血流的相關(guān)變化來測量大腦活動。時間序列小波分析中的統(tǒng)計問題已得到全面的解決。Alexander等人(2000)詳細(xì)闡述了小波分析分形信號的一般最優(yōu)性。Zaroubi等人(2000)描述了小波方法在S-PLUS中的實(shí)現(xiàn)。一些研究率先將小波應(yīng)用于功能磁共振成像數(shù)據(jù)分析中的各種問題。迄今為止最流行的應(yīng)用是圖像壓縮或去噪。Barra等人(2000)探索了二維和三維小波變換作為使用正電子發(fā)射斷層掃描(PET)測量的放射性配基結(jié)合勢圖的空間濾波器,PET使用核醫(yī)學(xué)成像技術(shù)產(chǎn)生體內(nèi)功能過程的三維圖像。Barra等人的研究工作就報告了一種基于小波系數(shù)模糊聚類的腦組織分類或結(jié)構(gòu)MRI分割技術(shù)。
材料和方法
數(shù)據(jù)集
輸入數(shù)據(jù)集由軸向T2加權(quán)、256×256像素MR大腦圖像組成(圖1)。這些圖像是從哈佛醫(yī)學(xué)院網(wǎng)站下載的公開數(shù)據(jù)集。本研究只考慮側(cè)腦室清晰可見的大腦部分。輸入數(shù)據(jù)集中的MR大腦圖像數(shù)量為60張,其中正常腦6張,異常腦54張。異常的大腦圖像集包括患有阿爾茨海默癥等疾病的大腦圖像。正常人腦的顯著特征是它在軸向和冠狀面圖像上具有對稱性。軸向MR大腦圖像的不對稱強(qiáng)烈提示存在異常。因此,軸向MRI圖像的對稱性是判斷MR圖像是正常還是異常腦時需要考慮的重要特征。正常和異常的T2加權(quán)MRI腦圖像分別如圖2和3所示。異常腦MR圖像中對稱性的缺失在圖3中清晰可見。超過一定程度的不對稱性是大腦患病的明確跡象,這在本研究的工作中被用于初步的粗略分類。



使用小波分解圖像
小波是一種將數(shù)據(jù)分解為不同頻率分量的數(shù)學(xué)函數(shù),然后以與其尺度匹配的分辨率研究每個分量。小波已經(jīng)成為分析復(fù)雜數(shù)據(jù)集的強(qiáng)大工具。傅里葉變換僅根據(jù)圖像的頻率內(nèi)容提供圖像的表征。因此,這種表征不是空間局域化的,而小波函數(shù)是空間局域化的。傅里葉變換將信號分解為頻譜,而小波分析是空間(時間)和頻率的局部變換,通過伸縮和平移等運(yùn)算功能可對信號進(jìn)行多尺度的細(xì)化分析。因此,小波變換提供了圖像在不同分辨率下的表征,是一種更好的圖像特征提取工具。
離散小波變換(DWT)
DWT是小波變換的一種實(shí)現(xiàn),它使用一組離散的小波尺度和平移,并遵循一些既定規(guī)則。在實(shí)際計算中,需要對小波變換進(jìn)行離散化處理。尺度參數(shù)在對數(shù)網(wǎng)格上離散化。然后,平移參數(shù)(τ)相對于尺度參數(shù)進(jìn)行離散化;也就是說,抽樣是在二元抽樣網(wǎng)格上進(jìn)行的(對數(shù)的底數(shù)通常選為2)。離散尺度和轉(zhuǎn)換參數(shù)為s=2-m和t=n2-m,其中m,n∈Z,取整數(shù)集。因此,小波函數(shù)族表示為:

將DWT分別應(yīng)用于圖像的每個維度。這導(dǎo)致圖像Y被分解為一級近似分量和細(xì)節(jié)分量、和,分別對應(yīng)于水平、垂直和對角線細(xì)節(jié)。下列公式描述了將圖像分解為近似和細(xì)節(jié)分量的過程。
近似分量(Ya)包含圖像的低頻分量,而細(xì)節(jié)分量(Yh, Yv和Yd)包含高頻分量。因此:

在每個分解級別,分解信號的長度是前一階段信號長度的一半。因此,對N×N圖像進(jìn)行一級分解得到的近似分量大小為N/2×N/2,第二級分解得到的近似分量大小為N/4×N/4,以此類推。隨著分解級別的增加,可以獲得圖像更緊湊但更粗略的近似。因此,小波為解釋圖像信息提供了一個簡單的層次框架。
特征選擇
二次判別分析(QDA)
二次判別分析(QDA)將一個類的可能性描述為高斯分布,然后使用后驗(yàn)分布估計來估計給定測試向量的類。這種方法的函數(shù)為:

Σk是協(xié)方差矩陣,x是測試向量,μk為均值向量,p(k)是類k的先驗(yàn)概率。每個類的高斯參數(shù)都可以從訓(xùn)練數(shù)據(jù)集中估計,因此,Σk和μk的值用其估計值

和

替代。然而,當(dāng)訓(xùn)練樣本的數(shù)量較少時,與訓(xùn)練向量的維數(shù)相比,協(xié)方差估計可能是不適定的。解決不適定估計的方法是正則化協(xié)方差矩陣Σk。
主成分分析(PCA)
過多的特征會增加計算時間和存儲內(nèi)存,有時會導(dǎo)致分類過程變得更加復(fù)雜。這種結(jié)果被稱為維度詛咒。需要一種策略來減少分類中使用的特征數(shù)量。PCA是一種有效的工具,可以降低由大量相關(guān)變量組成的數(shù)據(jù)集的維數(shù),同時保留最重要的變化。這是通過根據(jù)數(shù)據(jù)集的差異程度或重要性將其轉(zhuǎn)換為一組新的有序變量來實(shí)現(xiàn)的,如圖4所示。

使用不同的分類器進(jìn)行分類
支持向量機(jī)(SVM)分類器
支持向量機(jī)(SVM)是由Vapnik(1995)提出的一個著名的大間距分類器。SVM分類器的基本概念是在特征空間中尋找一個最優(yōu)的分離超平面來分離兩個類。二元SVM的決策函數(shù)為:

其中b是一個常數(shù),yi∈{1,1},0≤αi≤C,I=1,2,…,N是非負(fù)拉格朗日乘子,C是一個成本參數(shù),xi是支持向量,K(xi,x)是核函數(shù)。采用一對一法將SVM應(yīng)用于多類問題。它在Knerr等人(1990)的研究中被首次引入,并在Friedman(1996)和Krebel(1999)中首次將該方法用于支持向量機(jī)。該方法構(gòu)造k(k-1)/2個分類器,其中每個分類器訓(xùn)練來自兩個類的數(shù)據(jù)。對于第i類和第j類的訓(xùn)練數(shù)據(jù),解決以下二元分類問題。本研究使用投票策略,如果sign((wij)Tθ(x)+bij)表示x在第i類中,那么對第i類的投票增加1。否則,第j類加1。然后,最大的投票決定了變量x的具體類別。
采用LIBSVM軟件庫進(jìn)行實(shí)驗(yàn)。LIBSVM是支持向量分類和回歸的通用庫,可在網(wǎng)址http://www.csie.ntu.edu.tw/ cjlin/libsvm/獲得。如上所述,有不同的函數(shù)將數(shù)據(jù)映射到高維空間,實(shí)際上我們需要選擇核函數(shù)K(xi;xj)=θ(xi)Tθ(xj)。有幾種類型的核可用于解決各種問題。每個核對于不同的問題有不同的參數(shù);例如,一些眾所周知的具有大量特征的問題,如文本分類、蛋白質(zhì)折疊和圖像處理問題,有研究表明使用線性核可以更正確地進(jìn)行分類。本研究使用了徑向基函數(shù)(RBF)核,它是一種實(shí)值函數(shù),其值僅取決于與原點(diǎn)的距離。具有RBF核的學(xué)習(xí)器通常在泛化能力方面并不比其他學(xué)習(xí)器差。本研究進(jìn)行了一些簡單的比較,觀察到當(dāng)使用RBF核時,其性能略好于線性核K(xi;xj)=θ(xi)Tθ(xj)對于學(xué)過的所有問題。因此,對于這三個數(shù)據(jù)集,與其停留在原始空間,不如對高維空間進(jìn)行非線性映射。另一個重要問題是參數(shù)的選擇。對于SVM訓(xùn)練,必須事先確定一些參數(shù),例如懲罰參數(shù)C、RBF函數(shù)的核參數(shù)等。支持向量機(jī)參數(shù)的優(yōu)化是SVM設(shè)計的重要環(huán)節(jié)。可以使用不同參數(shù)的交叉驗(yàn)證來進(jìn)行模型選擇。
使用自組織映射進(jìn)行分類
人工神經(jīng)網(wǎng)絡(luò)(ANNs)受到生物學(xué)的啟發(fā)。它們由許多并行運(yùn)行的非線性計算元素組成,并以類似于生物神經(jīng)網(wǎng)絡(luò)的模式排列。ANNs會根據(jù)環(huán)境調(diào)整其行為,從經(jīng)驗(yàn)中學(xué)習(xí),并從以前學(xué)習(xí)過的例子中推廣到新的例子。ANNs已經(jīng)成為一大類模式識別任務(wù)的首選技術(shù)。Lippmann提供了關(guān)于人工神經(jīng)網(wǎng)絡(luò)的全面綜述。自組織映射(SOM)是一種無監(jiān)督算法,用鄰近函數(shù)來保持輸入空間的拓?fù)湫再|(zhì),具有其他網(wǎng)絡(luò)無法比擬的優(yōu)勢,它可以自動形成相似性圖,可以在訓(xùn)練樣本的輸入空間中學(xué)習(xí)到數(shù)據(jù)的低維表征。
自組織映射可以推廣到非矢量數(shù)據(jù),例如符號數(shù)據(jù),而其他網(wǎng)絡(luò)則不行。SVM是一種機(jī)器學(xué)習(xí)技術(shù),起源于統(tǒng)計理論,用于圖像分類。它的主要優(yōu)點(diǎn)是能夠?qū)Ω叨确蔷€性的系統(tǒng)建模,并且決策面的特殊性質(zhì)確保了非常好的泛化。SVM因其計算效率高、泛化性能好,而在模式識別中得到了廣泛的應(yīng)用。因此,人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)在識別和分類任務(wù)中非常有吸引力。在這里,本文比較了這兩種方法的結(jié)果。
結(jié)果
小波分解層級
本文獲得了60張大腦MR圖像的小波系數(shù),每張圖像的大小為256×256。對大腦MRI圖像進(jìn)行一級HAR小波分解,得到16384個小波近似系數(shù),這些小波近似系數(shù)是一組重新縮放的方形函數(shù),它們共同構(gòu)成一個小波族或基,而二級和三級分別產(chǎn)生4096和1024個小波系數(shù)。第三級小波分解大大減小了輸入向量的大小,但分類率較低。在第一級分解中,向量大小(16384)太大,無法作為分類器的輸入。通過MATLAB仿真對小波系數(shù)進(jìn)行了系統(tǒng)的實(shí)證分析,得出二級特征最適合用于神經(jīng)網(wǎng)絡(luò)、自組織映射和支持向量機(jī)分類器,而一級和三級特征的分類精度較低。二級小波分解不僅在測試階段給出了近乎完美的結(jié)果,而且還具有合理的、可管理的特征數(shù)量(4096),分類器可以很容易地處理這些特征。本研究還應(yīng)用Daubechies-4(DAUB4)母小波,它是定義離散小波變換的正交小波基,其特征是在給定的支持下有最大的消失矩,以獲得二級MRI圖像的分解系數(shù),從而提供兩種小波類型分解的分類精度比較。
使用自組織映射(SOM)分類采用小波分解的特征提取,然后用PCA降維,并通過基于自組織映射神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。利用MATLAB中的小波工具箱獲取MR圖像的小波系數(shù)。利用MATLAB編寫了自組織神經(jīng)網(wǎng)絡(luò)程序。在第一階段被標(biāo)記為異常的圖像在第二階段將不被考慮,以避免對這些圖像進(jìn)行小波分解所花費(fèi)的昂貴計算成本。獲得二級DAUB4和HAR小波近似系數(shù),并作為自組織神經(jīng)網(wǎng)絡(luò)分類器的輸入。分類結(jié)果如表1和表2所示。輸入數(shù)據(jù)集中的MR大腦圖像數(shù)量為60張,其中正常腦6張,異常腦54張。實(shí)驗(yàn)采用了不同層級的小波分解。自組織映射分類后得到的最終類別取決于輸入向量呈現(xiàn)給網(wǎng)絡(luò)的順序。因此,本研究對輸入圖像的呈現(xiàn)順序進(jìn)行隨機(jī)化。實(shí)驗(yàn)重復(fù)進(jìn)行,每次輸入呈現(xiàn)順序不同,所有實(shí)驗(yàn)均獲得相同的分類百分比和正常異常類別。


使用支持向量機(jī)(SVM)分類
本研究在Weka 3.6.6中執(zhí)行SVM,輸入為小波編碼圖像,使用LIBSVM庫進(jìn)行分類。這是一種二維分類技術(shù)。在本文中,研究者將MR大腦圖像的分類視為一個兩類模式分類問題。在每個小波編碼的MR圖像中,應(yīng)用分類器來確定它是正常還是異常。如前所述,SVM的使用包括用特定的核函數(shù)訓(xùn)練和測試支持向量機(jī),而這個核函數(shù)又有特定的核參數(shù)。該分類采用RBF和多項式函數(shù)作為支持向量機(jī)的核。線性核也用于支持向量機(jī)的訓(xùn)練和測試,但其分類率低于多項式核和RBF核。線性核、多項式核、RBF核的分類結(jié)果如表3所示。與RBF和線性核相比,多項式核的分類精度更高。使用k折交叉驗(yàn)證技術(shù)來避免過擬合,整個數(shù)據(jù)集的k=7。

結(jié)論
本文提出了一種使用基于小波的特征提取、基于PCA的特征選擇和基于SVM/SOM的分類來研究大腦異常的原則方法。在公開可用的大腦圖像數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)表明,所提出的原則方法的性能明顯優(yōu)于文獻(xiàn)中報告的其他方法。自組織映射的分類精度達(dá)94%以上,支持向量機(jī)的分類精度達(dá)96%以上,這很好地證明了該方法的實(shí)用性。本研究只將這種方法應(yīng)用于大腦內(nèi)特定深度的軸向T2加權(quán)圖像。同樣的方法可以用于T1加權(quán)、質(zhì)子密度和其他類型的MR圖像。利用上述方法,可以開發(fā)用于檢測腦部疾病(例如阿爾茨海默癥、亨廷頓癥、帕金森癥等)的診斷系統(tǒng)軟件。此外,所提出的方法通過在處理循環(huán)中結(jié)合特征選擇算法來使用簡化數(shù)據(jù),但仍然提供了更好的識別和準(zhǔn)確性。與文獻(xiàn)報告的獨(dú)立SVM(91.32%)和其他傳統(tǒng)分類器相比,組合的SVM-QDA和SVM-PCA分類器獲得了更好的結(jié)果(93.43%和96.24%)。未來的研究可以對不同類型的異常進(jìn)行分類,并根據(jù)年齡、情緒狀態(tài)及其反饋等各種參數(shù)從MRI大腦圖像中提取新的特征。
原文:Understanding the Brain via fMRI Classification.
DOI:10.1007/978-3-642-30574-0_40
小伙伴們點(diǎn)星標(biāo)關(guān)注茗創(chuàng)科技,將第一時間收到精彩內(nèi)容推送哦~
