ApacheCN 機器學(xué)習(xí)實戰(zhàn)講義 十四、利用SVD簡化數(shù)據(jù)
2018-05-03 00:05 作者:絕不原創(chuàng)的飛龍 | 我要投稿

SVD 概述
奇異值分解(SVD, Singular Value Decomposition):
提取信息的一種方法,可以把 SVD 看成是從噪聲數(shù)據(jù)中抽取相關(guān)特征。從生物信息學(xué)到金融學(xué),SVD 是提取信息的強大工具。
SVD 場景
信息檢索-隱性語義檢索(Lstent Semantic Indexing, LSI)或 隱性語義分析(Latent Semantic Analysis, LSA)
隱性語義索引:矩陣 = 文檔 + 詞語 * 是最早的 SVD 應(yīng)用之一,我們稱利用 SVD 的方法為隱性語義索引(LSI)或隱性語義分析(LSA)。

推薦系統(tǒng)
利用 SVD 從數(shù)據(jù)中構(gòu)建一個主題空間。
再在該空間下計算其相似度。(從高維-低維空間的轉(zhuǎn)化,在低維空間來計算相似度,SVD 提升了推薦系統(tǒng)的效率。)

上圖右邊標(biāo)注的為一組共同特征,表示美式 BBQ 空間;另一組在上圖右邊未標(biāo)注的為日式食品 空間。
圖像壓縮
例如:32*32=1024 => 32*2+2*1+32*2=130
(2*1表示去掉了除對角線的0), 幾乎獲得了10倍的壓縮比。

閱讀全文:http://ml.apachecn.org/mlia/svd/
標(biāo)簽: