最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA

2023-08-01 16:34 作者:爾云間  | 我要投稿

信息過度復(fù)雜是多變量數(shù)據(jù)最大的挑戰(zhàn)之一。許多小伙伴經(jīng)常會遇到這種問題,于是我們會考慮用降維來解決,這時(shí)候很多人都會想到PCA降維,那么PCA到底是什么呢?今天小云來帶大家探索PCA算法的原理。

PCA(Principal Component Analysis)全稱為主成分分析,是一種無監(jiān)督的數(shù)據(jù)降維方法,通過主成分分析可以盡可能保留下具備區(qū)分性的低維數(shù)據(jù)特征。主成分分析圖能幫助我們直觀地感受樣本在降維后空間中的分簇和聚合情況,這在一定程度上亦能體現(xiàn)樣本在原始空間中的分布情況。

相信大家看到這里應(yīng)該大致能知道PCA究竟能干嘛了,那么該怎么實(shí)現(xiàn)呢?別著急,小果下面通過一個(gè)分析過程來帶大家學(xué)習(xí)具體流程。

1、載入數(shù)據(jù)及相關(guān)R包

2.PCA分析

3.主成分選取

說明:結(jié)果中的PC1、PC2、PC3、和PC4是計(jì)算出來的主成分,圖中的Standard deviation代表每個(gè)主成分的標(biāo)準(zhǔn)差,Proportion of Variance代表每個(gè)主成分的貢獻(xiàn)率,Cumulative Proportion代表各個(gè)主成分的累積貢獻(xiàn)率。每個(gè)主成分都不屬于X1、X2、X3和X4中的任何一個(gè)。第一主成分、第二主成分、第三主成分和第四主成分都是X1、X2、X3和X4的線性組合,也就是說最原始數(shù)據(jù)的成分經(jīng)過線性變換得到了各個(gè)主成分。一般地,選擇累積貢獻(xiàn)率達(dá)到八成的前幾個(gè)主成分即可(這個(gè)實(shí)例中我們選擇前兩個(gè),畢竟第二主成分的貢獻(xiàn)率也比較大)。

4.PCA可視化

結(jié)果展示

分析最后我們會得到一個(gè)PCA分析圖,如下圖1所示,圖中的橫縱坐標(biāo)分別對應(yīng)主成分PC1和PC2,整體表現(xiàn)了所有樣本在這兩個(gè)主成分上的分布。同時(shí)小伙伴們還可以保存樣本在主成分上的表達(dá)水平來開展其他分析,具體樣例如圖2所示,每行為一個(gè)樣本,列為不同的主成分。

大功告成!分析到這里就結(jié)束了,相信大家已經(jīng)掌握了,感興趣的小伙伴快去試試吧!

這里推薦一下小云新開發(fā)的零代碼云生信分析工具平臺包含超多零代碼小工具,上傳數(shù)據(jù)一鍵出圖,感興趣的小伙伴歡迎了解~

網(wǎng)址:http://www.biocloudservice.com/home.html

今天小果的分享就到這里,歡迎大家和小云一起討論學(xué)習(xí),下期再見哦!





數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA的評論 (共 條)

分享到微博請遵守國家法律
长治县| 肃宁县| 图们市| 赤城县| 汶川县| 甘南县| 乌海市| 贡觉县| 铜山县| 霍城县| 北川| 四平市| 阜南县| 启东市| 托克逊县| 太谷县| 万州区| 英吉沙县| 留坝县| 宁德市| 积石山| 余干县| 陕西省| 洪湖市| 绩溪县| 师宗县| 天镇县| 洞口县| 重庆市| 区。| 辽宁省| 阿瓦提县| 来凤县| 溆浦县| 沂水县| 华蓥市| 利辛县| 勃利县| 固原市| 资兴市| 郴州市|