最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【中字】主成分分析法(PCA)| 分步步驟解析 看完你就懂了!

2023-07-31 19:34 作者:Siohban  | 我要投稿

PCA 1. PCA是什么:就是降維。

降維的同時(shí)不可避免會(huì)有數(shù)據(jù)損失,所以需要選出最好的坐標(biāo)系/降維方式/PCA算法——“建立的新維度按照方差大小排序,前幾個(gè)維度包含了原始數(shù)據(jù)中大部分的方差信息,方差/特征值越大則該主成分(PC)擬合越好。這樣,PCA可以將高維數(shù)據(jù)集中的復(fù)雜結(jié)構(gòu)轉(zhuǎn)化為低維空間中的簡(jiǎn)單結(jié)構(gòu),從而方便后續(xù)的數(shù)據(jù)分析和可視化。”

基因=變量

維度=主成分PC=通過某算法得到的變量組合

數(shù)據(jù)點(diǎn)=樣本=each老鼠/細(xì)胞

2.降維好處:簡(jiǎn)化特征的復(fù)雜程度,減少訓(xùn)練模型計(jì)算量;

3. PCA降維缺點(diǎn):離群點(diǎn)的影響較大。

4. 降維的衡量指標(biāo)-降維后,在各保留維度中的方差(特征值)要最大:因?yàn)榉讲钤酱髷?shù)據(jù)越散,防止了數(shù)據(jù)重疊導(dǎo)致信息失真。

5. 如何找到方差最大/最優(yōu)擬合維度:理解即可


1.降維--方便繪圖(可視化)

2.聚類cluster及其重要維度/基因

e.g.基因3(維度3)在分類上起到重要作用

3.繪圖準(zhǔn)確性

HOW- 去中心化




HOW-擬合-最優(yōu)擬合



HOW-判定擬合度




從勾股定理開始,通俗理解如何判定擬合度








?
07:42
?
方差最大,誤差最小

最大方差平方和SS=主成分1



?
09:21
?
向量?



PC1向量=基因1+基因2 的線性組合


?
11:10
?
svd是奇異值分解?





PC1的奇異SV/特征向量EV(個(gè)人覺得理解PCA的最重要的點(diǎn)是特征向量那塊,聽不懂的建議復(fù)習(xí)特征向量知識(shí))

載荷得分LS

PC1的特征值=SS;奇異值

?
13:10
?
主成分之間必須保證線性無關(guān),因此只有垂直那一條


用縮放來求得以上術(shù)語(yǔ)


?
14:17
?




?
15:02
?
方差

碎石圖A SCREE PLOT:用PC的特征值(方差 平方和),來評(píng)估每個(gè)主成分PC所占差異率/代表性(對(duì)總差異的貢獻(xiàn)占比)

?
16:30
?

尋找PC2:與PC1垂直的平面內(nèi),讓距離平方和最大的那條線作為PC2 line。找到最佳擬合的這個(gè)過程,即各個(gè)樣本投影點(diǎn)到原點(diǎn)(中心點(diǎn))的方差最大化的過程





?
19:04
?
去掉差異率低的PC,就可以實(shí)現(xiàn)降維;尋找到合適的主成分,保證貢獻(xiàn)率在85%以上就可以了?




?
19:46
?
降維分析,用2個(gè)主要成分(各個(gè)PC是幾個(gè)基因/變量的算法組合)來表示更高維度的數(shù)據(jù)




【中字】主成分分析法(PCA)| 分步步驟解析 看完你就懂了!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
长兴县| 房产| 绥宁县| 温泉县| 门头沟区| 克拉玛依市| 桂林市| 独山县| 柏乡县| 方城县| 都江堰市| 普宁市| 剑川县| 伊宁市| 若尔盖县| 柳州市| 平谷区| 南投县| 遂昌县| 平陆县| 沂源县| 静乐县| 射洪县| 土默特左旗| 玉门市| 保山市| 扎鲁特旗| 苍南县| 阜康市| 焦作市| 周口市| 定远县| 赤城县| 自贡市| 丹东市| 察哈| 仁寿县| 阿拉善左旗| 衡东县| 泸水县| 崇仁县|