最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【視頻】KMEANS均值聚類(lèi)和層次聚類(lèi):R語(yǔ)言分析生活幸福指數(shù)可視化|數(shù)據(jù)分享

2022-07-03 10:34 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=24198

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

聚類(lèi)是將總體或數(shù)據(jù)點(diǎn)劃分為多個(gè)組的任務(wù),以使同一組中的數(shù)據(jù)點(diǎn)與同一組中的其他數(shù)據(jù)點(diǎn)更相似,而與其他組中的數(shù)據(jù)點(diǎn)不相似。它基本上是基于它們之間的相似性和相異性的對(duì)象的集合。

在本項(xiàng)目中,我將使用世界幸福報(bào)告中的數(shù)據(jù)(查看文末了解數(shù)據(jù)獲取方式)來(lái)探索亞洲22個(gè)國(guó)家或地區(qū),并通過(guò)查看每個(gè)國(guó)家的階梯得分,社會(huì)支持,健康的期望壽命,自由選擇生活,慷慨,對(duì)腐敗的看法以及人均GDP,來(lái)探索亞洲22個(gè)國(guó)家的相似和不同之處。我將使用兩種聚類(lèi)方法,即k均值和層次聚類(lèi),以及輪廓分析來(lái)驗(yàn)證每種聚類(lèi)方法。

【視頻】KMEANS均值聚類(lèi)和層次聚類(lèi):R語(yǔ)言分析生活幸福質(zhì)量系數(shù)可視化實(shí)例

KMEANS均值聚類(lèi)和層次聚類(lèi):R語(yǔ)言分析生活幸福質(zhì)量系數(shù)可視化實(shí)例

,時(shí)長(zhǎng)06:05

例如——下圖中聚集在一起的數(shù)據(jù)點(diǎn)可以歸為一組。我們可以區(qū)分簇,我們可以識(shí)別出下圖中有3個(gè)簇。?

讓我們看看聚類(lèi)算法的類(lèi)型以及如何為您的用例選擇它們。

層次聚類(lèi)

層次聚類(lèi)的主要思想是基于這樣的概念,即附近的對(duì)象比更遠(yuǎn)的對(duì)象更相關(guān)。

您有兩類(lèi)層次聚類(lèi)算法,自上而下和自下而上。自下而上的概念在初始階段將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單獨(dú)的集群。它會(huì)合并成對(duì)的集群,直到您擁有一個(gè)包含所有數(shù)據(jù)點(diǎn)的組。因此,它也被稱(chēng)為分層聚類(lèi)(HAC)。將其與一棵樹(shù)進(jìn)行比較,其中根是唯一的集群,它將所有樣本與葉子一起收集為具有單個(gè)樣本的集群。下圖將更好地解釋這個(gè)概念。

1.將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單獨(dú)的集群。第二步是選擇一個(gè)距離度量來(lái)衡量?jī)山M之間的距離。使用平均鏈接方法,其中兩個(gè)集群之間的距離是一個(gè)集群中的數(shù)據(jù)點(diǎn)與另一個(gè)集群中的數(shù)據(jù)點(diǎn)之間的平均距離。

2.在每次迭代中,我們將具有最小平均鏈接的兩個(gè)集群合并為一個(gè)。

3.重復(fù)上述步驟,直到我們有一個(gè)包含所有數(shù)據(jù)點(diǎn)的大集群。

AHC 的優(yōu)點(diǎn):

·AHC 易于實(shí)現(xiàn),它還可以提供對(duì)象排序,這可以為顯示提供信息。

·我們不必預(yù)先指定集群的數(shù)量。通過(guò)在特定級(jí)別切割樹(shù)狀圖很容易確定聚類(lèi)的數(shù)量。

·在 AHC 方法中,將創(chuàng)建較小的集群,這可能會(huì)發(fā)現(xiàn)數(shù)據(jù)的相似性。

AHC的缺點(diǎn):

·在開(kāi)始的任何步驟中分組錯(cuò)誤的對(duì)象都無(wú)法撤消。

·不能很好地處理異常值。每當(dāng)發(fā)現(xiàn)異常值時(shí),它們最終會(huì)成為一個(gè)新的集群,或者有時(shí)會(huì)導(dǎo)致與其他集群合并。

K-means 聚類(lèi)算法

K均值聚類(lèi)是最常見(jiàn)的聚類(lèi)算法,因?yàn)樗子诶斫夂蛯?shí)現(xiàn)。K均值算法使用特定的距離度量將給定的數(shù)據(jù)集拆分為預(yù)定義K個(gè)類(lèi)。

下圖將幫助我們更好地理解這個(gè)概念。

我們從圖中推斷出什么?

選擇一些類(lèi)或組并隨機(jī)初始化中心點(diǎn)。請(qǐng)記住,確定您使用的類(lèi)的數(shù)量至關(guān)重要。因此,請(qǐng)仔細(xì)查看可用數(shù)據(jù)并確定不同的特征。圖中用 X 表示的中心點(diǎn)是與每個(gè)數(shù)據(jù)點(diǎn)向量具有相同長(zhǎng)度的向量。

1.您可以通過(guò)計(jì)算特定點(diǎn)與每個(gè)組中心之間的距離對(duì)每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行分類(lèi)。下一步是對(duì)屬于中心最近的組的點(diǎn)進(jìn)行分類(lèi)。

2.根據(jù)此信息,取出特定組中所有向量的均值并重新計(jì)算組中心。

3.對(duì)一個(gè)數(shù)字重復(fù)該過(guò)程,并確保組中心在迭代之間變化不大。

優(yōu)點(diǎn)

·K-means 是一種快速的方法,因?yàn)樗恍枰芏嘤?jì)算。

缺點(diǎn)

·識(shí)別和分類(lèi)組可能是一個(gè)具有挑戰(zhàn)性的方面。

·由于它從隨機(jī)選擇聚類(lèi)中心開(kāi)始,因此,結(jié)果可能缺乏一致性。

KMEANS均值聚類(lèi)和層次聚類(lèi):亞洲國(guó)家地區(qū)生活幸福質(zhì)量異同可視化分析和選擇最佳聚類(lèi)數(shù)

將要分析的國(guó)家和地區(qū)是:

asia?<-?w?filer(gepl('Asia',?Rgion)

探索性數(shù)據(jù)分析

相關(guān)矩陣

pair(aia\[,-c(1,2)\],?sal=TUE,col,hst.ol)

  • 階梯得分,社會(huì)支持,生活選擇的自由以及對(duì)腐敗的看法的分布是左偏的。

  • 慷慨和人均GDP的分布是右偏的。

  • 健康期望壽命的偏差大約是對(duì)稱(chēng)的。

  • 兩者之間存在很強(qiáng)的正相關(guān)關(guān)系:

  • 階梯分?jǐn)?shù)和社會(huì)支持

  • 健康期望壽命和人均GDP

  • 之間存在強(qiáng)烈的負(fù)相關(guān)關(guān)系:

  • 對(duì)腐敗的看法和人均GDP

  • 之間存在中等正相關(guān):

  • 階梯得分和健康期望壽命

  • 社會(huì)支持與健康期望壽命

  • 人均GDP較高的國(guó)家往往對(duì)腐敗的看法較低,對(duì)健康的期望壽命,社會(huì)支持和階梯得分較高。

國(guó)家和地區(qū)比較

grd.rrnge( ??ggplt(sia,?es(rerder(x=fctor(國(guó)家名稱(chēng)),?階梯得分,?FN=min),? ??????????????????????y=階梯得分,?fill=區(qū)域指標(biāo))))

  • 東亞國(guó)家的階梯得分較高,期望壽命健康,人均GDP較高且慷慨度較低。

  • 南亞國(guó)家的階梯得分,社會(huì)支持,健康的期望壽命和人均GDP往往較低。

  • 東南亞國(guó)家往往有很高的自由度,可以選擇生活和慷慨解囊。

scterhst( ????aia,?x?=?"社會(huì)支持",?y?=?"階梯得分", ????clor?=?"區(qū)域指標(biāo)" ????titl?=?"階梯得分與社會(huì)支持" ??)

  • 南亞的社會(huì)支持中位數(shù),階梯得分和人均GDP最低。

  • 東亞的社會(huì)支持中位數(shù),階梯得分,人均GDP和健康的期望壽命最高。

  • 東南亞的平均健康壽命中位數(shù)最低,對(duì)腐敗的中位數(shù)最高。

  • 東南亞的人均GDP很高,期望壽命健康,對(duì)腐敗的看法也很低(新加坡)。

  • 東亞有離群點(diǎn)樣本對(duì)政府的了解低(香港)。

?

聚類(lèi)分析

這些國(guó)家會(huì)屬于不同的群體嗎?在本節(jié)中,我們將使用聚類(lèi)(一種無(wú)監(jiān)督的學(xué)習(xí)方法,該方法基于相似性對(duì)對(duì)象進(jìn)行分組)來(lái)找到國(guó)家組,其中組內(nèi)的國(guó)家相似。我將使用兩種方法進(jìn)行聚類(lèi):分層聚類(lèi)和K-Means聚類(lèi)。首先,我們?nèi)绾巫R(shí)別這些群體?衡量對(duì)象之間相似性的一種方法是測(cè)量對(duì)象之間的數(shù)學(xué)距離。一種常見(jiàn)的距離度量是歐幾里得距離。

歐氏距離

我們將使用歐幾里得距離找到彼此最相似的國(guó)家,并將它們分組在一起。

aply(z,2,mean)?#?計(jì)算列的平均值 aply(z,2,sd)?#?計(jì)算列的標(biāo)準(zhǔn)差 scale(z,ceter=means,scae=sds)?#?標(biāo)準(zhǔn)化 #?計(jì)算距離矩陣 dsae?=?dit(nor)?#?計(jì)算歐幾里得的距離

歐幾里得距離矩陣為:

  • 似乎國(guó)家2(新加坡)和國(guó)家22(阿富汗)彼此最不相似。

  • 15國(guó)(中國(guó))和11國(guó)(越南)彼此最相似。

我們?nèi)绾芜x擇最佳聚類(lèi)數(shù)?

肘法

for?(i?in?2:20)?ws<-?sum(kmens(nr,?cetrs=i)$wthns)

我們的目標(biāo)是減少聚類(lèi)內(nèi)部的變異性,以便將相似的對(duì)象分組在一起,并增加聚類(lèi)之間的變異性,以使相異的對(duì)象相距甚遠(yuǎn)。WSS(在組平方和內(nèi)),它在聚類(lèi)變化內(nèi)進(jìn)行度量,

在WSS圖中,聚類(lèi)數(shù)位于x軸上,而WSS位于y軸上。高的WSS值意味著聚類(lèi)中的變化很大,反之亦然。我們看到,在1、2和3個(gè)聚類(lèi)之后,WSS的下降很大。但是,在4個(gè)聚類(lèi)之后,WSS的下降很小。因此,聚類(lèi)的最佳數(shù)目為k = 4(曲線(xiàn)的彎頭)。

K均值聚類(lèi)

k均值算法如下所示:

  • 為每個(gè)觀測(cè)值隨機(jī)分配一個(gè)從1到K的數(shù)字,這些數(shù)字用作觀測(cè)值的初始聚類(lèi)分配。

  • 迭代直到聚類(lèi)分配停止更改:

(a)對(duì)于K個(gè)聚類(lèi)中的每一個(gè),計(jì)算聚類(lèi)質(zhì)心。

(b)將每個(gè)觀測(cè)值分配給質(zhì)心最接近的聚類(lèi)(使用歐幾里得距離定義)。

聚類(lèi)成員和結(jié)果

k均值聚類(lèi)的結(jié)果是:

#聚類(lèi)成員 asa$Cuter?<-?c$luser

聚類(lèi)圖在散點(diǎn)圖中繪制k均值聚類(lèi)和前兩個(gè)主成分(維度1和2)。

clstr(lstdaa?=?nr,?cluter?=?cluser,col=ola),?theme?=?hme_lsic())?+? ??title("K-Means聚類(lèi)圖")

  • 聚類(lèi)之間沒(méi)有重疊。

  • 聚類(lèi)2與其他聚類(lèi)之間存在很多分隔。

  • 聚類(lèi)1、3和4之間的間隔較小。

  • 前兩個(gè)組成部分解釋了點(diǎn)變異的70%。

  • 聚類(lèi)1有2個(gè)國(guó)家,其聚類(lèi)平方和之內(nèi)很?。ㄔ诰垲?lèi)變異性?xún)?nèi))。

  • 聚類(lèi)2有1個(gè)國(guó)家。

  • 具有14個(gè)國(guó)家/地區(qū)的第3組在類(lèi)內(nèi)變異性中最高。

  • 聚類(lèi)4有5個(gè)國(guó)家,在聚類(lèi)變異性中排名第二。

  • 聚類(lèi)平方和與平方和之比為61.6%,非常合適。

這四個(gè)聚類(lèi)的標(biāo)準(zhǔn)平均值是:

long?<-?melt(t(agreate(nor,?) plot(long,roup?=?cluster)+point(se=3)

自由選擇生活,社會(huì)支持和階梯得分之間的差異很大。這些變量似乎對(duì)聚類(lèi)形成貢獻(xiàn)最大。

回想一下,聚類(lèi)成員資格為:

第1類(lèi):印度尼西亞,緬甸

第2類(lèi):阿富汗

第3類(lèi):菲律賓,泰國(guó),巴基斯坦,蒙古,馬來(lái)西亞,越南,馬爾代夫,尼泊爾,中國(guó),老撾,柬埔寨,孟加拉國(guó),斯里蘭卡,印度

第4類(lèi):中國(guó)臺(tái)灣地區(qū),新加坡,韓國(guó),日本,中國(guó)香港特別行政區(qū)

相對(duì)于其他聚類(lèi):

聚類(lèi)1的特點(diǎn)是

  • 很高:慷慨

  • 高:自由選擇生活

  • 一般:人均GDP,對(duì)腐敗的看法,慷慨,健康的期望壽命,社會(huì)支持,階梯得分

聚類(lèi)2的特點(diǎn)是

  • 高:對(duì)腐敗的看法

  • 低:人均國(guó)內(nèi)生產(chǎn)總值,慷慨

  • 非常低:自由選擇生活,健康的期望壽命,社會(huì)支持,階梯得分

聚類(lèi)3的特點(diǎn)是

  • 高:自由選擇生活

  • 一般:人均GDP,對(duì)腐敗的看法,慷慨,健康的期望壽命,社會(huì)支持,階梯得分

聚類(lèi)4的特點(diǎn)是

  • 很高:人均GDP,期望壽命健康

  • 高:社會(huì)支持,階梯得分

  • 一般:自由選擇生活

  • 低:慷慨

  • 極低:對(duì)腐敗的看法

輪廓圖

我們使用輪廓圖來(lái)查看每個(gè)國(guó)家在其聚類(lèi)中的狀況。輪廓寬度衡量一個(gè)聚類(lèi)中每個(gè)觀測(cè)值相對(duì)于其他聚類(lèi)的接近程度。較高的輪廓寬度表示該觀測(cè)值很好地聚類(lèi),而接近0的值表示該觀測(cè)值在兩個(gè)聚類(lèi)之間匹配,而負(fù)值表示該觀測(cè)值在錯(cuò)誤的聚類(lèi)中。

plt(soette((cluser),?diace),? ?????mn?=?"輪廓系數(shù)圖")

  • 大多數(shù)國(guó)家似乎都非常好。

  • 第3組中的國(guó)家4(泰國(guó))和第4組中的國(guó)家5(韓國(guó))的輪廓寬度非常低。

層次聚類(lèi)

分層聚類(lèi)將組映射到稱(chēng)為樹(shù)狀圖的層次結(jié)構(gòu)中。分層聚類(lèi)算法如下所示:

  • 從n個(gè)觀察值和所有成對(duì)不相似性的度量(例如歐幾里得距離)開(kāi)始。將每個(gè)觀察值視為自己的聚類(lèi)。

(a)檢查i個(gè)聚類(lèi)之間所有成對(duì)的聚類(lèi)間差異,并找出最相似的一對(duì)聚類(lèi)。加入這兩個(gè)聚類(lèi)。這兩個(gè)簇之間的差異表明它們?cè)跇?shù)狀圖中的高度。

(b)計(jì)算其余聚類(lèi)之間的新的成對(duì)聚類(lèi)間差異。對(duì)于分層聚類(lèi),我們?cè)诰垲?lèi)之間使用距離函數(shù),稱(chēng)為鏈接函數(shù)。不同類(lèi)型的鏈接:

  • 完全(最大聚類(lèi)間差異):計(jì)算聚類(lèi)1中的觀測(cè)值與聚類(lèi)2中的觀測(cè)值之間的所有成對(duì)差異,并記錄這些差異中最大的一個(gè)。

plt(aslus.c,laes=國(guó)家名稱(chēng),min='全鏈接?k=4',?hang=-1) rct.clut(whasi.hclusc,?k=4)

  • 平均值(均值聚類(lèi)間差異):計(jì)算聚類(lèi)1中的觀測(cè)值與聚類(lèi)2中的觀測(cè)值之間的所有成對(duì)差異,并記錄這些差異的平均值。

全鏈接

下面的樹(shù)狀圖顯示了使用全鏈接的聚類(lèi)層次結(jié)構(gòu)。

custr(ist(dta?=?or,?cuse?=?mer.a),?ghe?=?teelsic))?+ ??title("全鏈接?lusterPlot")

  • 聚類(lèi)1有16個(gè)國(guó)家。

  • 聚類(lèi)2有2個(gè)國(guó)家。

  • 聚類(lèi)3有3個(gè)國(guó)家。

  • 聚類(lèi)4有1個(gè)國(guó)家。

  • 聚類(lèi)4和其他聚類(lèi)之間有很多間隔。

  • 聚類(lèi)1、2和3之間的間隔較小。

  • 聚類(lèi)1中的變異性似乎很大。

輪廓圖

plot(sloett(curee(asiahluc,?4),?di),? ?????col ?????min?=?"全鏈接?輪廓系數(shù)圖")

?

大多數(shù)國(guó)家似乎都非常好。

  • 16國(guó)(老撾)似乎是第1組的異常值。

  • 21國(guó)(印度)似乎是第3組的異常值。

平均鏈接

下面的樹(shù)狀圖顯示了使用平均鏈接的聚類(lèi)層次。

plt(s.hut.,abls=國(guó)家名稱(chēng),min='平均鏈接?k=4',?hag=-1) rec(hsth_asa.lus.a,?k=?boder)

?

  • 聚類(lèi)1有4個(gè)國(guó)家。

  • 聚類(lèi)2有1個(gè)國(guó)家。

  • 聚類(lèi)3有16個(gè)國(guó)家。

  • 聚類(lèi)4有1個(gè)國(guó)家。

  • 使用平均鏈接的聚類(lèi)之間的變異性似乎大于全鏈接的變異性。

custr(ist(dta?=?or,?cuse?=?mer.a),?ghe?=?teelsic))?+ ??title("平均鏈接?lusterPlot")

?

輪廓圖

plt(sltte(ctee(sia.lust,?4),?istce),? ?????cl=cl\[:5\],? ?????min?=?"平均鏈接?輪廓系數(shù)圖")

  • 大多數(shù)國(guó)家似乎都非常好。

  • 第1組中的8地區(qū)(香港)的輪廓寬度非常小。

討論

k均值,全鏈接和平均鏈接的平均輪廓寬度分別為0.26、0.23和0.27。在全鏈接中,聚類(lèi)之間的距離小于k均值和平均鏈接之間的距離,并且兩個(gè)國(guó)家不太適合它們的聚類(lèi)。因此,k均值和平均鏈接方法似乎比全鏈接具有更好的擬合度。比較k均值,全鏈接和平均鏈接,所有方法都與阿富汗匹配,成為其自己的聚類(lèi)。但是,每種方法的聚類(lèi)成員資格有所不同。例如,在k均值和全鏈接中,印度尼西亞和緬甸與大多數(shù)南亞和東南亞國(guó)家不在同一聚類(lèi)中,而印度尼西亞和緬甸與在平均鏈接中的國(guó)家在同一聚類(lèi)中。

K-means和分層聚類(lèi)都產(chǎn)生了相當(dāng)好的聚類(lèi)結(jié)果。在使用大型數(shù)據(jù)集和解釋聚類(lèi)結(jié)果時(shí),K-means有一個(gè)優(yōu)勢(shì)。K-means的缺點(diǎn)是它需要在開(kāi)始時(shí)指定數(shù)字?jǐn)?shù)據(jù)和聚類(lèi)的數(shù)量。另外,由于初始聚類(lèi)分配在開(kāi)始時(shí)是隨機(jī)的,當(dāng)你再次運(yùn)行該算法時(shí),聚類(lèi)結(jié)果是不同的。另一方面,分層聚類(lèi)對(duì)數(shù)字和分類(lèi)數(shù)據(jù)都有效,不需要先指定聚類(lèi)的數(shù)量,而且每次運(yùn)行算法都會(huì)得到相同的結(jié)果。它還能產(chǎn)生樹(shù)狀圖,這對(duì)幫助你理解數(shù)據(jù)的結(jié)構(gòu)和挑選聚類(lèi)的數(shù)量很有用。然而,一些缺點(diǎn)是,對(duì)于大數(shù)據(jù)來(lái)說(shuō),它沒(méi)有k-means那么有效,而且從樹(shù)狀圖中確定聚類(lèi)的數(shù)量變得很困難。

數(shù)據(jù)獲取

在下面公眾號(hào)后臺(tái)回復(fù)“幸福指數(shù)”,可獲取完整數(shù)據(jù)。

本文摘選R語(yǔ)言KMEANS均值聚類(lèi)和層次聚類(lèi):亞洲國(guó)家地區(qū)生活幸福質(zhì)量異同可視化分析和選擇最佳聚類(lèi)數(shù),點(diǎn)擊“閱讀原文”獲取全文完整資料。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

PYTHON實(shí)現(xiàn)譜聚類(lèi)算法和改變聚類(lèi)簇?cái)?shù)結(jié)果可視化比較

有限混合模型聚類(lèi)FMM、廣義線(xiàn)性回歸模型GLM混合應(yīng)用分析威士忌市場(chǎng)和研究專(zhuān)利申請(qǐng)數(shù)據(jù)

R語(yǔ)言多維數(shù)據(jù)層次聚類(lèi)散點(diǎn)圖矩陣、配對(duì)圖、平行坐標(biāo)圖、樹(shù)狀圖可視化城市宏觀經(jīng)濟(jì)指標(biāo)數(shù)據(jù)

r語(yǔ)言有限正態(tài)混合模型EM算法的分層聚類(lèi)、分類(lèi)和密度估計(jì)及可視化

Python Monte Carlo K-Means聚類(lèi)實(shí)戰(zhàn)研究

R語(yǔ)言k-Shape時(shí)間序列聚類(lèi)方法對(duì)股票價(jià)格時(shí)間序列聚類(lèi)

R語(yǔ)言對(duì)用電負(fù)荷時(shí)間序列數(shù)據(jù)進(jìn)行K-medoids聚類(lèi)建模和GAM回歸

R語(yǔ)言譜聚類(lèi)、K-MEANS聚類(lèi)分析非線(xiàn)性環(huán)狀數(shù)據(jù)比較

R語(yǔ)言實(shí)現(xiàn)k-means聚類(lèi)優(yōu)化的分層抽樣(Stratified Sampling)分析各市鎮(zhèn)的人口

R語(yǔ)言聚類(lèi)有效性:確定最優(yōu)聚類(lèi)數(shù)分析IRIS鳶尾花數(shù)據(jù)和可視化

Python、R對(duì)小說(shuō)進(jìn)行文本挖掘和層次聚類(lèi)可視化分析案例

R語(yǔ)言k-means聚類(lèi)、層次聚類(lèi)、主成分(PCA)降維及可視化分析鳶尾花iris數(shù)據(jù)集

R語(yǔ)言有限混合模型(FMM,finite mixture model)EM算法聚類(lèi)分析間歇泉噴發(fā)時(shí)間

R語(yǔ)言用溫度對(duì)城市層次聚類(lèi)、kmean聚類(lèi)、主成分分析和Voronoi圖可視化

R語(yǔ)言k-Shape時(shí)間序列聚類(lèi)方法對(duì)股票價(jià)格時(shí)間序列聚類(lèi)

R語(yǔ)言中的SOM(自組織映射神經(jīng)網(wǎng)絡(luò))對(duì)NBA球員聚類(lèi)分析

R語(yǔ)言復(fù)雜網(wǎng)絡(luò)分析:聚類(lèi)(社區(qū)檢測(cè))和可視化

R語(yǔ)言中的劃分聚類(lèi)模型

基于模型的聚類(lèi)和R語(yǔ)言中的高斯混合模型

r語(yǔ)言聚類(lèi)分析:k-means和層次聚類(lèi)

SAS用K-Means 聚類(lèi)最優(yōu)k值的選取和分析

用R語(yǔ)言進(jìn)行網(wǎng)站評(píng)論文本挖掘聚類(lèi)

基于LDA主題模型聚類(lèi)的商品評(píng)論文本挖掘

R語(yǔ)言鳶尾花iris數(shù)據(jù)集的層次聚類(lèi)分析

R語(yǔ)言對(duì)用電負(fù)荷時(shí)間序列數(shù)據(jù)進(jìn)行K-medoids聚類(lèi)建模和GAM回歸

R語(yǔ)言聚類(lèi)算法的應(yīng)用實(shí)例


【視頻】KMEANS均值聚類(lèi)和層次聚類(lèi):R語(yǔ)言分析生活幸福指數(shù)可視化|數(shù)據(jù)分享的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
凯里市| 石棉县| 博客| 和平县| 临武县| 格尔木市| 扎赉特旗| 沙坪坝区| 天柱县| 沛县| 罗城| 芦溪县| 威海市| 孙吴县| 新巴尔虎左旗| 阳谷县| 泗阳县| 武强县| 临洮县| 斗六市| 治多县| 武冈市| 三明市| 莆田市| 双流县| 金堂县| 遂平县| 衢州市| 扎鲁特旗| 伊川县| 威宁| 滦平县| 五指山市| 久治县| 调兵山市| 简阳市| 江口县| 长丰县| 西贡区| 临海市| 曲靖市|