最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

相關(guān)性分析

2023-04-06 09:12 作者:小云愛(ài)生信  | 我要投稿

爾云間? 一個(gè)專門(mén)做科研的團(tuán)隊(duì)

原創(chuàng)?小果?生信果


相關(guān)分析是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量?jī)蓚€(gè)因素的的相關(guān)密切程度,相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進(jìn)行相關(guān)性分析。判斷數(shù)據(jù)是否具有相關(guān)關(guān)系,最直觀的方法就是繪制散點(diǎn)圖


要判斷多個(gè)數(shù)據(jù)的之間的關(guān)系,散點(diǎn)圖的繪制就會(huì)顯得比較繁瑣,這時(shí)候要選擇繪制散點(diǎn)矩陣



相關(guān)系數(shù)


相關(guān)系數(shù)衡量了兩個(gè)變量的統(tǒng)一程度,范圍是-1~1,‘1’代表完全正相關(guān),‘-1’代表完全負(fù)相關(guān)。比較常用的是Pearson‘皮爾遜’相關(guān)系數(shù)、Spearman‘斯皮爾曼’相關(guān)系數(shù)。在R中,相關(guān)性分析的R包:

install.packages("corrplot")

網(wǎng)址:Visualize correlation matrix using correlogram - Easy Guides - Wiki - STHDA


下面小果將帶大家用具體的例子來(lái)了解相關(guān)性的概念:測(cè)試數(shù)據(jù)是ggplot2 包中自帶的diamond 數(shù)據(jù),每一行為一種鉆石,每一列為鉆石不同的屬性,如carat (克拉), cut (切工), color (色澤), clarity (透明度) 等。數(shù)據(jù)讀進(jìn)來(lái)后,怎么繪制呢?不要著急,小果將一步步帶你學(xué)習(xí)。

首先繪制散點(diǎn)圖,橫軸是克拉數(shù),縱軸是價(jià)格(正相關(guān))qplot(carat,price,data=dat)?

繪制散點(diǎn)圖,對(duì)x,y?值取log,可以看出鉆石的克拉數(shù)和價(jià)格是呈現(xiàn)正相關(guān)的。

qplot(log(carat),log(price),data=dat)

顏色、大小、性狀和其他屬性的設(shè)置

qplot(carat,price,data=dat,colour=color)

#?后期應(yīng)用ggplot()?函數(shù)后,可以更加自由的繪制各種組合圖形

qplot(carat,price,data=dat,geom=c("point","smooth"))#?添加了一條擬合曲線


大家對(duì)相關(guān)性是不是有了一些初步的了解了呢?不要著急,下面小果將會(huì)帶大家學(xué)習(xí)corrgram繪制相關(guān)性:


df <- read.csv("corrplot.csv", row.names = 1)
head(df)
par(bg = "#fdfdfd")
# 左下角
panel.raters <- function (x, y, corr = NULL, ...) {
? if (!is.null(corr))
??? return()
? plot.xy(xy.coords(x, y), type = "p",
????????? pch = 20, #點(diǎn)形狀
????????? cex = .5, #點(diǎn)大小
????????? ...)
? abline(lm(y ~ x), lwd = 2) #畫(huà)擬合線
? box(col = "black", lwd = 2) #黑色粗邊框
}
# 對(duì)角線
textPanel <- function (x = 0.5, y = 0.5, txt, cex, font) {
? text(x, y, txt, cex = cex, font = font)
? box(col = "black", lwd = 2)
}
# 右上角
panel.fill.cor <- function (x, y, corr = NULL, ...)
{
??? # 計(jì)算相關(guān)系數(shù)
??? corr <- round(cor(x, y, use = "pairwise", method = "pearson"),2) # 可以換成"kendall"或 "spearman"
?? ?
??? # 自定義背景顏色
??? ncol <- 14
??? col.regions <- colorRampPalette(c('darkslateblue', 'navy', 'white', 'firebrick3', 'red'))
??? pal <- col.regions(ncol)
??? col.ind <- as.numeric(cut(corr, breaks = seq(from = -1, to = 1, length.out = ncol + 1), include.lowest = TRUE))
?? ?
??? # 畫(huà)背景
??? par(new=TRUE)
??? plot(0, type='n', xlim=c(-1,1), ylim=c(-1,1), axes=FALSE, asp=1)
??? usr <- par("usr")
??? rect(usr[1], usr[3], usr[2], usr[4], col = pal[col.ind],
??????? border = NA)
?? ?
??? # 寫(xiě)相關(guān)系數(shù)
??? text(0, 0, labels = corr, cex = 2.5, col = ifelse(corr > 0, "black", "white"))
??? box(col = "black") #黑色窄邊框
}
# 畫(huà)圖并保存到pdf文件
pdf("corrgram.pdf",8,8)
pairs(df[1:5],
????? gap = .5, #小圖之間的空隙
????? text.panel = textPanel, #對(duì)角線
????? lower.panel = panel.raters, #左下角
????? upper.panel = panel.fill.cor) #右上角

dev.off()

好了,今天的分享就到這里了,歡迎關(guān)注"生信果”生信入門(mén)、R語(yǔ)言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見(jiàn)證小白和大佬的成長(zhǎng)。


推薦閱讀




相關(guān)性分析的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
北碚区| 瑞金市| 湘乡市| 永康市| 湛江市| 阳朔县| 河南省| 青川县| 山阴县| 隆安县| 镇远县| 华容县| 抚宁县| 井冈山市| 雷州市| 云阳县| 龙海市| 蓝山县| 宜兴市| 通城县| 奉贤区| 赣榆县| 罗源县| 长子县| 武安市| 和硕县| 山东| 伽师县| 安塞县| 通州区| 乃东县| 哈尔滨市| 肇州县| 哈巴河县| 伊宁市| 九寨沟县| 敖汉旗| 改则县| 平山县| 贵阳市| 台中县|