R語言關聯(lián)規(guī)則Apriori對抗腫瘤中藥數(shù)據(jù)庫知識發(fā)現(xiàn)研究|附代碼數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=32660
原文出處:拓端數(shù)據(jù)部落公眾號
腫瘤是近年來嚴重威脅人類的健康的疾病,據(jù)統(tǒng)計,目前大部分種類的腫瘤都呈現(xiàn)不同程度的上升趨勢,中國因患腫瘤而死亡的人數(shù)約占全球腫瘤死亡總人數(shù)的1/4左右,人類正面臨著腫瘤防治的新挑戰(zhàn)?,F(xiàn)代醫(yī)學治療腫瘤的手段和方式已經日臻完善,主要為手術配合放、化療聯(lián)合治療。
但傳統(tǒng)西醫(yī)治療在提高緩解率的同時易產生較強的毒副作用與耐藥性。作為傳統(tǒng)醫(yī)學主體的中醫(yī)藥與西醫(yī)相結合辨證施治,在提高療效、緩解不良反應等方面有其獨特的優(yōu)勢。
本研究幫助客戶在收集數(shù)據(jù)建立抗腫瘤中藥數(shù)據(jù)庫的基礎上,運用數(shù)學模型探尋抗腫瘤中藥性效關系及現(xiàn)代藥理學研究,為抗腫瘤中醫(yī)及中西醫(yī)綜合治療的臨證用藥提供理論依據(jù)。
讀取數(shù)據(jù)
siqi=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=1 ) ?wuwei=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=2 ) ?guijing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=3 ) ?duxing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=4 ) ?gongneng =read.xlsx("性效挖掘一列0616 2.xlsx",sheet=5 )
(一)頻數(shù)統(tǒng)計
四氣、五味、歸經、有(無)毒、藥理功能基礎分析
(1)抗腫瘤中藥四氣、五味、歸經、有無毒性、功能、藥理作用→頻數(shù)統(tǒng)計(?or?數(shù)據(jù)分布)
(四氣、五味、歸經、有毒無毒考慮數(shù)字、直方圖、餅圖表示)
繪制直方圖
barplot(table(unlist(x[,2]))) ?? tab1=table(unlist(x[,2])) ?? tab2=table(unlist(x[,2]))/sum(table(unlist(x[,2]))) ?? ?? res=cbind(tab1,tab2) ?? colnames(res)=c("頻數(shù)","頻率")
a_df3=merge(siqi,wuwei,by="流水號" ) ?a_df3=merge(a_df3,guijing,by="流水號" )
交叉表
藥味和四氣那兩列要和功效分別做兩張這種圖
tab=table(a_df$功能,a_df$四氣) ?for(i in 1:ncol(tab)){
導出為excel文件:
(二)關聯(lián)規(guī)則
對經典的?Apriori?算法進行改進,編程實現(xiàn)雙向強關聯(lián)規(guī)則挖掘方法,采用此方法分析藥?-?藥性?-?功效之間的聯(lián)系
將數(shù)據(jù)轉換成事務類型
for(i in 2:ncol(a_df3))a_df3[,i]=as.factor(a_df3[,i])rulesmodel=function(X){ ?rules <- sort(rules, by="support") ?arules::inspect(head(rules, n=20)) ?#查看最高置信度樣本規(guī)則 ?rules <- sort(rules, by="confidence")
(1)藥性?功效關聯(lián)性分析
1)藥性關聯(lián)性分析
①四氣、五味??
rulesmodel(c("四氣","五味"))
②四氣、歸經
2)藥性**-**?功效關聯(lián)性分析
①四氣、功能
④四氣、五味、歸經、功能→綜合分析
◎?用網(wǎng)絡圖表示。用表格?圖片類似下圖。
rulesmodel(c("四氣","五味","歸經"))
四個比較有兩個,一個是(性-味-歸經-毒性),用頻繁項集和圓圈圖。
rulesmodel(c("四氣","五味","歸經","毒性"))
(性-味-歸經-功能)的做頻繁項集和網(wǎng)絡圖,做成關系網(wǎng)
rulesmodel(c("四氣","五味","歸經","功能"))
最受歡迎的見解
1.Python中的Apriori關聯(lián)算法-市場購物籃分析
2.R語言繪制生存曲線估計|生存分析|如何R作生存曲線圖
3.用關聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律
4.通過Python中的Apriori算法進行關聯(lián)規(guī)則挖掘
5.用關聯(lián)規(guī)則數(shù)據(jù)挖掘探索藥物配伍中的規(guī)律
6.采用SPSS Modeler的Web復雜網(wǎng)絡對所有腧穴進行分析
7.R語言如何在生存分析與COX回歸中計算IDI,NRI指標
8.R語言如何找到患者數(shù)據(jù)中具有差異的指標?(PLS—DA分析)
9.R語言中的生存分析Survival analysis晚期肺癌患者4例