R語言Apriori關聯(lián)規(guī)則、K-means均值聚類數據挖掘中藥專利復方治療用藥規(guī)律網絡可視化
全文鏈接:http://tecdat.cn/?p=30605
原文出處:拓端數據部落公眾號
應用關聯(lián)規(guī)則、聚類方法等數據挖掘技術分析治療抑郁癥的中藥專利復方組方配伍規(guī)律。方法檢索治療抑郁癥中藥專利復方,排除外用中藥及中西藥物合用的復方。
最近我們被要求撰寫關于用藥規(guī)律的研究報告,包括一些圖形和統(tǒng)計輸出。對入選的中藥專利復方進行術語規(guī)范化等處理,抽取信息、建立表,應用數據分析軟件R對數據進行關聯(lián)規(guī)則分析,應用網絡分析軟件進行聚類分析。
查看數據
轉換成二值矩陣數據
colnames(data) <- paste0("X",1:ncol(data))for(i in 1:nrow(data)) { ?tmp <- integer(length(total_types))
建立apriori
plot(all_rules, method = "graph")
中藥專利復方中藥對的關聯(lián)規(guī)則分析
藥對是方劑配伍的基本形式,它反映了中藥之間相輔相成、相反相成、同類相從等配伍關系。藥對中的中藥在組方配伍時具有在處方中同時出現的特點,因此在關聯(lián)規(guī)則分析中,分析置信度較大且雙向關聯(lián)的規(guī)則即可得到藥對。?
根據置信度和支持度篩選強關聯(lián)規(guī)則
K-means均值網絡聚類分析
抑郁癥中藥專利復方中藥物之間形成了一個復雜的配伍關系網絡,關聯(lián)規(guī)則分析可以用來發(fā)現其中的藥對及強關聯(lián)規(guī)則,但隨著支持度和置信度閾值參數的降低,關聯(lián)規(guī)則大量涌現,使得其中的配伍規(guī)律變得難以分析,應用網絡聚類方法可以有效地發(fā)現其中的配伍規(guī)律。
#聚類類別號kmod$cluster
查看每個類別中的強關聯(lián)規(guī)則
聚類1
聚類2
配伍關系網絡的聚類分析結果顯示了抑郁癥治療中常用的中藥“社團”,反映了復方中一些配伍關系相對密切、固定的中藥聯(lián)合,臨床運用可以提高療效。
最受歡迎的見解
1.R語言分布式滯后非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模
2.R語言分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對死亡率時間序列數據
3.R語言群組變量選擇、組懲罰GROUP LASSO套索模型預測分析新生兒出生體重風險因素數據和交叉驗證、可視化
4.R語言邏輯回歸、隨機森林、SVM支持向量機預測FRAMINGHAM心臟病風險和模型診斷可視化
5.R語言非線性混合效應 NLME模型(固定效應&隨機效應)對抗哮喘藥物茶堿動力學研究
6.R語言使用限制平均生存時間RMST比較兩條生存曲線分析肝硬化患者
7.分類回歸決策樹交互式修剪和更美觀地可視化分析細胞圖像分割數據集
8.PYTHON深度學習實現自編碼器AUTOENCODER神經網絡異常檢測心電圖ECG時間序列
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標