最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

畢業(yè)設(shè)計(jì) 醫(yī)學(xué)數(shù)據(jù)分析 中醫(yī)乳腺癌數(shù)據(jù)分析與可視化

2023-08-23 16:27 作者:丹成學(xué)長(zhǎng)  | 我要投稿

0 前言

??這兩年開(kāi)始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長(zhǎng)自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。

為了大家能夠順利以及最少的精力通過(guò)畢設(shè),學(xué)長(zhǎng)分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)目,今天要分享的是

?? 醫(yī)學(xué)大數(shù)據(jù)分析 乳腺癌數(shù)據(jù)分析與可視化

??學(xué)長(zhǎng)這里給一個(gè)題目綜合評(píng)分(每項(xiàng)滿分5分)

  • 難度系數(shù):3分

  • 工作量:3分

  • 創(chuàng)新點(diǎn):3分

畢設(shè)幫助,選題指導(dǎo),技術(shù)解答,歡迎打擾,見(jiàn)B站個(gè)人主頁(yè)

https://space.bilibili.com/33886978

背景

  • 中醫(yī)藥治療乳腺癌有著廣泛的適應(yīng)證和獨(dú)特的優(yōu)勢(shì)。從整體出發(fā),調(diào)整機(jī)體氣血、陰陽(yáng)、臟腑功能的平衡,根據(jù)不同的臨床證候進(jìn)行辨證論治。確定“先證而治”的方向:即后續(xù)證侯尚未出現(xiàn)之前,需要截?cái)鄲夯∏榈哪男┖罄m(xù)證侯。

  • 找出中醫(yī)癥狀間的關(guān)聯(lián)關(guān)系和諸多癥狀間的規(guī)律性,并且依據(jù)規(guī)則分析病因、預(yù)測(cè)病情發(fā)展以及為未來(lái)臨床診治提供有效借鑒。能夠幫助乳腺癌患者手術(shù)后體質(zhì)的恢復(fù)、生存質(zhì)量的改善,有利于提高患者的生存機(jī)率。

  • 目前,中醫(yī)治療一般都是采用中醫(yī)辨證的原則,結(jié)合臨床醫(yī)師的從醫(yī)經(jīng)驗(yàn)和醫(yī)學(xué)指南進(jìn)行診斷,然而此方法也存在一定的缺陷。

原始數(shù)據(jù)說(shuō)明

患者信息屬性說(shuō)明,針對(duì)患者的信息,對(duì)每個(gè)屬性進(jìn)行相應(yīng)說(shuō)明。

在這里插入圖片描述


患者病理信息,包含患者的基本信息以及病理癥狀等。 ?

在這里插入圖片描述


挖掘目標(biāo)

  1. 借助三陰乳腺癌患者的病理信息,挖掘患者的癥狀與中醫(yī)證型之間的關(guān)聯(lián)關(guān)系;

  2. 對(duì)截?cái)嘀委熖峁┮罁?jù),挖掘潛性證素。

初步分析

1.針對(duì)乳腺癌患者,可運(yùn)用中醫(yī)截?cái)喁煼ㄟM(jìn)行治療,在辨病的基礎(chǔ)上圍繞各個(gè)病程的特殊證候先證而治型;

2.依據(jù)醫(yī)學(xué)指南,將乳腺癌辨證統(tǒng)一化,為六種證型。且患者在圍手術(shù)期、圍化療期、圍放療期和內(nèi)分泌治療期等各個(gè)病程階段,基本都會(huì)出現(xiàn)特定的臨床癥狀。

3.通過(guò)關(guān)聯(lián)規(guī)則算法,挖掘各中醫(yī)證素與乳腺癌TNM分期之間的關(guān)系。探索不同分期階段的三陰乳腺癌患者的中醫(yī)證素分布規(guī)律,以及截?cái)嗖∽儼l(fā)展、先期干預(yù)的治療思路,指導(dǎo)三陰乳腺癌的中醫(yī)臨床治療。

總體流程

數(shù)據(jù)預(yù)處理

屬性規(guī)約

屬性規(guī)約:刪除不相關(guān)屬性,選取其中六種證型得分、患者編號(hào)和TNM分期屬性。 ?

在這里插入圖片描述

數(shù)據(jù)變換

屬性構(gòu)造

為了更好的反應(yīng)出中醫(yī)證素分布的特征,采用證型系數(shù)代替具體單證型的證素得分,證型相關(guān)系數(shù)計(jì)算公式如下:證型系數(shù) = 該證型得分/該證型總分。 ?

在這里插入圖片描述

數(shù)據(jù)離散化

為了建模需要,需要對(duì)數(shù)據(jù)進(jìn)行離散化。本例采用聚類算法對(duì)各個(gè)證型系數(shù)進(jìn)行離散化處理,將每個(gè)屬性聚成四類。

#- _\- coding: utf-8 -_ - ?
‘’’ ?
聚類離散化,最后的result的格式為: ?
1 2 3 4 ?
A 0 0.178698 0.257724 0.351843 ?
An 240 356.000000 281.000000 53.000000 ?
即(0, 0.178698]有240個(gè),(0.178698, 0.257724]有356個(gè),依此類推。 ?
‘’’ ?
from **future** import print_function ?
import pandas as pd ?
from sklearn.cluster import KMeans #導(dǎo)入K均值聚類算法 ?

datafile = ‘C://Python//DataAndCode//chapter8//demo//中醫(yī)證型的關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)//data.xls’
#待聚類的數(shù)據(jù)文件 ?
processedfile = ‘…/tmp/data_processed.xls’ #數(shù)據(jù)處理后文件 ?
typelabel ={u’肝氣郁結(jié)證型系數(shù)’:‘A’, u’熱毒蘊(yùn)結(jié)證型系數(shù)’:‘B’, u’沖任失調(diào)證型系數(shù)’:‘C’,
u’氣血兩虛證型系數(shù)’:‘D’, u’脾胃虛弱證型系數(shù)’:‘E’, u’肝腎陰虛證型系數(shù)’:‘F’} ?
k = 4 #需要進(jìn)行的聚類類別數(shù)


? ?
? ?#讀取數(shù)據(jù)并進(jìn)行聚類分析
? ?data = pd.read_excel(datafile) #讀取數(shù)據(jù)
? ?keys = list(typelabel.keys())
? ?result = pd.DataFrame()

? ?if __name__ == '__main__': #判斷是否主窗口運(yùn)行,如果是將代碼保存為.py后運(yùn)行,則需要這句,如果直接復(fù)制到命令窗口運(yùn)行,則不需要這句。
? ? ?for i in range(len(keys)):
? ? ? ?#調(diào)用k-means算法,進(jìn)行聚類離散化
? ? ? ?print(u'正在進(jìn)行“%s”的聚類...' % keys[i])
? ? ? ?kmodel = KMeans(n_clusters = k, n_jobs = 4) #n_jobs是并行數(shù),一般等于CPU數(shù)較好
? ? ? ?kmodel.fit(data[[keys[i]]].as_matrix()) #訓(xùn)練模型
? ? ? ?
? ? ? ?r1 = pd.DataFrame(kmodel.cluster_centers_, columns = [typelabel[keys[i]]]) #聚類中心
? ? ? ?r2 = pd.Series(kmodel.labels_).value_counts() #分類統(tǒng)計(jì)
? ? ? ?r2 = pd.DataFrame(r2, columns = [typelabel[keys[i]]+'n']) #轉(zhuǎn)為DataFrame,記錄各個(gè)類別的數(shù)目
? ? ? ?r = pd.concat([r1, r2], axis = 1).sort(typelabel[keys[i]]) #匹配聚類中心和類別數(shù)目
? ? ? ?r.index = [1, 2, 3, 4]
? ? ? ?
? ? ? ?r[typelabel[keys[i]]] = pd.rolling_mean(r[typelabel[keys[i]]], 2) #rolling_mean()用來(lái)計(jì)算相鄰2列的均值,以此作為邊界點(diǎn)。
? ? ? ?r[typelabel[keys[i]]][1] = 0.0 #這兩句代碼將原來(lái)的聚類中心改為邊界點(diǎn)。
? ? ? ?result = result.append(r.T)
? ?
? ? ?print(result.head())


構(gòu)建中醫(yī)證型關(guān)聯(lián)規(guī)則模型

構(gòu)建中醫(yī)證型關(guān)聯(lián)模型:采用關(guān)聯(lián)規(guī)則算法,輸入建模參數(shù),探索乳腺癌患者TNM分期與中醫(yī)證型系數(shù)之間的關(guān)系,挖掘他們之間的關(guān)聯(lián)關(guān)系。 ? 注:結(jié)合實(shí)際業(yè)務(wù)分析且需要多次設(shè)置,確定最小支持度與最小置信度。本例的輸入?yún)?shù)為:最小支持度6%、最小置信度75%

流程圖 ?

在這里插入圖片描述

#- _\- coding: utf-8 -_ - ?
from **future** import print_function ?
import pandas as pd ?
from apriori import * #導(dǎo)入自行編寫的apriori函數(shù) ?
import time #導(dǎo)入時(shí)間庫(kù)用來(lái)計(jì)算用時(shí) ?
?
inputfile = ‘…/data/apriori.txt’ #輸入事務(wù)集文件 ?
data = pd.read_csv(inputfile, header=None, dtype = object)


?
? ?start = time.clock() #計(jì)時(shí)開(kāi)始
? ?print(u'\n轉(zhuǎn)換原始數(shù)據(jù)至0-1矩陣...')
? ?ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #轉(zhuǎn)換0-1矩陣的過(guò)渡函數(shù)
? ?b = map(ct, data.as_matrix()) #用map方式執(zhí)行
? ?data = pd.DataFrame(b).fillna(0) #實(shí)現(xiàn)矩陣轉(zhuǎn)換,空值用0填充
? ?end = time.clock() #計(jì)時(shí)結(jié)束
? ?print(u'\n轉(zhuǎn)換完畢,用時(shí):%0.2f秒' %(end-start))
? ?del b #刪除中間變量b,節(jié)省內(nèi)存
? ?

? ?support = 0.06 #最小支持度
? ?confidence = 0.75 #最小置信度
? ?ms = '---' #連接符,默認(rèn)'--',用來(lái)區(qū)分不同元素,如A--B。需要保證原始表格中不含有該字符
? ?
? ?start = time.clock() #計(jì)時(shí)開(kāi)始
? ?print(u'\n開(kāi)始搜索關(guān)聯(lián)規(guī)則...')
? ?find_rule(data, support, confidence, ms)
? ?end = time.clock() #計(jì)時(shí)結(jié)束
? ?print(u'\n搜索完成,用時(shí):%0.2f秒' %(end-start))



?
#- _\- coding: utf-8 -_ - ?
from **future** import print_function ?
import pandas as pd ?
?
#自定義連接函數(shù),用于實(shí)現(xiàn)L_{k-1}到C_k的連接 ?
def connect_string(x, ms): ?
x = list(map(lambda i:sorted(i.split(ms)), x)) ?
l = len(x[0]) ?
r = [] ?
for i in range(len(x)): ?
for j in range(i,len(x)): ?
if x[i][:l-1] == x[j][:l-1] and x[i][l-1] != x[j][l-1]: ?
r.append(x[i][:l-1]+sorted([x[j][l-1],x[i][l-1]])) ?
return r

? ?#尋找關(guān)聯(lián)規(guī)則的函數(shù)
? ?def find_rule(d, support, confidence, ms = u'--'):
? ? ?result = pd.DataFrame(index=['support', 'confidence']) #定義輸出結(jié)果

? ? ?support_series = 1.0*d.sum()/len(d) #支持度序列
? ? ?column = list(support_series[support_series > support].index) #初步根據(jù)支持度篩選
? ? ?k = 0
? ? ?
? ? ?while len(column) > 1:
? ? ? ?k = k+1
? ? ? ?print(u'\n正在進(jìn)行第%s次搜索...' %k)
? ? ? ?column = connect_string(column, ms)
? ? ? ?print(u'數(shù)目:%s...' %len(column))
? ? ? ?sf = lambda i: d[i].prod(axis=1, numeric_only = True) #新一批支持度的計(jì)算函數(shù)
? ? ? ?
? ? ? ?#創(chuàng)建連接數(shù)據(jù),這一步耗時(shí)、耗內(nèi)存最嚴(yán)重。當(dāng)數(shù)據(jù)集較大時(shí),可以考慮并行運(yùn)算優(yōu)化。
? ? ? ?d_2 = pd.DataFrame(list(map(sf,column)), index = [ms.join(i) for i in column]).T
? ? ? ?
? ? ? ?support_series_2 = 1.0*d_2[[ms.join(i) for i in column]].sum()/len(d) #計(jì)算連接后的支持度
? ? ? ?column = list(support_series_2[support_series_2 > support].index) #新一輪支持度篩選
? ? ? ?support_series = support_series.append(support_series_2)
? ? ? ?column2 = []
? ? ? ?
? ? ? ?for i in column: #遍歷可能的推理,如{A,B,C}究竟是A+B-->C還是B+C-->A還是C+A-->B?
? ? ? ? ?i = i.split(ms)
? ? ? ? ?for j in range(len(i)):
? ? ? ? ? ?column2.append(i[:j]+i[j+1:]+i[j:j+1])
? ? ? ?
? ? ? ?cofidence_series = pd.Series(index=[ms.join(i) for i in column2]) #定義置信度序列
? ?
? ? ? ?for i in column2: #計(jì)算置信度序列
? ? ? ? ?cofidence_series[ms.join(i)] = support_series[ms.join(sorted(i))]/support_series[ms.join(i[:len(i)-1])]
? ? ? ?
? ? ? ?for i in cofidence_series[cofidence_series > confidence].index: #置信度篩選
? ? ? ? ?result[i] = 0.0
? ? ? ? ?result[i]['confidence'] = cofidence_series[i]
? ? ? ? ?result[i]['support'] = support_series[ms.join(sorted(i.split(ms)))]
? ? ?
? ? ?result = result.T.sort(['confidence','support'], ascending = False) #結(jié)果整理,輸出
? ? ?print(u'\n結(jié)果為:')
? ? ?print(result)
? ? ?
? ? ?return result

模型分析

TNM分期為H4期的三陰乳腺癌患者證型主要為肝腎陰虛證、熱毒蘊(yùn)結(jié)證、肝氣郁結(jié)證和沖任失調(diào),H4期患者肝腎陰虛證和肝氣郁結(jié)證的臨床表現(xiàn)較為突出,其置信度最大達(dá)到87.96%。 ?

在這里插入圖片描述

? 注:X表示各個(gè)證型系數(shù)范圍標(biāo)識(shí)組合而成的規(guī)則,Y表示TNM分期為H4期。A3表示肝氣郁結(jié)證型系數(shù)處于(0.258,0.35]范圍內(nèi)的數(shù)值,B2表示熱毒蘊(yùn)結(jié)證型系數(shù)處于(0.15,0.296]范圍內(nèi)的數(shù)值,C3表示沖任失調(diào)證型系數(shù)處于(0.288,0.415]范圍內(nèi)的數(shù)值,F(xiàn)4表示肝腎陰虛證型系數(shù)處于(0.353,0.607]范圍內(nèi)的數(shù)值

總結(jié)

IV期患者出現(xiàn)肝腎陰虛證之表現(xiàn)時(shí),應(yīng)當(dāng)以滋養(yǎng)肝腎為補(bǔ),清熱解毒為攻,攻補(bǔ)兼施,截?cái)酂岫咎N(yùn)結(jié)證的出現(xiàn)。 ? 患者多有肝氣郁結(jié)證的表現(xiàn),治療時(shí)須重視心理調(diào)適,對(duì)其進(jìn)行身心一體的綜合治療。

畢設(shè)幫助,選題指導(dǎo),技術(shù)解答,歡迎打擾,見(jiàn)B站個(gè)人主頁(yè)

https://space.bilibili.com/33886978

畢業(yè)設(shè)計(jì) 醫(yī)學(xué)數(shù)據(jù)分析 中醫(yī)乳腺癌數(shù)據(jù)分析與可視化的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
沽源县| 乌鲁木齐县| 铁岭市| 临泉县| 万年县| 阿瓦提县| 丰县| 台中市| 普定县| 峨眉山市| 布拖县| 长泰县| 苏尼特左旗| 余庆县| 福州市| 耿马| 龙门县| 大方县| 绥江县| 石棉县| 新建县| 宝应县| 宣城市| 略阳县| 拉孜县| 林口县| 华阴市| 壶关县| 台北县| 炉霍县| 于都县| 贵南县| 洛南县| 韶山市| 商洛市| 长阳| 阿城市| 扶沟县| 昂仁县| 霍邱县| 万山特区|