【統(tǒng)計(jì)綜合分析】十分鐘弄懂資料類型,全干貨無套路!

為什么要對資料進(jìn)行分類?
各資料之間有什么差別?
到底怎么學(xué)習(xí)資料分類?
……
資料以及資料的類型是大家學(xué)習(xí)統(tǒng)計(jì)學(xué)時(shí)比較基礎(chǔ)的知識。翻看其他教材,同學(xué)們也會(huì)發(fā)現(xiàn)不同版本教材對“資料分類”的描述可能存在細(xì)微差別。
今天小衛(wèi)為大家進(jìn)行了簡單的整理和歸納,讓我們來弄懂資料類型吧~??

?小衛(wèi)點(diǎn)睛
??課本定位
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與典型錯(cuò)誤辨析》第三章 描述性統(tǒng)計(jì)學(xué)方法
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》(顏虹版)第一章 緒論
?《衛(wèi)生統(tǒng)計(jì)學(xué)》(人衛(wèi)八版)緒論
?《衛(wèi)生統(tǒng)計(jì)學(xué)》(人衛(wèi)七版)第一章 緒論

??為什么要對資料進(jìn)行分類?
為什么要將資料進(jìn)行分類?不同教材中對于這個(gè)問題均有介紹,總結(jié)來說就是分為以下兩點(diǎn)原因:
①?便于對資料進(jìn)行統(tǒng)計(jì)描述。
②?便于選用合適的統(tǒng)計(jì)分析方法,進(jìn)行統(tǒng)計(jì)推斷。
綜上所述,正如看病的過程一樣,我們只有知道病因才能“對癥下藥”。我們只有先確定資料的類型,才能確定統(tǒng)計(jì)描述的指標(biāo)和統(tǒng)計(jì)推斷采用的統(tǒng)計(jì)學(xué)方法。
?小衛(wèi)點(diǎn)睛
??課本定位
?《衛(wèi)生統(tǒng)計(jì)學(xué)》(人衛(wèi)七版)第一章 緒論
?《衛(wèi)生統(tǒng)計(jì)學(xué)》(人衛(wèi)八版)緒論
?《衛(wèi)生統(tǒng)計(jì)學(xué)》(趙耐青版)第一章 緒論
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》(仇麗霞版)第一章 緒論
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)》(姜晶梅版)第一章 緒論
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》(陸首增版)第一章 緒言
?《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》(顏虹版)第一章 緒論
?《衛(wèi)生統(tǒng)計(jì)學(xué)教程》(王燕版)第一章 緒論
?《實(shí)用醫(yī)學(xué)統(tǒng)計(jì)學(xué)與SAS應(yīng)用》(張明芝版)第一章 緒論

??不同教材對于資料分類的區(qū)別以及它們各自的依據(jù)。
不同教材在對資料分類的時(shí)候,主要從兩個(gè)角度進(jìn)行切入:
??第一種分類:以人衛(wèi)七版教材為典型示例,先對變量性質(zhì)分為定量or定性,再根據(jù)取值情況進(jìn)行細(xì)分。
??第二種分類:以趙耐青統(tǒng)計(jì)教材為典型示例,先根據(jù)從區(qū)間內(nèi)是否可以任意取值出發(fā),分為連續(xù)or離散,再根據(jù)取值情況進(jìn)行細(xì)分。
除此之外,由于等級資料(又稱半定量資料)的存在,陸首增版、顏虹版教材直接將資料類型分成了3種資料,即定性資料、半定量資料、定量資料。具體如下表所示。



??究竟什么是定量資料、定性資料?家庭子女?dāng)?shù)和正常成年男子脈搏數(shù)這種屬于定量資料嗎?
???定量資料(Quantitative data)
又稱計(jì)量資料(measurement data)、數(shù)值資料(numerical data),是對觀察對象的數(shù)值大小測量所得的資料,比如年齡、身高、體重、家庭子女人數(shù)。
這些指標(biāo)是定量的,表現(xiàn)為數(shù)值可以比大小,比如小紅的身高比小黃高XXcm,再比如,A家庭小孩的個(gè)數(shù)比B家庭多了多少個(gè)?
需要注意的是,定量資料包括連續(xù)型資料(即在一個(gè)區(qū)間內(nèi)可以連續(xù)取值,如身高cm、體重kg、血紅蛋白g/U)和離散型資料(無法連續(xù)取值,如家庭小孩的個(gè)數(shù)、正常成年男子脈搏數(shù)(次/min)、引體向上的次數(shù)(次/min))兩種。
???定性資料(Qualitative Data)
是指對每個(gè)研究對象的某些方面的特征和性質(zhì)進(jìn)行表達(dá)或描述所得的資料。由于定性變量的取值往往表現(xiàn)為互不交叉的類別,所以部分教材中定性變量也稱分類變量。
其具體的取值是名義的,如血型(A,B,O,AB)、性別(男、女)等,本質(zhì)上無數(shù)量大小或先后順序之分的定性資料,則稱為“無序分類資料”。
若指標(biāo)質(zhì)的不同狀況之間在本質(zhì)上有數(shù)量大小或有先后順序之分的定性資料,就叫“有序資料”。例如某病患者按治療后的療效(治愈、顯效、好轉(zhuǎn)、無效、死亡)。


??趙耐青教材中,不具分類性質(zhì)的資料是什么意思?這種說法在其它版本教材中,有相對應(yīng)的說法嗎?

不具有分類性質(zhì)的離散型資料,其概念包含兩重含義:
??離散型資料,就是在某區(qū)間取值不能連續(xù)不斷取值。
??如果分類的話,不能進(jìn)行分類(因?yàn)椴痪邆浞诸惖念悇e)。將此類變量也歸于定量資料。
對標(biāo)人衛(wèi)七版統(tǒng)計(jì),也可以將不具有分類的性質(zhì)的資料,作為定量資料中的離散型變量來看待。


??等級資料為什么又稱半定量資料?
對于等級資料,在某些版本的教材,如人衛(wèi)八版、張明芝版、仇麗霞版中可能也被稱為半定量資料,比如說在人衛(wèi)八版教材中的理解為“如學(xué)歷這類定性變量的取值為文盲、小學(xué)、初中、高中、大專及以上,給人一種等級或順序的感覺。
因此我們稱之為有序分類變量。這是指其取值的各類別之間存在著程度上的差別,給人以‘半定量’的感覺,我們也將其稱為“等級變量”。
顏虹版本中的敘述為“等級資料(有序資料)指將觀察單位按某種屬性的不同程度或次序分成等級后分組計(jì)數(shù)的觀察結(jié)果,特點(diǎn)是具有半定量性質(zhì)”。
根據(jù)以上的定義,可以發(fā)現(xiàn)“半定量”的理解可以分為兩個(gè)方面:首先,它是分組后進(jìn)行計(jì)數(shù)的觀察結(jié)果,具有分類變量的性質(zhì);其次,數(shù)據(jù)之間存在程度、等級、順序之間的區(qū)別,類似于定量變量(定量變量間也存在大小、高低之分)。所以稱之為“半定量資料”。


??變量和資料兩個(gè)術(shù)語有沒有區(qū)別?
以定量變量與定量資料為例進(jìn)行說明,如下表:


看到這里,大家有沒有恍然大悟的感覺呀~統(tǒng)計(jì)學(xué)在考試中占比不小,同學(xué)們一定要好好準(zhǔn)備。為方便大家更全面地掌握統(tǒng)計(jì)學(xué)知識,????【傳送門?流統(tǒng)計(jì)算題集訓(xùn)營】火熱進(jìn)行中,快和小衛(wèi)一起點(diǎn)亮上岸之路啦!????
