最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

醫(yī)學(xué)統(tǒng)計學(xué)總結(jié)

2023-12-10 11:06 作者:答案鬼  | 我要投稿

醫(yī)學(xué)統(tǒng)計學(xué)總結(jié)

一.緒論

1,醫(yī)學(xué)統(tǒng)計學(xué):運用概率論和數(shù)理統(tǒng)計學(xué)的原理和方法,研究醫(yī)學(xué)領(lǐng)域中隨機現(xiàn)象有關(guān)數(shù)據(jù)的搜集、整理、分析和推斷,進而闡明其客觀規(guī)律性的一門應(yīng)用科學(xué)。 2,醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容: 1) 統(tǒng)計研究設(shè)計 調(diào)查研究設(shè)計和實驗研究設(shè)計 2) 醫(yī)學(xué)統(tǒng)計學(xué)的基本原理和方法 研究設(shè)計和數(shù)據(jù)處理中的基本統(tǒng)計理論和方法。A:資料的搜集與整理 B:常用統(tǒng)計描述,集中趨勢和離散趨勢,相對數(shù),相關(guān)系數(shù),回歸系數(shù),統(tǒng)計表,統(tǒng)計圖 C:統(tǒng)計推斷,如參數(shù)估計和假設(shè)檢驗。 3)醫(yī)學(xué)多元統(tǒng)計方法 多元線性回歸和逐步回歸分析、判別分析、聚類分析、主成分分析、因子分析、logistic回歸與Cox回歸分析。 3,統(tǒng)計工作步驟: 1) 設(shè)計 明確研究目的和研究假說,確定觀察對象與觀察單位,樣本含量和抽樣方法,擬定研究方案,預(yù)期分析指標,誤差控制措施,進度與費用。 2) 搜集材料 A, 搜集材料的原則 及時、準確、完整 B, 統(tǒng)計資料的來源 醫(yī)學(xué)領(lǐng)域的統(tǒng)計資料的來源主要有三個方面。一是統(tǒng)計報表,二是經(jīng)常性工作記錄,三是專題調(diào)查或?qū)n}實驗。 C, 資料貯存 3) 整理資料 a檢查核對b設(shè)計分組c擬定整理表d歸表 4) 分析資料 統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷 4,同質(zhì)(homogeneity):指被研究指標的影響因素相同。 變異(variation):同質(zhì)基礎(chǔ)上的各觀察單位間的差異。 變量(variable):收集資料過程中,根據(jù)研究目的確定同質(zhì)觀察單位,再對每個觀察單位的某項特征進行測量或觀察,這種特征稱為變量 變量值:變量的觀察結(jié)果或測量值。 變量類型

變量值表現(xiàn)

實例

資料類型

數(shù)值變量 離散型 定量測量值,有計量單位 產(chǎn)前檢查次數(shù) 計量資料 連續(xù)型 身高 分類變量 無序 二分類 對立的兩類屬性 性別(男女) 計數(shù)資料 多分類 不相容的多類屬性 血型(A,B,O,AB) 有序 多分類 類間有程度差異的屬性 受教育程度(小學(xué),中學(xué),高中,大學(xué)…) 等級資料

5,總體(population) 根據(jù)研究目的所確定的同質(zhì)研究對象中所有觀察單位某變量值的集合。總體具有的基本特征是:同質(zhì)性 樣本(sample) 從總體中隨機抽取部分觀察單位,其變量值的集合構(gòu)成樣本。樣本必須具有

代表性

。代表性是指樣本來自同質(zhì)總體,足夠的樣本含量和隨機抽樣的前提。 統(tǒng)計量(statistics)描述樣本變量值特征的指標( 樣本率, 樣本均數(shù), 樣本標準差)。 參數(shù)(parameter)描述總體變量值特征的指標( 總體率, 標準差, 總體均數(shù))。 抽樣誤差(sampling error):由于個體差異的存在,即使在同一整體中隨機抽取若干樣本,各樣本的統(tǒng)計量往往不等,統(tǒng)計量與參數(shù)也會有所不同。這種因抽樣研究引起的差異稱抽樣誤差。 隨機事件(random event)對隨機試驗的各種可能結(jié)果的集合。 概率(probability) 描述隨機事件發(fā)生的可能性大些哦的一個度量。 小概率事件 若隨機事件A的概率P(A)≤α,習(xí)慣上,α=0.05時,就稱A為小概率事件。其統(tǒng)計學(xué)意義是小概率事件在一次隨機試驗中認為不會發(fā)生。

抽樣誤差

1,抽樣誤差(sampling error) 由抽樣而造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異。在醫(yī)學(xué)統(tǒng)計學(xué)中,常把由抽樣造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差;由抽樣造成的樣本率與總體率之間的差異稱為率的抽樣誤差。 2,樣本均數(shù)的標準差 (簡稱標準誤,standard error) 反映均數(shù)的抽樣誤差大小的指標。 大,抽樣誤差大;反之, 小,抽樣誤差小。 (3.1) 實際工作中 往往未知的,可用樣本標準差s作 的估計值,計算標準誤的估計值 。 (3.2) 3,標準誤的用途:a,衡量樣本均數(shù)的可靠性;b,估計總體均數(shù)的置信區(qū)間;3,用于均數(shù)的假設(shè)檢驗。 4,標準誤的估計值 的用途: a,描述抽樣誤差的大??; b,總體參數(shù)的估計; c,用來進行假設(shè)檢驗。 5,率的抽樣誤差:由抽樣造成的樣本率與總體率的差異稱為率的抽樣誤差。 衡量率的抽樣誤差大小的指標是率的標準誤 。 越小,率的抽樣誤差越小; 越大,率的抽樣誤差越大。 (3.3) 其中 為總體率。實際工作中,由于 往往是未知的,可用樣本率p作 的估計值,計算率的標準誤 的估計值 。 (3.4)。 標準差(s)

標準誤

計算公式s= (1)表示觀察值的變異程度 (1)估計均數(shù)的抽樣誤差的大小 (2)計算變異系數(shù)CV= 100% (2)估計總體均數(shù)的可信區(qū)間 ( , ) (3)確定醫(yī)學(xué)參考值范圍 (3)進行假設(shè)檢驗 (4)計算標準誤

簡述標準差、標準誤的區(qū)別與聯(lián)系?

區(qū)別:(1)含義不同:標準差S表示觀察值的變異程度,描述個體變量值(x)之間的變異度大小,S越大,變量值(x)越分散;反之變量值越集中,均數(shù)的代表性越強。標準誤 估計均數(shù)的抽樣誤差的大小,是描述樣本均數(shù)之間的變異度大小,標準誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小。(2)與n的關(guān)系不同: n增大時,S趨于σ(恒定),標準誤減少并趨于0(不存在抽樣誤差)。(3)用途不同:標準差表示x的變異度大小、計算變異系數(shù)、確定醫(yī)學(xué)參考值范圍、計算標準誤等,標準誤用于估計總體均數(shù)可信區(qū)間和假設(shè)檢驗。 聯(lián)系:二者均為變異度指標,樣本均數(shù)的標準差即為標準誤,標準差與標準誤成正比。 標準差: 標準誤:

二.分布

正態(tài)分布

1,正態(tài)分布的函數(shù) 其中 為總體均數(shù), 為總體標準差, 為圓周率, 為自然對數(shù)的底,且僅 為變量。以 為橫軸,以 為縱軸,當均數(shù)和標準差已知時即可繪出正態(tài)分布曲線。 為應(yīng)用方便,將式中 進行變量變換,使原來的正態(tài)分布變?yōu)?的標準正態(tài)分布,亦稱 分布。 被稱為標準正態(tài)變量或標準正態(tài)離差,將 代入上述公式即得標準正態(tài)分布的密度函數(shù) 。 (2.17) (2.18) 2,正態(tài)分布的特征 (1)正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。 (2)正態(tài)分布以均數(shù)為中心,左右對稱。 (3)正態(tài)分布有2個參數(shù)(parameter),即均數(shù) (位置)和標準差 (形狀)。當 固定不變時, 越大,曲線沿橫軸越向右移動;反之, 越小,則曲線沿橫軸越向左移動。當 固定不變時, 越大,曲線越平闊; 越小,曲線越尖峭。通常用N( , )表示均數(shù)為 、方差為 的正態(tài)分布。用(0,1)表示標準正態(tài)分布。(4)正態(tài)分布在 1 處各有一個拐點。(5)正態(tài)曲線下面積的分布有一定規(guī)律。 3,常用的兩個區(qū)間: 1.96 及 2.58 的區(qū)間面積分別占總面積的95%及99%。 4,正態(tài)分布的應(yīng)用 1),制定醫(yī)學(xué)參考值范圍 a,正態(tài)分布法 適用于正態(tài)或近似正態(tài)分布的資料 雙側(cè)界值: ;單側(cè)上界: ,或單側(cè)下界: 。 b,對數(shù)正態(tài)分布法 適用于對數(shù)正態(tài)分布資料 雙側(cè)界值: ;單側(cè)上界: ,或單側(cè)下界 c,百分位數(shù)法 常用于偏態(tài)分布資料及資料中一端或兩端無確切數(shù)值的資料。雙側(cè)界值: 和 ;單側(cè)上界: ,或單側(cè)下界: 。 2)正態(tài)分布是多種統(tǒng)計方法的理論基礎(chǔ) 如t分布,F(xiàn)分布, 分布都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的, 分布也是以正態(tài)分布為基礎(chǔ)的。另外t分布,二項分布,poisson分布的極限為正態(tài)分布,一定條件下可按正態(tài)分布原理處理。

t分布

1,t分布: (3.5) t分布的特征為: 1. 以0為中心,左右對稱的單峰分布。 2. t分布曲線形態(tài)變化與自由度的大小有關(guān)。自由度 越小,則t值越分散,曲線越低平;自由度 逐漸增大時,則t分布逐漸逼近正態(tài)分布(標準正態(tài)分布)。當 = 時,t分布為u分布。t界值表附圖中非陰影部分面積的概率為: 2,總體均數(shù)的估計:用樣本指標估計總體參數(shù)稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面。總體均數(shù)的估計有2種方法。一是直接用統(tǒng)計量 估計總體參數(shù) ,稱為點值估計。由于抽樣誤差的存在,此法很難估計準確。二是區(qū)間估計(interval estimation)法。區(qū)間估計是按一定的概率100(1- )%估計總體均數(shù)所在的范圍,亦稱可信區(qū)間(confidence interval,CI)。常取的可信度為95%和99%,即95%可信區(qū)間和99%可信區(qū)間。計算方法有3種: (1) 未知且n小 按t分布原理用式(3.6)計算可信區(qū)間。 由于 將 代入,得 則總體均數(shù)的100(1- )%可信區(qū)間的通式為: (3.6)或?qū)懗?( , )。 (2) 未知,但n足夠大時(n>100) t分布逼近u分布,按正態(tài)分布原理,用式(3.7)估計可信區(qū)間。 ( ) (3.7) (3) 已知 按正態(tài)分布原理,用式(3.8)估計可信區(qū)間。 ( )(3.8)

標準正態(tài)分布(u分布)與t分布有何異同?

答:相同點:t分布和標準正態(tài)分布(u分布)都是以0為中心的正態(tài)分布。標準正態(tài)分布是t分布的特例(自由度是無限大時)。 不同點:t分布為抽樣分布,u分布為理論分布;t分布比標準正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布;t分布有無數(shù)條曲線,而u分布只有唯一一條曲線。

二項分布

1,二項分布(binomial distribution)是對只具有2種互斥結(jié)果的離散型隨機事件的規(guī)律性進行描述的一種概率分布。 二項分布概率公式: (3.9) 式中n為獨立的貝努力試驗次數(shù), 為成功的概率,(1- )為失敗的概率,X為在n次貝努力試驗中出現(xiàn)“成功”的次數(shù), 表示在n次試驗中出現(xiàn)X的各種組合數(shù),在此稱為二項系數(shù)(binomial coefficient)。 2,二項分布的應(yīng)用條件: (1)各觀察單位只能具有相互對立的一種結(jié)果,如陽性或陰性,生存或死亡。 (2)已知發(fā)生某一結(jié)果(陽性)的概率為 ,其對立結(jié)果的概率為1- ,實際工作中要求 是從大量觀察中獲得比較穩(wěn)定的數(shù)值。 (3)n次試驗在相同條件下進行,且各個觀察單位的觀察結(jié)果相互獨立。 3,二項分布的性質(zhì): A,二項分布的均數(shù)和標準差 在二項分布的資料中, 當 和n已知時,它的均數(shù) 及其標準差 如下: =n (3.11) (3.12) 若均數(shù)和標準差不用絕對數(shù)表示,而是用率表示時,即對式(3.11)(3.12)分別除以n,得: (3.13) (3.14) 是樣本率的標準誤的理論值,當 未知時,常用樣本率p作為 的估計值,則: (3.15) B,二項分布的累計概率 二項分布的累計概率(cumulative probability)常用的有左側(cè)累計和右側(cè)累計2種方法。 從陽性率為 的總體中隨機抽取n個個體,則 (1)最多有k例陽性的概率 (3.16) (2)最少有k例陽性的概率

(3.17)

D,二項分布的形狀取決于 和n的大?。?(1)當 =0.5時,分布對稱;當 <0.5時,分布呈正偏態(tài),且固定n時, 越小,分布越偏;當 >0.5時,分布呈負偏態(tài),且固定n時, 越大,分布越偏。 (2)對固定的 ,分布隨n的增大趨于對稱。 4,總體率的估計 總體率的估計也有點估計和區(qū)間估計,點估計是簡單地用樣本率來估計總體率;區(qū)間估計是求出總體率的可能范圍。樣本率的理論分布和樣本含量n、陽性率p的大小有關(guān),所以需要根據(jù)n和p的大小不同,分別選用下列2種方法。 (一)查表法 當樣本含量n較小,如n≤50,特別是p很接近于0或1時,按二項分布的原理估計總體率的可信區(qū)間。 (二)正態(tài)近似法 當樣本含量n足夠大,且樣本率p或1-p均不太小,如np與n(1-p)均大于5時,樣本率的p的抽樣分布近似正態(tài)分布,總體率 的可信區(qū)間可按下列式(3.17)進行估計。 (3.17)

Poisson分布

1,Poisson分布 泊松分布是在 很小,樣本含量n趨向于無窮大時,二項分布的極限形式。更多地用于研究單位時間、單位人群、單位空間內(nèi),某罕見事件發(fā)生的次數(shù)的分布。 X=0,1,2 (3.19) 式中 =n 為Poisson分布的總體均數(shù),X為單位時間或單位空間內(nèi)某事件的發(fā)生數(shù),e為自然對數(shù)的底,約等于2.71828。在實際運算中,P(X)亦可按式(3.20)作遞推計算。 (3.20) 2,Poisson分布應(yīng)用條件: A, 要求事件的發(fā)生是相互獨立 B, 發(fā)生的概率相等 C, 結(jié)果是二分類 3,Poisson分布的性質(zhì): A, 該分布是一種單參數(shù)的離散型分布,其參數(shù)為 ,它表示單位時間或空間內(nèi)某件事平均發(fā)生的次數(shù),又稱強度參數(shù)。 B, Poisson分布的方差 和均數(shù) 相等,即 = C, Poisson分布的累計概率 (1) 最多為k次的概率 (2) 最少為k次的概率 4,Poisson分布的圖形 已知 ,就可按公式計算得出X=0,1,2, 時的P(X)值,以X為橫坐標,以P(X)為縱坐標作圖,即可會出Poisson分布的圖形。 值越小,分布越偏,隨著 的增大,分布越趨于對稱,當 =20時,分布接近正態(tài)分布,當 =50時,可以認為Poisson分布呈正態(tài)分布N( , )按正態(tài)分布處理。 5,Poisson分布具有可加性 6,總體參數(shù)的估計 由樣本均數(shù)(樣本計數(shù))X估計總體均數(shù) 也有點(值)估計和區(qū)間估計,區(qū)間估計的方法,需視樣本計數(shù)(樣本均數(shù))X的大小而定,X小時用查表法,X大時用正態(tài)近似法。 (一)查表法 當樣本計數(shù)X 時,用X值查附表poisson分布 的可信區(qū)間,可得總體均數(shù) 的95%或99%可信區(qū)間。 (二)正態(tài)近似法 當樣本計數(shù)X>50時,可用正態(tài)近似原理下面公式求總體均數(shù) 的95%或99%可信區(qū)間

正態(tài)分布、二項式和泊松分布的關(guān)系

: 二項分布(binomial distribution):對只具有兩種互斥結(jié)果的離散型隨機事件的規(guī)律性進行描述的一種概率分布。Poisson分布是在π很小,樣本含量n趨于無窮大時,二項分布的極限形式。當v=∞時,t分布即為u分布,趨向正態(tài)分布。

可信區(qū)間與參考值范圍的區(qū)別

: 意義、計算公式和用途均不同。(1)參考值范圍是指同質(zhì)總體內(nèi)包括百分之幾十個體值的估計范圍。而可信區(qū)間是指在百分之幾十的可信度估計的總體參數(shù)的所在范圍。(2)同樣的百分之幾十,參考值范圍是樣本范圍,可信區(qū)間是指可信度范圍,二者有著本質(zhì)的不同。(3)從意義來看,95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計的總體均數(shù)的所在范圍。(4)從計算公式看,若指標服從正態(tài)分布,95%參考值范圍的公式是: ±1.96s??傮w均數(shù)95%可信區(qū)間的公式是: 。前者用標準差,后者用標準誤。前者用1.96,后者用α為0.05,自由度為v的t界值。(5)從用途上看,可信區(qū)間用來估計總體均數(shù),參考值范圍用來判斷觀察對象的某項指標是否正常。

簡述檢驗假設(shè)與可信區(qū)間的聯(lián)系與區(qū)別

。 答:(1)可信區(qū)間用于推斷總體參數(shù)所在的范圍,假設(shè)檢驗用于推斷總體參數(shù)是否不同。前者估計總體參數(shù)的大小,后者推斷總體參數(shù)有無質(zhì)的不同。(2)可信區(qū)間也可回答假設(shè)檢驗的問題。但可信區(qū)間不能提供確切的P值范圍,只能給出在α水準上有無統(tǒng)計意義。(3)可信區(qū)間還可提示差別有無實際意義。

統(tǒng)計圖表

1,繪制統(tǒng)計圖的基本要求: A, 根據(jù)資料性質(zhì)和分析目的據(jù)頂適當圖形。 B, 標題應(yīng)說明資料的內(nèi)容、時間和地點,一般位于圖的下方。 C, 圖的縱、橫軸應(yīng)注明標目及對應(yīng)單位,尺度應(yīng)等距或具有規(guī)律性,一般自左而右、自下而上、由小到大。 D, 為使圖形美觀并便于比較,統(tǒng)計圖的長寬比例一般為7:5,有時為了說明問題也可以變動。 E, 比較、說明不同的事物時,可用不同顏色或線條表示,并常附圖例說明,但不宜過多。 2,常用統(tǒng)計圖的適用條件與繪制 1. 條圖(bar graph) 用等寬長條的高度表示按性質(zhì)分類資料各類別的數(shù)值大小,用于表示它們之間的對比關(guān)系。 2. 圓圖(pie graph) 圓形圖適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成。 3. 百分條圖(percent bar) 意義及適用資料同圓圖,也稱構(gòu)成條圖。 4. 線圖(line graph) 線圖適用于連續(xù)性資料,以不同的線段升降來表示資料的變化,并可表明一事物隨另一食物(時間)而變動的情況。 5. 直方圖(histogram) 直方圖用于表達連續(xù)性資料的頻數(shù)分布。 6. 散點圖(scatter diagram) 散點圖以直角坐標系中各點的密集程度和趨勢來表示兩現(xiàn)象間的關(guān)系。常用在對資料進行相關(guān)分析之前適用。

單變量資料

一,數(shù)值變量

統(tǒng)計描述

1,頻數(shù)表的編制 求全距 定組段和組距 列頻數(shù)表 畫頻數(shù)圖 2,頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢 3,頻數(shù)分布可以分為正態(tài)分布和偏態(tài)分布 4,頻數(shù)表的用途:揭示資料分布類型和分布特征,以便選取適當?shù)慕y(tǒng)計方法;便于進一步計算指標和統(tǒng)計處理;便于發(fā)現(xiàn)某些特大或者特小的可疑值。 5,集中趨勢的描述:均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù) 6,均數(shù)(mean):算術(shù)均數(shù)的簡稱。常用 = = 表示。 7,中位數(shù)(median):一組由小到大按順序排列的觀察值中位次居中的數(shù)值,用M表示??捎糜诿枋鋈魏畏植?,特別是偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料的中心位置。 8,百分位數(shù)(percentile)是一種位置指標,用 表示。一個百分位數(shù)P 將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大??捎糜诖_定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。 9,離散趨勢的描述:全距(range) 四分位數(shù)間距(quartile) 方差 標準差 10,全距(range) 亦稱極差,為一組同質(zhì)觀察值中最大值和最小值之差。反映個體差異的范圍,優(yōu)點是計算簡單,缺點是:1)只考慮最大最小值之間的差異,不能反映組內(nèi)其他觀察值的變異度;2)樣本含量相差懸殊時不宜用全距比較。 11,四分位數(shù)間距(quartile) 上四分位數(shù)與下四分位數(shù)之差。常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。 12,方差(variance)離均差的平方和表示。 13,標準差(standard variance)的作用:a,估計變量值的離散程度 b,計算變異系數(shù) c,與均數(shù)結(jié)合,估計變異值的頻數(shù)分布范圍 d,計算標準誤 (總體) s= (樣本) 14,變異系數(shù)(coefficient of variation) 常用于比較度量單位不同或均數(shù)相差懸殊的兩組或多組資料的變異度。CV= 100%

假設(shè)檢驗

1,假設(shè)檢驗(hypothesis test)亦稱顯著性檢驗(significance test),其基本思想是先對總體的參數(shù)或分布做出某種假設(shè),如設(shè)總體均數(shù)(或率)為一定值;兩總體均數(shù)(或率)相等;總體服從正態(tài)分布或兩分布相同等,然后根據(jù)樣本信息選用適當?shù)姆椒ǎ茢啻思僭O(shè)應(yīng)當拒絕或不拒絕。 2,假設(shè)檢驗的一般步驟: (1)建立假設(shè)和確定檢驗水準:根據(jù)實際情況確定單、雙側(cè)檢驗,建立假設(shè),確定檢驗水準; (2)選定檢驗方法和計算統(tǒng)計量:根據(jù)設(shè)計的類型及研究目的選擇合適的檢驗方法并計算出對應(yīng)的統(tǒng)計量; (3)確定P值并做出推斷結(jié)論。若t≥tα,v,則P≤α,按檢驗水準,拒絕H0,接受H1,尚可認為差異顯著有統(tǒng)計學(xué)意義;相反則差異不顯著,無統(tǒng)計學(xué)意義 3,假設(shè)檢驗時應(yīng)注意的事項: (1)要有嚴密的抽樣研究設(shè)計;樣本必須是從同質(zhì)總體中隨機抽取的,要保證組間的均衡性和資料的可比性,可能影響結(jié)果的非處理因素在對比組間應(yīng)盡可能相同或相近; (2)正確選擇檢驗方法;根據(jù)現(xiàn)有的資料類型、設(shè)計類型、分析目的、樣本含量等因素選用適當?shù)臋z驗方法,如不符合條件可做適當轉(zhuǎn)換; (3)正確理解“差別無顯著性”的含義,差別有統(tǒng)計學(xué)意義,不能理解為兩者差差大,也不能理解為所分析的指標在實際應(yīng)用上就有“顯著效果”。 (4)檢驗假設(shè)的推斷結(jié)論為概率結(jié)論,不能絕對化:檢驗水準人為規(guī)定,是相對的,報告結(jié)論時應(yīng)列出檢驗統(tǒng)計量和P值的確切范圍。 (5)注意是單側(cè)檢驗還是雙側(cè)檢驗

I型錯誤和II型錯誤

: I型錯誤(type I error)拒絕了實際上成立的 ,即樣本原本來自 的總體,由于抽樣的偶然性得到了較大的t值,所以拒絕了 ,接受了 ,這類棄真錯誤稱為第一類錯誤,犯第一類錯誤的概率是 。 II型錯誤(type II error)是不拒絕實際上不成立的 ,即“存?zhèn)巍奔礃颖驹緛碜? 的總體,但是由于抽樣的偶然性,得到了較小的t值,得到了較大的P值,沒有拒絕 ,這類存?zhèn)五e誤稱為第二類錯誤,犯第二類錯誤的概率是1-

正態(tài)性檢驗

:用均數(shù)和標準差描述資料的分布特征,對例數(shù)n較小的樣本進行t檢驗時,首先要求樣本取自正態(tài)分布的總體。

兩個方差的齊性檢驗

:兩樣本均數(shù)比較的t檢驗和多個樣本均數(shù)比較的方差分析要求各樣本所來自的總體方差相等。兩樣本方差的齊性檢驗: (4.12)

式中 為較大的樣本方差, 為較小的樣本方差, 為分子的自由度, 為分母的自由度,相應(yīng)的樣本例數(shù)分別為 和 。當兩總體方差齊同時,F(xiàn)值一般不會離1太遠;若算得的F值較大,大于我們規(guī)定的界值時,就認為兩樣本所在總體的方差不齊。

t檢驗

t檢驗:常用于總體標準差未知且樣本含量較小時樣本均數(shù)與總體均數(shù)的比較,成組設(shè)計的 兩個小樣本的均數(shù)的比較及配對設(shè)計的兩樣本均數(shù)的比較。 t檢驗的應(yīng)用條件:a,n≤50 b,樣本來自正態(tài)分布的總體 c,兩樣本均數(shù)比較時要求兩樣本總體方差相等。

1,單樣本t檢驗(one sample t-test):

樣本均數(shù)與已知總體均數(shù)比較,目的是推斷樣本所代表的未知總體均數(shù) 與已知總體均數(shù) 有無差別。 ( ) (4.1) 式中 為樣本均數(shù), 為已知總體均數(shù),s為樣本標準差,n為樣本含量, 為自由度。 步驟如下(可為u檢驗) 1)建立假設(shè),確定檢驗水準。 H0:μ=μ0 H1:μ≠μ0 α=0.05 2)計算統(tǒng)計量。 已知,(總體均數(shù))μ0=,n=, =,s= 3)確定P值,做出推斷結(jié)論。 按v=n-1,查t界值表,得P>0.05(或P<0.05),按α檢驗水準,不拒絕H0(或拒絕H0,接受H1),即根據(jù)本資料尚不能(可以)認為?與?有差異。

2,配對設(shè)計資料的t檢驗

分為3種情況:①將受試對象按一定條件配成對子(同種屬、同體重、同年齡、同性別等),再隨機分配每對中的2個受試對象到不同的處理組;②同一受試對象分別接受2種不同處理,其目的是推斷2種處理的效果有無差別;③同一受試對象處理前后的比較,其目的是推斷某種處理有無作用。 配對設(shè)計資料的t檢驗(paired t-test for dependent samples)的基本思路:首先計算出各對差值d的均數(shù) ,當2種處理結(jié)果無差別或某種處理不起作用時,理論上差值的總體均數(shù) 應(yīng)該為0,故可將配對設(shè)計資料的t檢驗視為樣本均數(shù) 與總體均數(shù) 的比較。 (4.2)

式中 為樣本中各對差值d的均數(shù), 為樣本差值的標準差,n為對子數(shù), 為自由度。 先列表求差值d和 1)建立假設(shè),確定檢驗水準。 H0:μd =0 H1:μd≠0 α=0.05 2)計算統(tǒng)計量。 已知,n=,∑d=,∑ = 3)確定P值,做出推斷結(jié)論。 按v=n-1,查t界值表,得P>0.05(或P<0.05),按α檢驗水準,不拒絕H0(或拒絕H0,接受H1),即根據(jù)本資料尚不能(可以)認為?。

3,成組設(shè)計資料兩樣本均數(shù)比較的t檢驗(two-sample t-test for independent samples)

:在臨床醫(yī)學(xué)研究中,進行配對設(shè)計比較困難,一般分別從2個總體中隨機抽樣,進行成組設(shè)計兩樣本均數(shù)的比較,目的是推斷2個總體均數(shù)是否相等。所比較的兩個樣本含量最好相等,此時抽樣誤差最小。 (4.3)

可為t,u檢驗 1)建立假設(shè),確定檢驗水準。 :μ1=μ2 :μ1≠μ2 α=0.05 2)計算統(tǒng)計量。 已知,n1=,∑X1=,∑ =,n2=,∑X2=,∑ = 1=∑X1/n1=, 2=∑X2/n2= (已知,n1=, 1=,s1=,n2=, 2=,s2= 3)確定P值,做出推斷結(jié)論。 按v=n1+n2-2,查t界值表,得P>0.05(或P<0.05),按α檢驗水準,不拒絕H0(或拒絕H0,接受H1),可以認為?的差別無(或有)統(tǒng)計學(xué)意義。

檢驗

u檢驗(u-test,或Z-test):用檢驗統(tǒng)計量u來命名的。用于樣本含量n足夠大(n>50),或n雖小但總體標準差 已知時的樣本均數(shù)與總體均數(shù)的比較、成組設(shè)計兩樣本均數(shù)的比較。 1,單樣本u檢驗(one sample u-test): (4.4) 式中 為樣本均數(shù), 為已知總體均數(shù),s為樣本標準差,n為樣本含量。 2,成組設(shè)計的兩樣本均數(shù)比較的u檢驗(two-sample u-test for independent samples): (4.5)

式中 , 分別為兩樣本均數(shù), 為兩樣本均數(shù)差值的標準誤, 、 為分別為兩樣本的方差, 、 分別為兩樣本例數(shù)。

標準正態(tài)分布(u分布)與t分布有何異同?

答:相同點:t分布和標準正態(tài)分布(u分布)都是以0為中心的正態(tài)分布。標準正態(tài)分布是t分布的特例(自由度是無限大時)。不同點:t分布為抽樣分布,u分布為理論分布;t分布比標準正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布;t分布有無數(shù)條曲線,而u分布只有唯一一條曲線。

方差分析

1,方差分析的基本思想:按研究目的和設(shè)計類型,將總變異中的離均差平方和SS和自由度 分別分解成相應(yīng)的若干部分,然后求得各相應(yīng)部分的變異;由于其中的組內(nèi)(或誤差)變異主要反映個體差異或抽樣誤差,其他各部分的變異與之比較得出統(tǒng)計量F值,根據(jù)F值的大小確定P值,并做出推斷。 2,方差分析的優(yōu)點: (1)不受比較組數(shù)的限制,可比較多組均數(shù) (2)可同時分析多個因素的作用 (3)可分析同類間的交互作用 3,方差分析的應(yīng)用范圍: (1)2個或多個樣本均數(shù)間的比較 (2)分析2個或多個因素間的交互作用 (3)回歸方程的線性假設(shè)檢驗 (4)多元線性回歸分析中偏回歸系數(shù)的假設(shè)檢驗 (5)兩樣本方差齊性檢驗

完全隨機設(shè)計的方差分析:

是將總變異中的離均差平方和SS和自由度 分別分解成組間和組內(nèi)兩部分,SS / 和SS /SS 分別為組間變異(MS )和組內(nèi)變異(MS ),兩者之比即為統(tǒng)計量F。 (1)總離均差平方和及自由度: SS

=

(5.2)

=

(5.3)

(2)組間離均差平方和、自由度和均方: SS

=

(5.4)

=

(組數(shù)-1) (5.5)

MS

=

(5.6)

(3)組內(nèi)離均差平方和、自由度和均方: SS

=SS

-SS

(5.7)

=N-k (樣本量-組數(shù)) (5.8)

MS

=

(5.9)

當方差分析的推斷結(jié)果為拒絕H0,接受H1,各總體均數(shù)不同或不全相同時,應(yīng)對均數(shù)進一步兩兩比較,即多重比較(multiple comparisons)。

可用q 檢驗進行分析: (5.14) 式中 為方差分析的組內(nèi)均方,若為兩因素或兩因素以上的方差分析,則為誤差項均方 ; 和 分別為兩樣本的樣本含量。

配伍組設(shè)計資料的方差分析

配伍組設(shè)計亦稱隨機區(qū)組設(shè)計(randomized block design),其多個樣本均數(shù)比較可用無重復(fù)數(shù)據(jù)的兩因素方差分析(two-way ANOVA)。2個因素是指主要的研究因素和配伍組因素。兩因素的方差分析是把總變異中的離均差平方和與自由度分別分解成處理組間、配伍組間和誤差三部分。計算公式如下: 變異來源 離均差平方和 自由度 均方MS F 總 -C 處理組間 k-1 配伍組間 b-1 誤差 SS -SS -SS (k-1)(b-1) , 為配伍組數(shù)

二,分類變量

統(tǒng)計描述

常用相對數(shù),即率,構(gòu)成比,和相對比對分類資料進行統(tǒng)計描述 1,率(rate):率又稱頻率指標,它說明某現(xiàn)象發(fā)生的頻率或強度 率= 2,構(gòu)成比(proportion):又稱構(gòu)成指標,它說明一事物內(nèi)部各組成部分所占的比重或分布,常以百分數(shù)表示 構(gòu)成比= 3,相對比(relative ratio)亦稱比,是A,B 2個有關(guān)指標之比,說明A和B 的若干倍或百分之幾,是相對數(shù)的最簡單形式。A,B性質(zhì)可相同可不同。 相對比=

4,

應(yīng)用相對數(shù)時應(yīng)注意的事項: (一) 計算相對數(shù)的分母不宜過小。 (二) 分析時不能以構(gòu)成比代替率。 (三) 對觀察單位數(shù)不等的幾個率,不能直接用相加求其平均率。 (四) 資料的對比應(yīng)注意可比性。 (五) 對樣本率(或構(gòu)成比)的比較應(yīng)遵循隨機抽樣,要做假設(shè)檢驗。 (六) 區(qū)別清分子分母。 5,率的u檢驗 1),樣本率與總體率比較:目的是推斷樣本率所代表的總體率 與某已知總體率 是否相等。根據(jù)資料的不同情況,可以采用不同的假設(shè)檢驗方法:①若 很小,可用Poisson分布原理做檢驗;②若 不太靠近0或1時,可用二項分布原理做檢驗;當樣本含量n足夠大時,或 且 ,二項分布逼近正態(tài)分布,可用u檢驗計算其樣本檢驗統(tǒng)計量。 (6.1) 式中p為樣本率, 為已知總體率(常為理論值或標準值),n為樣本含量。 2),兩樣本率比較:兩個樣本率作比較的目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本滿足正態(tài)近似條件且樣本含量較大時,可用u檢驗,其公式: (6.2)

式中 、 分別為兩個樣本率, 、 分別為兩樣本含量, 為兩個樣本率之差的標準誤, 為合并陽性率, , 、 為兩個樣本陽性例數(shù)。

四格表資料的

檢驗

適用于分類變量資料中推斷兩個或多個總體率(或構(gòu)成比)之間有無差別,兩個分類指標之間有無相關(guān)關(guān)系的檢驗以及檢驗頻數(shù)分布的擬合優(yōu)度。 (6.3)

式中A代表實際頻數(shù),T代表理論頻數(shù)。格子理論頻數(shù) 可用同樣方法求得,其計算公式為: (6.4) (6.5) 四格表資料的專用公式: (6.6) 式中a、b、c、d分別為四格表的實際頻數(shù)=a+b+c+d。

四格表的

值的校正。

①當所有T>5,n>40時用上述公式; ②當有140時,需進行連續(xù)性校正: (6.7) (6.7) ③ 或n<40時,需用四格表資料的確切概率法。

行×列表資料的

檢驗

。 (6.9) 式中n是總例數(shù),A是每個格子的實際頻數(shù), , 分別為某格子對應(yīng)的行合計和列合

行×列表

檢驗注意事項

(1)X2檢驗要求理論頻數(shù)不宜太小,否則將導(dǎo)致偏性。一般認為行X列表資料中不宜有1/5以上的格子理論數(shù)小于5,或有一個格子理論數(shù)小于1。處理方法:最好的方法是增加樣本例數(shù),以增大理論頻數(shù);且精確概率法;進行合理的合并;刪除理論頻數(shù)太小的行和列,后兩種方法將損失一定的信息并影響樣本的隨機性。 (2)單向有序列行X列表的統(tǒng)計處理:當效應(yīng)按強弱分為若干個級別,試驗結(jié)果整理為單向有序行列表,在比較各處理組的效應(yīng)有無差別時,宜用秩和檢驗或Ridit分析。 (3)當多個樣本率比較的 檢驗。結(jié)論為拒絕H0,只能認為各總體率或總體構(gòu)成比之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進一步解決此問題,可用卡方分割法。

配對四格表資料的卡方檢驗

: (一)關(guān)聯(lián)性分析: (1)建立假設(shè)檢驗,確定檢驗水準。 H0:兩種方法的檢驗結(jié)果無關(guān)系 H1:兩種方法的檢驗結(jié)果有關(guān)系 α=0.05 (2)計算統(tǒng)計量X2值。 ①n>=40,T>=5, ②n>=40,13.84,P<0.05,按α=0.05檢驗水準,拒絕H0,接受H1,可以認為兩種方法的檢驗結(jié)果有關(guān)系。 (二)差別性檢驗: (1)建立假設(shè)檢驗,確定檢驗水準。 H0:兩總體的B=C H1:兩總體的B不等于C α=0.05 (2)計算統(tǒng)計量X2值。 ①b+c>40時: ②b+c<40時, (3)確定P值,做出推斷結(jié)論。 X2>3.84,P<0.05,按α=0.05檢驗水準,拒絕H0,接受H1,可以認為兩種方法的檢驗結(jié)果有差別。 (X20.05(1)=3.84, X20.005(1)=7.88)

非參數(shù)檢驗

參數(shù)檢驗和非參數(shù)檢驗的優(yōu)缺點: 參數(shù)檢驗的優(yōu)點是對資料的分析利用充分,統(tǒng)計分析的效率高;缺點是對資料的要求高,適用范圍有限。非參數(shù)檢驗的優(yōu)點:(1)適用范圍廣,對變量的類型和分布無特殊要求,不受總體分布的限制;(2)對數(shù)據(jù)的要求不嚴,對某些指標不便準確測定的資料也可應(yīng)用;(3)方法簡便,易于理解和掌握。缺點是如果對符合參數(shù)檢驗的資料用了非參數(shù)檢驗,因不能充分利用資料提供的信息,會使檢驗效能低于非參數(shù)檢驗;若要使檢驗效能相同,往往需要更大的樣本含量。

配對設(shè)計的符號秩和檢驗

Wilcoxon符號秩和檢驗(Wilcoxon signed rank test)是推斷其差值是否來自中位數(shù)為零的總體的方法,可用于配對設(shè)計差值的比較和單一樣本與總體中位數(shù)的比較。 (一)基本思想 其假設(shè) 是差值的總體中位數(shù)等于0,備擇假設(shè) 是差別的總體中位數(shù)不等于0,如果差別太大,就拒絕 ;反之,不拒絕 。 (二)方法步驟:1,建立檢驗假設(shè),確定檢驗水準;2,計算檢驗統(tǒng)計量T值:a,求各對的差值;b,編秩;c,求秩和,確定統(tǒng)計量T;3,確定P值,做出推斷結(jié)論。

完全隨機設(shè)計兩樣本比較的秩和檢驗

亦稱兩個樣本比較的秩和檢驗,利用兩樣本觀察值的秩和來推斷樣本分別代表的總體分布是否相同。

成組設(shè)計多樣本比較的秩和檢驗

, 利用多個樣本的秩和來推斷各樣本分別代表的總體的分布有無差別。

配伍組設(shè)計的秩和檢驗M檢驗

秩和檢驗步驟:

(1) 建立檢驗假設(shè),確定檢驗水準。 H0:?和?的?總體分布相同。 H1:?和?的?總體分布不同。 (2) 計算統(tǒng)計量T值。 1)編秩 將2組數(shù)據(jù)由小到大統(tǒng)一編秩,相同數(shù)據(jù)取平均秩次。 2)求秩和,確定統(tǒng)計量T 2組秩次分別相加,若兩組例數(shù)相等,則任取一組的秩和為統(tǒng)計量;若兩組例數(shù)不等,則以樣本例數(shù)較小者對應(yīng)的秩和為統(tǒng)計量。 3)確定P值,做出推斷結(jié)論。 查T界值表(成組設(shè)計用),若T值在界值范圍內(nèi),P>0.05,按α=0.05檢驗水準,不拒絕H0,可以認為兩者的總體分布相同;若T值<=界值或在界值范圍外,P<=0.05,按α=0.05檢驗水準,,拒絕H0,接受H1,可以認為兩的分布位置不同。 如n1或n2-n1超出了成組設(shè)計T界值的范圍,可用正態(tài)近似檢驗: 如相同秩次較多(>25%),應(yīng)校正: uc=?>1.96,P<0.05。按α=0.05檢驗水準,,拒絕H0,接受H1,可以認為兩的分布位置不同。

非參數(shù)統(tǒng)計檢驗的適用條件:

(1)資料不符合參數(shù)統(tǒng)計法的應(yīng)用條件(總體為正態(tài)分布、且方差相等)或總體分布類型未知;(2)等級資料;(3)分布呈明顯偏態(tài)又無適當?shù)淖兞哭D(zhuǎn)換方法使之滿足參數(shù)統(tǒng)計條件;(4)在資料滿足參數(shù)檢驗的要求時,應(yīng)首選參數(shù)法,以免降低檢驗效能。

直線回歸方程的應(yīng)用

: (1)定量描述兩變量之間的依存關(guān)系;(2)利用回歸議程進行預(yù)測;(3)利用回歸議程進行統(tǒng)計控制。

應(yīng)用直線回歸的注意事項:

(1)作回歸分析要有實際意義; (2)直線回歸分析的資料,一般要求因變量Y是來自正態(tài)分布總體的隨機變量,自變量X可以是正態(tài)隨機變量,也可以是精確測量和嚴格控制的值. (3)進行回歸分析時,應(yīng)先繪制散點圖,如提示有直線趨勢,可作線性回歸分析,否則應(yīng)考慮作數(shù)據(jù)轉(zhuǎn)換或進行非線性回歸; (4)對離群值應(yīng)檢查核對,予以修正或剔除; (5)回歸直線不要外延。

簡述直線相關(guān)與回歸的區(qū)別與應(yīng)用。

答:區(qū)別:(1)資料要求不同,相關(guān)要求兩個變量是雙變量正態(tài)分布;回歸要求應(yīng)變量Y服從正態(tài)分布,而自變量X是能精確測量和嚴格控制的變量。(2)統(tǒng)計意義不同,相關(guān)反映兩變量間的伴隨關(guān)系這種關(guān)系是相互的,對等的;不一定有因果關(guān)系;回歸則反映兩變量間的依存關(guān)系,有自變量與應(yīng)變量之分,一般將“因”或較易測定、變異較小者定為自變量。這種依存關(guān)系可能是因果關(guān)系或從屬關(guān)系。(3)分析目的不同,相關(guān)分析的目的是把兩變量間直線關(guān)系的密切程度及方向用一統(tǒng)計指標表示出來;回歸分析的目的則是把自變量與應(yīng)變量間的關(guān)系用函數(shù)公式定量表達出來。 聯(lián)系:(1)變量間關(guān)系的方向一致,對同一資料,其r與b的正負號一致。(2)假設(shè)檢驗等價,對同一樣本,tr=tb,由于tb計算較復(fù)雜,實際中常以r的假設(shè)檢驗代替對b的檢驗。(3)相關(guān)和回歸可以相互解釋,相關(guān)系數(shù)的平方r2(又稱決定系數(shù))是回歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。(4)對于II型回歸,r與b值可相互換算, 。

簡述相關(guān)系數(shù)和回歸系數(shù)的聯(lián)系與區(qū)別。

答:區(qū)別:(1)兩種系數(shù)的意義不同:回歸系數(shù)是表明兩個變量之間數(shù)量上的依存關(guān)系,回歸系數(shù)越大回歸直線越陡峭,表示應(yīng)變量隨自變量變化越快;相關(guān)系數(shù)是表明兩個變量之間相關(guān)的方向和緊密程度的,相關(guān)系數(shù)越大,兩個變量的關(guān)聯(lián)程度越大。(2)r與b有區(qū)別,回歸系數(shù)b表示X每增(減)一個單位,Y平均改變b個單位;相關(guān)系數(shù)r說明具有直線關(guān)系,收集整理的兩個變量間相關(guān)關(guān)系的密切程度與相關(guān)方向。(3)計算公式不一樣 。(4)取值范圍不一樣:-∞<b<+∞,-1≤r≤1。(5)單位不同:b有單位,r沒有單位。 聯(lián)系:(1) r與b值可相互換算, ;(2) r與b正負號一致;(3)r與b的假設(shè)檢驗等價;(4)回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r2(又稱決定系數(shù))是回歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。

判別分析

:是根據(jù)一批已知類別的樣品多指標觀察數(shù)據(jù),制定出一個分類標準,以指導(dǎo)對未知類別煌新個體歸類的多元統(tǒng)計分析方法。

協(xié)方差分析

:是把直線回歸分析與方差分析結(jié)合焉的一種統(tǒng)計分析方法,用來消除混雜因素對處理效應(yīng)的影響,提高分析結(jié)果的真實性,屬多元統(tǒng)計方法范疇。 思想:將因變量Y的殘差分為兩部分,即為修正均數(shù)間的變異和組內(nèi)殘差。應(yīng)用條件:A.各樣本來自正態(tài)分布總體,且總體方差相等;B.各處理組的總體直線回歸系數(shù)相等,且都不為0。

Fisher準則

:從方差分析的觀點,要求投影點的類間方差與類內(nèi)方差之比最大。

醫(yī)學(xué)統(tǒng)計學(xué)總結(jié)的評論 (共 條)

分享到微博請遵守國家法律
西乌珠穆沁旗| 西青区| 特克斯县| 灵山县| 封开县| 卢湾区| 聂荣县| 桑日县| 太仆寺旗| 南安市| 贵港市| 鄢陵县| 昭觉县| 新和县| 沁水县| 龙井市| 泰宁县| 馆陶县| 海口市| 仁寿县| 合江县| 交城县| 安远县| 剑阁县| 蓝田县| 会东县| 榕江县| 荔浦县| 贵定县| 稷山县| 翁牛特旗| 科尔| 虹口区| 德化县| 永宁县| 华阴市| 隆化县| 彰化县| 灵寿县| 同心县| 阿克陶县|