【高清】北京大學(xué) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)與 SPSS 軟件(基礎(chǔ)篇)內(nèi)含CC字幕 目前最好的

一、基本概念

統(tǒng)計(jì)分析:用已知的樣本推斷未知的總體。(前提:隨機(jī)抽樣)
- 總體 (population)
總體是根據(jù)研究目的確定的同質(zhì)觀察單位的全體。
例:
調(diào)查某地1992年健康成年男性的身高。(有限總體);
某種藥物治療高血壓患者的療效。(無(wú)限總體)
- 樣本(sample)
樣本是從總體中隨機(jī)抽取部分觀察單位,其實(shí)測(cè)值的集合。樣本量比較大時(shí),可用頻率近似為概率。
隨機(jī)抽樣……減少偏性,使樣本對(duì)總體有代表性
- 概率(probability)
概率是描述隨機(jī)事件發(fā)生的可能性大小,用P表示。
小概率事件:
當(dāng)一個(gè)事件的概率P≤0.05或P≤0.01時(shí),稱為小概率事件。特點(diǎn):某事件發(fā)生的可能性很小,在一次試驗(yàn)中基本上是不會(huì)發(fā)生的。
- 資料:數(shù)值變量、分類(lèi)變量
(1)數(shù)值變量 (Numerical Variable )
又稱為定量資料或計(jì)量資料,其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。血壓,身高,體重,血脂等。
(2)分類(lèi)變量 (Categorical Variable)
又稱為定性資料,其變量值是定性的,表現(xiàn)為
互不相容的類(lèi)別或?qū)傩浴?span id="s0sssss00s" class="ql-color-#60d837">性別



重點(diǎn)?。。?!

- 誤差

- 統(tǒng)計(jì)工作

二、統(tǒng)計(jì)描述
數(shù)值變量分布類(lèi)型(對(duì)稱分布、偏態(tài)分布)
- 對(duì)稱分布

正態(tài)分布:




任何正態(tài)分布經(jīng)過(guò)標(biāo)準(zhǔn)化變換,都能轉(zhuǎn)化成唯一的一條標(biāo)準(zhǔn)正態(tài)分布。
- 偏態(tài)分布

數(shù)值變量統(tǒng)計(jì)描述
- 集中趨勢(shì)的描述

2. 中位數(shù)(median, M)
將一組觀察值從小到大排列,位置居中的觀察值。
對(duì)于偏態(tài)分布資料,中位數(shù)只和位置居中的觀察值有關(guān),適合描述偏態(tài)分布的集中趨勢(shì)。
- 離散趨勢(shì)的描述


n-1是少了一個(gè)自由度

在醫(yī)學(xué)科研論文里邊,標(biāo)準(zhǔn)差要比方養(yǎng)更常用,因?yàn)榭膳c均值比較,使用方便。

因?yàn)椴皇軆啥藰O端數(shù)據(jù)的影響,所以四分位數(shù)間距是比較穩(wěn)定的,主要適用于偏態(tài)分布資料。

補(bǔ)充:


分類(lèi)變量統(tǒng)計(jì)描述
- 相對(duì)數(shù):
比 ratio:相對(duì)比,性別比、BMI、OR、RR
比例 proportion:事物內(nèi)部各部分所占的比重(構(gòu)成比),各部分相加等于1,患病率、病死率、有效率、治愈率
率 rate :單位時(shí)間內(nèi)某事件發(fā)生的頻率,分子為觀察期間內(nèi)某事件的發(fā)生例數(shù),分母為觀察人一時(shí)(Person-Time)總數(shù),即(每個(gè)觀察單位×觀察時(shí)間)的總和。發(fā)病率
- 患病率 VS 發(fā)病率
患病率 (Prevalence):比例,不是率
表示在某時(shí)點(diǎn)上接受檢查的人群中現(xiàn)患病例所占的比例。
發(fā)病密度 (Incidence Density, ID):
觀察期間內(nèi)某疾病新發(fā)病例數(shù)/該觀察期問(wèn)內(nèi)人—時(shí)總數(shù)。實(shí)際應(yīng)用中也可稱為發(fā)病率 (Incidence Rate)。
三、兩組數(shù)值變量比較的假設(shè)檢驗(yàn)
- 均數(shù)的抽樣誤差
1. 定義
在抽樣研究中,由于抽樣造成的樣本均數(shù)與總體均數(shù)之問(wèn)的差異或者樣本均數(shù)之問(wèn)的差異,稱為均數(shù)的抽樣誤差(Samp ling Error, SE) 。

標(biāo)準(zhǔn)誤,也可稱為樣本均數(shù)的標(biāo)準(zhǔn)差,主要與樣本含量有關(guān),增大樣本含量可減少抽樣誤差。
- t分布


2.性質(zhì)

- 總體均數(shù)95%置信區(qū)間的估計(jì)
1. 定義
根據(jù)樣本均數(shù)計(jì)算出有(1-a)的把握包含總體均數(shù)的一個(gè)數(shù)值范圍,這個(gè)數(shù)值范圍稱為總體均數(shù)的置信區(qū)間,該(1-a)稱為置信度。一般a取0.05,則置信度為95%,即估計(jì)總體均數(shù)95%置信區(qū)間。
2.計(jì)算

t界值是自由度為u的雙側(cè)t界值
注:置信區(qū)間的估計(jì)是有概率性的。(如果要求95%的置信區(qū)間,得到的區(qū)間它計(jì)算正確的概率只有95%)
- 假設(shè)檢驗(yàn)的基本原理