白話統(tǒng)計

2023-07-03 22:51 作者:取個名字吧一個就好 0人讀過 | 我要投稿

鏈接：https://pan.baidu.com/s/1jeJpSolW2zzmoFEQs69vrg?pwd=lc2d?

提取碼：lc2d

在《白話統(tǒng)計》中你可以解決很多簡單的網(wǎng)絡搜索所不能解決的問題。在當前網(wǎng)絡發(fā)達的時代，幾乎任何概念和知識點都可以從網(wǎng)絡上查到。但是有一點你很難查到，那就是統(tǒng)計分析的思路和觀點。比如，你可以很容易地在網(wǎng)上查到什么是線性回歸，但你卻查不到怎么“做”線性回歸分析，在你遇到實際數(shù)據(jù)時仍然不知道如何分析。在《白話統(tǒng)計》中你可以獲得這些思路和觀點。盡管這些觀點未必是所有人都認可的，但根據(jù)筆者多年的分析經(jīng)驗，它們在實踐中通常是奏效的。《白話統(tǒng)計》凝結了作者十多年來對統(tǒng)計分析的理解，對各種方法的介紹采用全新的理念和思路，不再是介紹方法本身，而是試圖將各種方法之間的聯(lián)系闡述清楚；不再是介紹方法如何計算出結果，而是盡量說明方法背后的思想。當然，本書同時提供了如何實現(xiàn)結果的軟件（涉及Excel、SAS、R、JMP、SPSS 等）操作。

作者簡介

馮國雙，北京大學醫(yī)學部博士，具有十多年的數(shù)據(jù)統(tǒng)計分析經(jīng)驗，知名統(tǒng)計學平臺“小白學統(tǒng)計”的創(chuàng)始者與維護者。已主編多部統(tǒng)計學專著，出版《小白學SAS》，同時兼任多個與統(tǒng)計有關的學術委員會委員。興趣愛好：在熱愛統(tǒng)計分析之余，還對古玩奇石、盆景制作和詩詞鑒賞略有心得。

精彩書評

統(tǒng)計并不難，難的是怎樣學起來不頭疼。我一直都想寫一本平易近人的統(tǒng)計入門書，奈何俗務纏身，未能如愿。《白話統(tǒng)計》在這方面做了很有意義的嘗試，有觀點的書，值得有觀點的您來讀！
——張文彤博士

統(tǒng)計是動態(tài)的歷史，歷史是靜態(tài)的統(tǒng)計。只有了解統(tǒng)計學，你我或許才能真正窺見“云計算”和“大數(shù)據(jù)”時代的精彩……
——陳曉峰中國移動在線服務公司

我在審稿中經(jīng)常為一些統(tǒng)計學問題而煩惱。在試讀了本書后，我發(fā)現(xiàn)，絕大多數(shù)發(fā)表文章中遇到的關于統(tǒng)計學的困惑都可以從本書中找到答案。
——呂相征中華預防醫(yī)學雜志編輯部主任

推薦序

宋代禪宗大師青原行思曾提出參禪的三重境界：參禪之初，看山是山，看水是水；禪有悟時，看山不是山，看水不是水；禪中徹悟，看山仍是山，看水仍是水。統(tǒng)計學的學習過程何嘗不是這樣：初學統(tǒng)計時，看到一種方法，覺得就是這種方法，如學到t檢驗，覺得t 檢驗就是用于兩組均值比較的方法；經(jīng)過一段時間的學習，突然發(fā)現(xiàn)原來看過的方法并不是所想的那樣，如在線性回歸中也看到了t 檢驗的身影，這時覺得t 檢驗不再是自己想象中的t 檢驗了；再經(jīng)過一段時間的學習，就會明白方法還是原來的方法，所謂的疑惑只是自己心動而已，這時就真正理解了t 檢驗的含義，而不再把它當作一種固定于特定場合的檢驗方法。
對于統(tǒng)計學初學者而言，通過課堂老師的講授，不難達到第一種境界；然后通過接觸各種資料，慢慢就會發(fā)現(xiàn)各種方法跟課堂上所講可能有所不同，剪不斷，理還亂，逐漸進入第二種境界；此時，如果不能厘清思路，則很容易陷入迷惑和混亂，想達到第三種境界就難上加難了。當然，你可以充分利用網(wǎng)絡資源查找各種信息，從而為自己解惑。然而這種資源雖然多，但較為零散，而且可能會看到眾說紛紜的情況，使得你更加凌亂。幸運的是，馮國雙博士的這本《白話統(tǒng)計》以通俗、幽默的語言深入淺出地介紹了統(tǒng)計學中的各種概念和思想，為很多人消除了留在心中多年的存疑，可以在這一階段幫助讀者答疑解惑。其中有些內容曾經(jīng)發(fā)布在微信公眾號“小白學統(tǒng)計”中，也因此受到了很多網(wǎng)友的好評。
目前，歐美有不少類似白話介紹統(tǒng)計方法之類的書籍，這類書的特點是：不像教材那樣用沉重、拘謹?shù)恼Z言來介紹統(tǒng)計學方法，而是以風趣、淺顯的話語來解釋說明；內容不一定多，但盡量深入。相比之下，國內的這類書籍并不多見，在生物統(tǒng)計學領域尤其缺乏。這就導致很多非統(tǒng)計學專業(yè)人士覺得統(tǒng)計學“面目可憎”，始終無法真正喜歡上統(tǒng)計學?？上驳氖牵壳爸饾u成長起來的年輕的統(tǒng)計學家已經(jīng)意識到這一問題，馮博士的這本《白話統(tǒng)計》正是讓統(tǒng)計學盡量接地氣的一種有益嘗試。
《白話統(tǒng)計》凝結了作者十多年來對統(tǒng)計學的理解，采用別具一格的編寫理念和思路，對各種方法的介紹不再是介紹方法本身，而是試圖將各種方法之間的聯(lián)系闡述清楚；不再是介紹方法如何計算出結果，而是盡量說明方法背后的思想。本書對基本概念和方法的介紹沒有采用教材中非常嚴謹?shù)恼Z言，而是盡可能用白話來解釋說明。例如，在介紹累積分布和概率密度時，用到了《神雕俠侶》中的情節(jié)；在介紹假設檢驗思想時，用到了“女士品茶”的故事；在介紹中心極限定理時，采用了里約奧運會期間的一則虛擬故事。這不僅使得抽象理論形象化、復雜問題簡單化，也增加了本書的趣味性和可讀性，體現(xiàn)了作者深厚的理論功底和豐富的實踐經(jīng)驗。
在此，我把《白話統(tǒng)計》這本著作推薦給各位讀者，無論是初學者、統(tǒng)計學專業(yè)人士，還是統(tǒng)計學應用工作者，相信都能從中獲益。

陳峰
南京醫(yī)科大學教授

第 1 篇基礎篇
第1 章為什么要學統(tǒng)計 2
1．1 統(tǒng)計學有什么用 3
1．2 生活世事皆統(tǒng)計 4
1．3 如何學統(tǒng)計 4

第 2 章變異――統(tǒng)計學存在的基礎 6
2．1 隨機與變異 6
2．2 特朗普與羅斯福的勝出――抽樣調查到底可不可靠 8
2．3 什么是抽樣誤差 9

第 3 章郭靖的內力能支撐多久――談概率分布 11
3．1 累積分布與概率密度的通俗理解 12
3．2 是生存還是死亡？這是一個問題――用Weibull 分布尋找生存規(guī)律 16
3．3 2003 年的那場SARS――用Logistic 分布探索疾病流行規(guī)律 20
3．4 “普通”的正態(tài)分布 23
3．5 幾個常用分布――t 分布、χ2 分布、F 分布 28

第 4 章關于統(tǒng)計資料類型的思考 35
4．1 計數(shù)資料等于分類資料嗎 36
4．2 計數(shù)資料可否采用連續(xù)資料的方法進行分析 37
4．3 分類資料中的無序和有序是如何確定的 38
4．4 連續(xù)資料什么時候需要轉換為分類資料 39
4．5 連續(xù)資料如何分組――尋找cut-off 值的多種方法 41
4．6 什么是虛擬變量/啞變量 47

第 5 章如何正確展示你的數(shù)據(jù) 52
5．1 均數(shù)和中位數(shù)――你被平均了嗎 53
5．2 方差與標準差――變異的度量 54
5．3 自由度――你有多少自由活動的范圍 56
5．4 百分位數(shù)――利用百分數(shù)度量相對位置 57
5．5 如何比較蘋果和橘子――利用Z 值度量相對位置 59
5．6 某百歲老人調查報告說：少運動才能活得久――談一下比例和率 61
5．7 在文章中如何正確展示百分比 63

第 6 章尋找失蹤的運動員――中心極限定理 64
6．1 中心極限定理針對的是樣本統(tǒng)計量而非原始數(shù)據(jù) 65
6．2 樣本量大于30 就可以認為是正態(tài)分布了嗎 67

第 7 章從“女士品茶”中領會假設檢驗的思想 70
7．1 女士品茶的故事 70
7．2 零假設和備擇假設． 72
7．3 假設檢驗中的兩類錯誤 73
7．4 P 值的含義 76
7．5 為什么P 值小于0．05（而不是0．02）才算有統(tǒng)計學意義 78
7．6 為什么零假設要設定兩組相等而不是兩組不等 79

第 8 章參數(shù)估計――一葉落而知秋 81
8．1 點估計 81
8．2 最小二乘估計 82
8．3 最大似然估計 84
8．4 貝葉斯估計 86

第 9 章置信區(qū)間估計――給估計留點余地 88
9．1 置信區(qū)間的理論與實際含義 88
9．2 置信區(qū)間與P 值的關系 90
9．3 利用標準誤計算置信區(qū)間 91
9．4 利用Bootstrap 法估計置信區(qū)間 92

第 2 篇實用篇
第10 章常用統(tǒng)計方法大串講 98
10．1 一般線性模型――方差分析與線性回歸的統(tǒng)一 99
10．2 廣義線性模型――線性回歸與Logistic 回歸的統(tǒng)一 103
10．3 廣義可加模型――脫離“線性”束縛 107
10．4 多水平模型――打破“獨立”條件 112
10．5 結構方程模型――從單因單果到多因多果 119

第 11 章正態(tài)性與方差齊性 127
11．1 用統(tǒng)計檢驗方法判斷正態(tài)性 127
11．2 用描述的方法判斷正態(tài)性 130
11．3 方差分析中的方差齊性判斷 133
11．4 理解線性回歸中的方差齊性 135

第 12 章 t 檢驗――不僅是兩組比較 138
12．1 從另一個角度來理解t 檢驗 138
12．2 如何正確應用t 檢驗 140
12．3 t 檢驗用于回歸系數(shù)的檢驗 141
12．4 t 檢驗的替代――Wilcoxon 秩和檢驗 142

第 13 章方差分析與變異分解 145
13．1 方差分析中變異分解的思想 145
13．2 為什么回歸分析中也有方差分析 147
13．3 鐵打的方差分析，流水的實驗設計 148
13．4 方差分析后為什么要進行兩兩比較 152
13．5 多重比較方法的選擇建議 154
13．6 所有的多組都需要做兩兩比較嗎――兼談固定效應和隨機效應 164
13．7 重復測量方差分析詳解 166
13．8 方差分析的替代――Kruskal-Wallis 秩和檢驗 176
13．9 多組秩和檢驗后的兩兩比較方法 178

第 14 章卡方檢驗――有“卡”未必走遍天下 181
14．1 卡方檢驗用于分類資料組間比較的思想 181
14．2 卡方用于擬合優(yōu)度評價――從Hardy-Weinberg 定律談起 184
14．3 似然比χ2、M-H χ2、校正χ2 與Fisher 精確檢驗 186
14．4 等級資料到底可不可以用卡方檢驗 191
14．5 卡方檢驗的兩兩比較 193
14．6 Cochran-Armitage 趨勢檢驗 194
14．7 分類變量的賦值是如何影響分析結果的 196

第 15 章相關分析與一致性檢驗 200
15．1 從協(xié)方差到線性相關系數(shù) 200
15．2 線性相關系數(shù)及其置信區(qū)間 203
15．3 如何比較兩個線性相關系數(shù)有無差異 206
15．4 分類資料的相關系數(shù) 207
15．5 基于秩次的相關系數(shù) 210
15．6 相關分析中的幾個陷阱 213
15．7 用ICC 和CCC 指標判斷一致性 215
15．8 用Bland-Altman 圖判斷一致性 218
15．9 Kappa 檢驗在一致性分析中的應用 219

第 16 章線性回歸及其分析思路 222
16．1 殘差――識別回歸模型好壞的關鍵 223
16．2 回歸系數(shù)的正確理解 226
16．3 回歸系數(shù)檢驗VS 模型檢驗 227
16．4 均值的置信區(qū)間VS 個體的預測區(qū)間 228
16．5 逐步回歸篩選變量到底可不可靠――談變量篩選策略 230
16．6 如何評價模型是好還是壞――交叉驗證思路 237
16．7 線性回歸的應用條件――你的數(shù)據(jù)能用線性回歸嗎 240
16．8 如何處理非正態(tài)――Box-Cox 變換 247
16．9 如何處理非線性――Box-Tidwell 變換 248
16．10 方差不齊怎么辦――加權最小二乘法 250
16．11 當共線性導致結果異常時怎么辦――嶺回歸、Lasso 回歸 254
16．12 發(fā)現(xiàn)異常值應該刪除嗎――談幾種處理異常值的方法 260
16．13 如何處理缺失值――是刪除還是填補 268
16．14 一個非教材的非典型案例――線性回歸的綜合分析 276

查看全部↓

標簽：