社會統(tǒng)計學重點
1.社會調(diào)查研究的步驟:1.確定課題。2.了解情況。3.建立假設(shè)。4.確定概念和測量方法。5.涉及問卷。6.試填問卷。7.調(diào)查實施。8.校核與登錄。9.統(tǒng)計分析與命題的檢驗。資料的整理歸納分析以及如何收集資料正是統(tǒng)計分析所要談?wù)摰膬?nèi)容。
2.社會調(diào)查資料的特點:隨機性和統(tǒng)計規(guī)律性。
3.怎樣選用統(tǒng)計分析方法:1.全面調(diào)查和非全面調(diào)查。2.單變量和多變量。3.變量層次.
4.分布概念:指一個概念或變量,它的各個情況出現(xiàn)的次數(shù)或頻次,又稱頻次分布。表現(xiàn)形式:數(shù)對的集合.
5.變量取值的要求— ?⑴變量取值必須完備; ⑵變量取值必須互斥。
6.統(tǒng)計表:是用表格形式來標識前面所說變量的分布。它不需要文字敘述,就能反應(yīng)出資料的特性以及資料之間的關(guān)系,在編印,傳遞方面有很大優(yōu)點,比統(tǒng)計表更精確,但不及統(tǒng)計圖直觀。
7.統(tǒng)計表必須具備的內(nèi)容:1.表號。2.表頭。3.標識行。4.主體行。5.表尾。
8.根據(jù)變量的層次,可以選擇以下不同的統(tǒng)計圖形:定類變量:圓瓣圖、條形圖。定序變量:條形圖。定距變量:直方圖、折線圖。
9.圓瓣圖:是將資料展示在一個圓的平面上,通常用圓形代表現(xiàn)象的總體,用圓瓣代表現(xiàn)象中一種情況,其大小代表變量取值在總體中所占的百分數(shù)。
10.條形圖:是用長條的高度來表示資料類別的次數(shù)或百分數(shù)。定類:離散。定序:離散或緊挨著的。
11.直方圖:直方圖從圖形來看,也是緊挨著的長條形所組成,它與條形圖不同,寬度有意義,一般來說,直方圖是以長條的面積來表示頻次或相對頻次,而條形的長度。即縱軸高度表示是頻次密度或相對頻次密度。頻次密度=頻次/組距。
12.折線圖:如果用直線連接直方圖中條形頂端的中點,就是折線圖。折線圖可使資料的頻次分布趨勢更一目了然。
13.累計圖和累計表:表示的是大于某個變量值的頻次是多少或小于某個變量值的頻次是多少。
14.眾值:就是用具有頻數(shù)最多的變量值來表示變量的集中值。
15.中位值:是數(shù)據(jù)序列之中央位置之變量值。未分組:N為奇數(shù)時:中位值等于n+1/2. N為偶數(shù)時:中位值等于中間兩變量和/2. 根據(jù)頻次分布求中位值:中位值等于頻次的和+1/2.中位值等于求出所對應(yīng)值所在的區(qū)域。分組:1.計算出累計頻次,得到累計百分比。2.確定最高頻次所在組。
均值:總體各單位數(shù)值之和除以總體單位數(shù)目所得之商。
??????統(tǒng)計分析中習慣以X 來表示。
離散趨勢測量法:
1.?異眾比率:非眾值在總數(shù)N中所占的比例。Fm0=眾數(shù)的頻率。
2.?極差:=觀察的最大值-觀察的最小值。
3.?四分互差:q=q75-q25 , ?q50的位置=n+1/2.q25的位置=n+1/4.q74的位置=3(n+1)/2、、分組資料求:
4.?方差與標準差
5.?眾值。中位值和均值的比較:1.眾值:定類。定序和定距變量:異眾比率。2.中位值:定類和定序:極差和四分互差。3.均值:定距:方差或標準差。
第三章:概率
概念:概率分布,反映的是隨機變量一共有多少種可能取值,以及各種取值所出現(xiàn)的概率是多少。 2.形式:可表示為數(shù)對的集合。 3.要求:隨機變量的取值必須滿足完備性和互斥性。
數(shù)學期望 含義: ?數(shù)學期望是總體均值,即總體某一隨機變量各項取值的加權(quán)平均值,它只是一個理論值,是我們所期望的均值。
第五章:
1.正態(tài)分布的三個特征:1.一個高峰:曲線是單峰,有一個最高點。2.一個對稱軸:對稱軸是直線x=u。3.一個漸近線:橫軸為漸近線。
均值:決定左右方向。方差:決定高矮胖瘦。
2.正態(tài)分布的概率密度表達公式:
3.極限定理:凡采用極限的方法所得出的一系列定理。統(tǒng)稱極限定理??煞譃閮深悾阂活愂茄芯吭谑裁礂l件下隨機事件可以轉(zhuǎn)化為不可能事件或必然事件即有關(guān)闡明大量隨機現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理。成為大數(shù)定理。第二類:是研究在什么條件下,隨機變量之和的分布可以近似為正態(tài)分布,稱為中心極限定理。
4.大數(shù)定理和中心極限定理:貝努里大數(shù)定理表明,在相同條件下進行多次觀察時,隨機事件發(fā)生的頻率有接近其概率的趨勢。大數(shù)定理:從一個特定的總體中抽取出所有可能的樣本(樣本容量相同),如果樣本容量足夠大,那么這些樣本的均值的分布將趨近于正態(tài)分布。
????意義:為統(tǒng)計推論中用抽樣成數(shù)來估計總體成數(shù)提供了理論依據(jù)
第六章參數(shù)估計
1.統(tǒng)計推論:統(tǒng)計推論是根據(jù)局部資料(樣本資料)對總體的特征進行推斷。 即,從被研究現(xiàn)象的總體中按照隨機原則抽取一部分個體進行調(diào)查,并依據(jù)調(diào)查結(jié)果對總體的數(shù)量特征作出具有一定可靠程度的估計,以達到認識總體的一種統(tǒng)計方法。
2.總體:研究對象的全體。總體的數(shù)量指標可以看作隨機變量。
3.樣本:按照一定方法從調(diào)查總體中抽取出來的部分調(diào)查對象的集合。
4.統(tǒng)計量:樣本中的每一個個體資料所反映的數(shù)據(jù)是一個隨機變量。那么,從總體中抽取容量為n的樣本,可以看做是n個相互獨立且分布相同的隨機變量ξ1,ξ2,…,ξn。則該隨機變量的任何函數(shù)f(ξ1,ξ2,…,ξn)也是隨機變量。則該函數(shù)叫作統(tǒng)計量。
5.抽樣分布:?抽樣分布,指從一個特定的總體中抽取出所有可能的容量相同的樣本時,這所有樣本的統(tǒng)計值的分布情況。實際就是研究統(tǒng)計量的數(shù)字特征:均值和方差。
6.置信區(qū)間和置信度:在樣本容量一定的情況下,置信區(qū)間和置信度是相互制約的。置信度越大,則相應(yīng)的置信區(qū)間也越寬。
第七章
1.統(tǒng)計假設(shè):?可以通過抽樣調(diào)查獲得的數(shù)據(jù)來直接驗證的假設(shè)。假設(shè)檢驗(統(tǒng)計假設(shè)檢驗),即通過樣本資料對總體的某種假設(shè)進行檢驗。????????只有通過假設(shè)檢驗,才能用樣本資料來科學地推論總體。?
2.原假設(shè)和備則假設(shè):又稱虛無假設(shè),用H0表示。它是根據(jù)已有資料或周密考慮后建立的關(guān)于總體中不存在某種特征或狀態(tài)的假設(shè)。 ???備則假設(shè)又稱研究假設(shè)。用H1表示。它是與原假設(shè)相反的假設(shè),即關(guān)于總體中存在某種特征或狀態(tài)的假設(shè)
3.假設(shè)檢驗的基本原理:假設(shè)檢驗的依據(jù)是小概率原理。 ?小概率原理,全稱“小概率事件不可能原理”,指對于發(fā)生概率很小的事件,在一次觀察(或抽樣)中是不可能發(fā)生的;如果在一次觀察(或抽樣)中出現(xiàn)了小概率事件,則認為事件的發(fā)生概率實際上并不小。?
4.假設(shè)檢驗的步驟和兩類錯誤:1.根據(jù)實際問題做出假設(shè)。2.根據(jù)樣本構(gòu)成合適的,能反應(yīng)H0的統(tǒng)計量,并在H0成立的條件下確立統(tǒng)計量的分布。3.根據(jù)問題的需要,給出小概率α的大小,并根據(jù)2.3.點求出拒絕域和臨界值。4.根據(jù)以上三步驟建立起來的具體檢驗標準,用樣本統(tǒng)計量的觀測值進行判斷。若樣本統(tǒng)計量的值落入拒絕域,則拒絕H0,接受備則假設(shè)H1.否則接受H0。
5.兩類錯誤:?1.第一類錯誤,即棄真的錯誤。拒絕原本正確的原假設(shè)H0,導(dǎo)致推斷結(jié)論錯誤。 ?????前提:原假設(shè)是正確的。
2.第二類錯誤,即納偽的錯誤。接受了原本錯誤的原假設(shè)H0,則導(dǎo)致了另一種推斷錯誤。 ?????前提:原假設(shè)是錯誤的。 ???????
一、列聯(lián)表的涵義:列聯(lián)表是將兩個或多個定類變量的觀測數(shù)據(jù)分別按照它們的不同取值進行聯(lián)合分類時所列出的頻數(shù)(或頻率、概率)表。
二、列聯(lián)表中變量的分布:(一)聯(lián)合分布???對于列聯(lián)表中,當x=xi,y=yj時的頻次為Nij,寫作(xi,yj,Nij)。所有Nij的分布稱作聯(lián)合分布。 ???(二)邊緣分布???在列聯(lián)表中,只研究其中一個變量不同取值的分布,而不論另一個變量的取值,這樣的分布就是邊緣分布。(三)條件分布 ???在列聯(lián)表中,當一個變量取固定值時,另一個變量不同取值的頻率(概率)分布情況,就是條件分布。
三、2×2表— Φ系數(shù)和Q系數(shù)
??????2×2表:列聯(lián)表中兩個變量的取值都只有兩個。
??????1.Φ系數(shù)的形式和取值范圍, Φ∈[-1,1]
??????2. Q系數(shù)的形式和取值范圍, ??Q∈[-1,1]
四、r×c列聯(lián)表的相關(guān)系數(shù)
??????r×c表:列聯(lián)表中兩個變量中至少有一個變量的取值為三個或三個以上。
?