食品試驗設(shè)計與統(tǒng)計分析期末復(fù)習(xí)資料
第一章
1. 統(tǒng)計學(xué):研究數(shù)據(jù)的搜集、整理與分析的科學(xué),面對不確定性數(shù)據(jù)作出科學(xué)的推斷。因而統(tǒng)計學(xué)是認(rèn)識世界的重要手段。
2. 食品試驗設(shè)計與統(tǒng)計分析:數(shù)理統(tǒng)計原理與方法在食品科學(xué)研究中的應(yīng)用,是一門應(yīng)用數(shù)學(xué)。
3. 食品試驗科學(xué)的特點:1.食品原料的廣泛性 2.生產(chǎn)工藝的多樣性 3.質(zhì)量控制的重要性 4.不同學(xué)科的綜合性
4. 統(tǒng)計學(xué)發(fā)展概貌:古典記錄統(tǒng)計學(xué)、近代描述統(tǒng)計學(xué)、現(xiàn)代推斷統(tǒng)計學(xué)。
第二章
5. 總體:根據(jù)研究目的確定的研究對象的全體。
6. 個體:總體中一個獨立的研究單位。
7. 樣本:根據(jù)一定方法從總體中抽取部分個體組成的集合。
8. 樣本含量n(樣本容量):即樣本中個體的數(shù)目。(n≤30的樣本叫小樣本,n≥30的樣本叫大樣本)
9. 隨機樣本:總體中的每一個個體都有同等機會被抽取組成樣本。
10. 參數(shù):由總體計算的特征數(shù)。
11. 統(tǒng)計量:由樣本計算的特征數(shù)。
12. 參數(shù)和統(tǒng)計量的關(guān)系:由相應(yīng)的統(tǒng)計量來估計參數(shù),如樣本平均數(shù)估計總體平均數(shù),樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差。
13. 準(zhǔn)確性(準(zhǔn)確度):在調(diào)查或試驗中某一實驗指標(biāo)或性狀的觀測值與真實值接近的程度。(觀測值與真實值之間)
14. 精確性(精確度):在調(diào)查或試驗中同一實驗指標(biāo)或性狀的重復(fù)觀測值彼此接近的程度。(觀測值與觀測值之間)
15. 試樣中的誤差:隨機誤差和系統(tǒng)誤差。
16. 隨機誤差(抽樣誤差):由許多無法控制的內(nèi)在和外在偶然因素所造成的誤差,不可避免和消除,影響試驗的精確性。
17. 系統(tǒng)誤差(片面誤差):由于試驗對象相差較大,測量的儀器不準(zhǔn)、標(biāo)準(zhǔn)試劑未經(jīng)校正所引起,可以通過改進方法、正確試驗設(shè)計來避免、消除,影響試驗準(zhǔn)確性。
18. 資料的分類:連續(xù)性資料:對每個觀測值單位使用儀器或試劑等量測手段來測定其某項指標(biāo)的數(shù)值大小而得到 的資料。
間斷性資料:用計數(shù)方式得到的數(shù)據(jù)資料。
分類資料:可自然或人為地分為兩個或多個不同類別的資料。
等級資料:將觀察單位按所考察的性狀或指標(biāo)的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。
19. 連續(xù)性資料的整理:采用組距式分組
1.求全距 2.確定組數(shù) 3.求組距 4.確定組限和組中值(最小值為下限,最大值為上限。第一組的組中值以接近于或等于資料中最小值為好。)5.制作次數(shù)分布表
20. 統(tǒng)計表的繪制原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點突出,數(shù)據(jù)準(zhǔn)確,便于理解和分析
21. 統(tǒng)計表種類:簡單表,復(fù)合表
22. 統(tǒng)計圖:用圖形將統(tǒng)計資料形象化。長條圖、圓圖、線圖、直方圖、折線圖。
23. 平均數(shù)`X:指出資料中數(shù)據(jù)集中較多的中心位置,描述資料的集中性。反應(yīng)了總體分布的集中趨勢。
24. 平均數(shù)的種類:算術(shù)平均數(shù)、中數(shù)、眾數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。
25. 算數(shù)平均數(shù)計算方法:直接法、加權(quán)法
26. 算數(shù)平均數(shù)的特性:離均差為0,離均差平方和最小。
27. 離均差:每個觀測值均有一個偏離平均數(shù)的度量指標(biāo)。算術(shù)平均數(shù)的離均差之和為零。
28. 離均差平方和:各個離均差平方后相加。
29. 方差(MS):也稱均方,各數(shù)據(jù)與平均數(shù)的差的平方和與自由度的比。樣本方差用S2表示。(無單位)
30. 自由度df:樣本內(nèi)獨立而能自由變動的離均差個數(shù)。
31. 標(biāo)準(zhǔn)差:樣本方差的算術(shù)平方根。(有單位,與觀測值單位相同)
32. 標(biāo)準(zhǔn)差的特性: 1.標(biāo)準(zhǔn)差的大小受每個觀測值的影響,若數(shù)值之間變異大,其離均差亦大,標(biāo)準(zhǔn)差必然大。
33.
2.各觀測值加或減同一常數(shù),標(biāo)準(zhǔn)差的值不變。
3.每個觀測值乘以或除以一個不等于0的常數(shù)A時,所得標(biāo)準(zhǔn)差是原標(biāo)準(zhǔn)差的A倍或1/A。
34. 樣本標(biāo)準(zhǔn)差:EXCEL用STDEV函數(shù)計算。
35. 變異系數(shù)CV:標(biāo)準(zhǔn)差相對于平均數(shù)的百分?jǐn)?shù)。反映了總體的可比程度。
CV=
36. 變異系數(shù)的作用:當(dāng)資料所帶的單位不同或單位雖然相同而平均數(shù)相差較大時,不能直接用標(biāo)準(zhǔn)差比較各個樣本資料的變異程度大小。消除了不同單位和平均數(shù)的影響。
第三章
37. 伯努利試驗:只有兩種實驗結(jié)果的隨機試驗。
38. N重伯努利試驗:伯努利試驗在完全相同的實驗條件下獨立的重復(fù)n次,并作為一個隨機試驗。
39. 二項分布x~B(n,p):離散型隨機變量分布。
P(x=k)=
(k=0,1,2,3…,n)
40. 二項分布的特征
1.Pn(K)≥0 2.(p+q)n=1 3.在一定范圍內(nèi)的總概率P等于被包含的幾個概率之和。
4.當(dāng)p值較小且n不大時,分布是偏倚的。隨著n的增大,分布逐漸趨于對稱。
5.當(dāng)p值趨于0.5時,分布趨于對稱。
41. 二項分布的應(yīng)用條件:
(1)試驗結(jié)果為兩大類或兩種可能的結(jié)果。
(2)每次試驗的條件不變,每次試驗A的發(fā)生概率均為π。
(3)各次試驗獨立,每個觀察單位的觀察結(jié)果不會影響到其他觀察單位的結(jié)果。
42. 二項分布的平均數(shù):m=np
43. 二項分布的方差:s2=npq
44. 泊松分布x~P(l):可以用來描述和分析隨機地發(fā)生在單位空間或時間里的稀有事件的分布。(即小概率事件分布,意外事故、自然災(zāi)害都近似服從)
P(x=k)=
45. 泊松分布特點:離散型隨機變量概率分布,均值與方差相等。μ=σ2=λ。
46. 泊松分布的應(yīng)用條件:
1. 隨機地發(fā)生在單位時間或空間里的稀有事件的概念分布。
2. 在二項分布中,n很大,p很小時。
3. 事件不隨機時,不能用泊松分布。
47. 正態(tài)分布x~N(m,s2):連續(xù)型隨機變量的概率分布。
48. 正態(tài)分布的特點:
1. 正態(tài)分布曲線是以均數(shù)m為中心左右對稱的單峰懸鐘形曲線。在平均數(shù)的左右兩側(cè),只要(x-m)絕對值相等,f(x)值就相等。
2. f(x)在x=m處達到最大值,且f(m)=1/(σ
)
3. f(x)是非負(fù)函數(shù),以橫軸為漸近線,分布從-∞到+∞,且曲線在m±σ處各有一個拐點。
4. m是位置參數(shù),σ2是形狀參數(shù)。
5. 正態(tài)分布的次數(shù)多數(shù)集中于平均數(shù)m的附近,離均數(shù)越遠(yuǎn),其相應(yīng)的次數(shù)越少。
6. 曲線f(x)與橫軸之間所圍成的面積等于1。
49. 標(biāo)準(zhǔn)正態(tài)分布u~N(0,1):m=0,σ2=1的正態(tài)分布。
50. 標(biāo)準(zhǔn)正態(tài)變量(標(biāo)準(zhǔn)正態(tài)離差)u:u=(x-m)/σ
51. 三種分布的關(guān)系:
1. 二項分布,當(dāng)n很大,np、n(1-p)接近,該分布接近于正態(tài)分布。
2. 在n?∞、p?0.5時或p>0.1時可用二項分布代替正態(tài)分布。
3. 當(dāng)n?∞、p?0,且np=l(較小常數(shù))時,用泊松分布代替二項分布。
4. 當(dāng)p<0.1且n很大時,用泊松分布代替二項分布。
5. 泊松分布,l≥30時,用正態(tài)分布代替。
52. 抽樣分布:統(tǒng)計量的分布概率。
53. 抽樣誤差:由隨機抽樣造成的誤差。
54. 標(biāo)準(zhǔn)誤差(標(biāo)準(zhǔn)誤,均數(shù)標(biāo)準(zhǔn)誤):樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差。反應(yīng)精確性的高低,s`x越大精確度越低。
s
55. t分布:在計算S`x時,由于采用S來代替s,使得t變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布。
t=(`x-m)/S`x
第四章
56. 統(tǒng)計推斷:根據(jù)抽樣分布規(guī)律和概率理論,由樣本結(jié)果去推斷總體特征。主要包括假設(shè)檢驗(顯著性檢驗)和參數(shù)估計。
57. 表面效應(yīng):樣本平均數(shù)與總體平均數(shù)的差異。包含兩總體平均數(shù)的差異(處理效應(yīng))(m-m0)和試驗誤差`e。
`x-m0=m+`e-m0=(m-m0)+`e
58. 統(tǒng)計假設(shè)檢驗:對研究總體提出假設(shè),然后在此假設(shè)下構(gòu)造合適的檢驗統(tǒng)計量,并由該統(tǒng)計量的抽樣分布計算出樣本統(tǒng)計量的概率,再根據(jù)概率值的大小作出接受或否定假設(shè)的判斷。
59. 無效假設(shè)H0:通過檢驗,可能被接受,也可能被否定。
60. 備擇假設(shè)HA:與無效假設(shè)相對應(yīng)的假設(shè)。
61. 進行假設(shè)檢驗的基本依據(jù):把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原理。
62. 顯著水平a:決定接受或否定H0的小概率標(biāo)準(zhǔn)。(常用顯著水平有0.05和0.01)
63. 統(tǒng)計假設(shè)檢驗步驟:1.建立假設(shè) 2.確定顯著水平α 3.檢驗計算 4.統(tǒng)計推斷
64. Ⅰ型錯誤(第一類錯誤):指當(dāng)H0本身正確,但通過假設(shè)檢驗后卻否定了它,也就是將非真實差異錯判為真實差異。犯第一類錯誤的概率是a。(減少Ⅰ型錯誤,可將顯著水平定得小一點。)
65. Ⅱ型錯誤(第二類錯誤):當(dāng)H0本身錯誤時,通過假設(shè)檢驗后卻接受了它,也即把真實差異錯判為非真實差異。(減少Ⅱ型錯誤,通常是通過減少均數(shù)標(biāo)準(zhǔn)誤來減小第二類錯誤的概率。而均數(shù)標(biāo)準(zhǔn)誤的減小是通過精密的試驗設(shè)計、嚴(yán)格的試驗操作和增大樣本容量來實現(xiàn)的。由于一般來說α大β就小,增大了犯第一類錯誤的概率時,犯第二類錯誤的可能性就小。反之,α小,β大。因此在實踐中可以根據(jù)試驗?zāi)康?,通過調(diào)整α的大小來控制檢驗時犯錯誤的概率。)
66. 兩尾檢驗:備擇假設(shè)中,包含了μ<μ0和μ>μ0兩種情況,因而這種檢驗有兩個否定域,分別位于樣本平均數(shù)分布曲線的兩尾。
67. 一尾檢驗:否定域位于`x分布曲線某一尾的統(tǒng)計假設(shè)檢驗。
68. 選用兩尾檢驗還是一尾檢驗應(yīng)根據(jù)專業(yè)的要求在試驗設(shè)計時確定。若事先不知道μ與μ0誰大誰小,為了檢驗兩者是否有差異就用兩尾檢驗。如果能憑借專業(yè)只是推測μ不會小于(或大于)μ0時,為了檢驗μ是否大于(或小于)μ0應(yīng)用一尾檢驗。
69. u檢驗:在假設(shè)檢驗中利用標(biāo)準(zhǔn)正態(tài)分布來進行統(tǒng)計量的概率計算的檢驗方法。
70. u檢驗使用范圍:若樣本資料總體方差已知,或樣本含量≥30時用u檢驗。
71. 假設(shè)統(tǒng)計誤差中試驗誤差:隨機誤差
72.
統(tǒng)計假設(shè)檢驗中應(yīng)注意的問題:1.試驗要科學(xué)設(shè)計和正確實施 2.選用正確的統(tǒng)計假設(shè)檢驗方法 3.正確理解差異顯著性的統(tǒng)計意義 4.合理建設(shè)統(tǒng)計假設(shè),正確計算檢驗統(tǒng)計量
單個樣本平均數(shù)的假設(shè)檢驗
1) 單個樣本平均數(shù)的u檢驗:
某罐頭廠生產(chǎn)肉類罐頭,其自動裝罐機在正常工作時每罐凈重服從正態(tài)分布N(500,64)(單位,g)。某日隨機抽查10瓶罐頭,測其凈重見表。分析裝罐機當(dāng)日工作是否正常?
編號
1
2
3
4
5
6
7
8
9
10
凈重(g)
505
512
497
493
508
515
502
495
490
510
2) 單個樣本平均數(shù)的t檢驗:
t檢驗:在假設(shè)檢驗中利用t分布來進行統(tǒng)計量的概率計算的檢驗方法。
兩個樣本平均數(shù)的假設(shè)檢驗:由兩個樣本平均數(shù)之差,去判斷這兩個樣本所在的總體平均數(shù)有無顯著差異。
一、 成組資料平均數(shù)的假設(shè)檢驗:
1) U檢驗
1、 如果兩個樣本資料都服從正態(tài)分布,且總體方差
和
已知。
2、 總體方差未知,但兩個樣本都是大樣本時,平均數(shù)差數(shù)的分布呈正態(tài)分布。
2)
t檢驗
1.
如果兩個樣本資料都服從正態(tài)分布,且=時,不論是大樣本還是小樣本,都有下式服從具有自由度df=n1+n2-2的t分布:。
二、
成對資料平均數(shù)的假設(shè)檢驗:
73. 二項百分率的假設(shè)檢驗
1)
單個二項百分率的假設(shè)檢驗
2) 單個二項百分率的假設(shè)檢驗
第五章
74. 方差分析(變量分析):關(guān)于觀測值變異原因的數(shù)量分析。(三個或三個以上水平的分析,小于3個用t檢驗。)
75. 試驗設(shè)計的作用: 1.可以分析清楚試驗因素對試驗指標(biāo)影響的大小順序,找出主要因素,抓住主要矛盾 2.可以了解試驗因素對試驗指標(biāo)影響的規(guī)律性 3.可以了解試驗因素之間相互影響的情況 4.可較快地找出優(yōu)化的生產(chǎn)條件或工藝條件,確定優(yōu)化方案 5.可以正確估計、預(yù)測和有效控制、降低試驗誤差,提高試驗精度 6.可以明確為尋找更優(yōu)生產(chǎn)或工藝條件、深入揭示事物內(nèi)在規(guī)律而進一步研究的方向。
76. 試驗指標(biāo):根據(jù)研究目的而選定的用來衡量或考核試驗效果的質(zhì)量特性。如:考察加熱對果膠酶活性的影響,果膠酶活性是試驗指標(biāo)。(單指標(biāo)試驗,多指標(biāo)試驗)
77. 試驗因素:凡對試驗指標(biāo)可能產(chǎn)生影響的原因或要素。 如:醬油質(zhì)量受原料、曲種、發(fā)酵時間等的影響,這些都是影響醬油質(zhì)量的因素。
78. 因素水平:試驗因素所處的某種特定狀態(tài)或數(shù)量等級。 如:比較3個大豆品種蛋白質(zhì)含量高低,這3個品種就是大豆品種這個試驗因素的三個水平
79. 試驗處理:事先設(shè)計好的實施在實驗單位上的一種具體措施或項目。 如:單因素試驗中,試驗因素的一個水平就是一個處理 多因素:水平組合
80.
平方和與自由度分解:設(shè)一個試驗共有k個處理n個重復(fù),則該試驗資料共有nk個觀測值,其數(shù)據(jù)分組如下:
81. F值:兩個方差之比。 F=
82. F自由度:兩個。df1= dft=k-1 df2= dfe=k(n-1)
83. F檢驗:用F值出現(xiàn)概率的大小推斷兩個方差是否相等的方法。
84. 方差分析表:
變異來源
平方和(SS)
自由度(df)
均分(MS)
F值
處理間
SSt
dft=k-1
MSt=SSt/dft
SSt/SSe
處理內(nèi)
SSe=SST-SSt
dfe=dfT-dft
MSe=SSe/dfe
總變異
SST
dfT=nk-1
85. 線性模型:被分析的變量總體中每一個變數(shù)可以按其變異的原因分解成若干個線性組成部分。
86. 單因素線性模型的數(shù)學(xué)模型可歸納為:1.效應(yīng)的可加性 2.分布的正態(tài)性 3.方差的同質(zhì)性
87. 多重比較:統(tǒng)計學(xué)中把多個平均數(shù)兩兩間的比較。(F值顯著或極顯著否定了無效假設(shè)H0,表明試驗的總變異主要來源于處理間的變異。)(常用的有最小顯著差數(shù)法(LSD法)和最小顯著極差法(LSR法)。)
88.
最小顯著差數(shù)法(LSD法)的檢驗程序:在處理間的F檢驗顯著的前提下,計算出顯著水平為a的最小顯著差數(shù)LSDa;任何兩個處理平均數(shù)間的差數(shù)
,若其絕對值≥LSDa,則為在
水平上差異顯著;反之,則為在
水平上差異不顯著。這種方法又稱為保護性最小顯著差數(shù)法。LSD法實質(zhì)上是t檢驗。
89. 最小顯著極差法(LSR法)特點:把相互比較的兩平均數(shù)的差數(shù)看成是平均數(shù)的極差,根據(jù)極差范圍捏所包含的處理數(shù)K(稱為秩次距)的不同而采用不同的檢驗尺度,以克服LSD法的不足。
90. 最小顯著極差法: q檢驗和新復(fù)極差法。
91. q檢驗法:檢驗統(tǒng)計量為q值。 q=R/
92. 新復(fù)極差法(鄧肯氏法,SSR):
93. 各處理重復(fù)數(shù)相等的方差分析:
94. 兩向分組資料的方差分析
1.
兩向分組單獨觀測值試驗資料的方差分析
95. 簡單效應(yīng):在某因素同一水平上,另一因素不同水平對試驗指標(biāo)的影響。
96. 主效應(yīng):由于因素水平的改變而引起的平均數(shù)的改變量。
97. 互作效應(yīng):在多因素試驗中,一個因素的作用要受到另一個因素的影響,表現(xiàn)為某一因素在另一因素的不同水平上所產(chǎn)生的效應(yīng)不同。
2. 兩因素等重復(fù)試驗:
98. 兩向分組有重復(fù)資料方差分析時數(shù)據(jù)總變異原因可以分解為:A因素,B因素,A*B和誤差
99. 方差分析的基本假定:1.效應(yīng)的可加性 2.分布的正態(tài)性 3.方差的同質(zhì)性
100. 參數(shù)統(tǒng)計:限定分布的估計或檢驗。
101. 非參數(shù)統(tǒng)計:對總體分布的具體形式不必作任何限制性假定和不以總體參數(shù)具體數(shù)值估計或檢驗為目的的推斷統(tǒng)計。
102. 非參數(shù)統(tǒng)計檢驗:非參數(shù)統(tǒng)計主要用于對某種判斷或假設(shè)進行檢驗。
103. x2檢驗
104. 適應(yīng)性檢驗:判斷實際觀察次數(shù)屬性分配是否依循已知屬性分配理論或?qū)W說的一種假設(shè)檢驗方法。
105. 獨立性檢驗:用x2檢驗來探求兩因子間是否彼此獨立還是關(guān)聯(lián)的檢驗。
106. 相關(guān)系數(shù)的回歸系數(shù)的符號:無法判斷
107. 線性回歸分析中的假設(shè)檢驗:檢驗變量x和y是否有線性相關(guān)關(guān)系。
第八章
108. 試驗指標(biāo):根據(jù)研究目的而選定的用來衡量或考核試驗效果的質(zhì)量特性。(如:考察加熱對果 膠酶活性的影響,果膠酶活性是試驗指標(biāo))
109. 試驗因素:凡對試驗指標(biāo)可能產(chǎn)生影響的原因或要素。(如:醬油質(zhì)量受原料、曲種、發(fā)酵時 間等的影響,這些都是影響醬油質(zhì)量的因素。)
110. 因素水平:試驗因素所處的某種特定狀態(tài)或數(shù)量等級。(如:比較3個大豆品種蛋白質(zhì)含量高 低,這3個品種就是大豆品種這個試驗因素的三個水平)
111. 試驗處理:事先設(shè)計好的實施在實驗單位上的一種具體措施或項目。(如:單因素試驗中, 試驗因素的一個水平就是一個處理)
112. 試驗單位:在試驗中能接受不同實驗處理的獨立的試驗載體。
113. 重復(fù):在一個試驗中,將一個處理實施在兩個或兩個以上的試驗單位上。
114. 處理:是指事先設(shè)計好的實施在試驗單位上的一種具體措施。
115. 全面試驗:試驗中,對所選取的試驗因素的所有水平組合全部給予實施的試驗。
116. 部分實施(部分試驗):從全部試驗處理中選取部分有代表性的處理進行試驗。
117. 試驗設(shè)計的三原則:重復(fù),隨機化,局部控制
第十一章
118. 正交設(shè)計:利用正交表來安排與分析多因素試驗的一種設(shè)計方法。
119. 正交設(shè)計的基本特點:用部分試驗來代替全面試驗,通過對部分試驗結(jié)果的分析,了解全面試驗的情況。
120.
正交表
: L表示正交表,n表示試驗點數(shù),即正交表行數(shù),t表示因素的水平數(shù),q為最多能安排的因素數(shù),即正交表列數(shù)。
121. 正交表的性質(zhì): 1.任何一列中各水平都出現(xiàn),且出現(xiàn)次數(shù)相等。
2.任意兩列間各種不同水平的所有可能組合都出現(xiàn),且出現(xiàn)次數(shù)相等。
122. 正交設(shè)計的基本步驟:
1) 明確實驗?zāi)康?,確定實驗?zāi)繕?biāo)
2) 挑因素,選水平 (水平2~4個,不超過6個)
3) 選擇合適的正交表 (在能夠安排下試驗因素和交互作用的前提下,因素的個數(shù)不大于正交表記號中括號內(nèi)的指數(shù),
要考慮的因素及交互作用的自由度總和小于所選正交表的總自由度)
4) 進行表頭的設(shè)計 1.只考察主效應(yīng),不考慮互作效應(yīng)的表頭設(shè)計。
2.只考慮互作效應(yīng)的表頭設(shè)計。
5) 確定試驗方案,實施試驗
6) 試驗結(jié)果分析
123. 表頭設(shè)計:將試驗因素安排到所選正交表的各列中去的過程。
124. 交互作用:指因素間的聯(lián)合搭配而產(chǎn)生的對試驗指標(biāo)的影響作用。
125. 相關(guān)系數(shù):是表示兩個變量間線性相關(guān)的程度和性質(zhì)的統(tǒng)計量。