CDA-LEVELⅡ錯題分享

1.下列關于多元回歸方程中的變量說法不正確的是?
A.典型的非線性變換包括自然對數(shù),平方根,倒數(shù)和平方
B.互動變量表示兩個變量之間存在交互作用,在方程中常體現(xiàn)為兩者之和
C.創(chuàng)建虛擬/啞變量(dummy variables)可以將定性的變量量化
D.如果一個定性變量中有m種互斥的屬性類型,在模型中需要引入m-1個虛擬/啞變量
B互動變量表示兩個變量之間存在交互作用,在方程中體現(xiàn)為兩者之積。
?
2.不屬于消除模型異方差的方法是?
A.加權最小二乘法
B.等級相關系數(shù)法
C.方差穩(wěn)定性變化法
D.Box-Cox變換法
B選項的等級相關系數(shù)法是用來檢驗是否存在異方差的,而不是用來消除異方差的,故錯誤
?
3.含有p個變量的多元回歸模型,樣本量為n,則該模型的回歸平方和、殘差平方和的自由度分別為?
A.p,n-p
B.n-p,p
C.p,n-p-1
D.n-p-1,p
C
?
?
4.以下哪個模型是對線性趨勢預測的模型
A.簡單指數(shù)平滑
B.Holt指數(shù)平滑
C.指數(shù)模型
D.多項式模型
B
A用于隨機序列的預測。C也稱指數(shù)曲線,用于非線性趨勢。D項多項式函數(shù)用于非線性趨勢的預測
?
?
5.如果時間序列同時含趨勢、季節(jié)變動和隨機波動成分時,除了可以使用Witer指數(shù)平滑模型預測外,還可以使用什么方法/模型進行預測?
A.Holt指數(shù)平滑
B.簡單指數(shù)平滑
C.分解法
D.以上都不是
C分解法是把趨勢、季節(jié)成分分解出來,單獨進行分析再乘在一起。
?
?
?
6.在問題原因分析中,需要找到多個因素之間難以識別的關系,適合用什么工具?
A.散點圖
B.調查表
C.關聯(lián)圖
D.柱狀圖
C
散點圖用于找到兩個變量間的關系,不是多個因素,多個指三個以上(包括三個);調查表用于從采訪者那里收集數(shù)據(jù),在問題原因數(shù)據(jù)收集會涉及到;關聯(lián)圖是以一種清晰的圖示,揭示找出多個因素間的關系,主要目的是識別那些不易被發(fā)現(xiàn)的關系;柱狀圖主要用于圖形描繪數(shù)據(jù);
?
?
?
7.下列哪個選項屬于根因分析中魚骨圖創(chuàng)建圖形的方式?
A.分散分析法
B.因果分析法
C.五問法
D.因子分析法
A
魚骨圖包括兩種明顯不同的創(chuàng)建圖形的方式:分散分析法、原因枚舉法。
?
8.根因分析的因果圖(魚骨圖)繪制過程中,要解決的問題或缺陷(后果)標記在‘魚’的哪個部位?
A.魚尾
B.魚頭
C.魚刺
D.以上均可
B魚頭是標記要解決的問題或缺陷(后果),魚刺列出的是產生問題的可能原因,有助于說明各個原因是如何影響后果的
?
?
9.在根因分析的因果圖中,若各要素與特性值間不存在原因關系,而是結構構成關系屬于哪種類型因果圖?
A.原因型
B.對策型
C.整理問題型
D.結果導向型
C整理問題型魚骨圖適用于:各要素與特性值間不存在原因關系,而是結構構成關系
?
?
10.根因分析中為弄清一個層面的原因對另一個層面的原因影響后,探求原因鏈應該采用的量化分析工具是?
A.散點圖
B.柱狀圖
C.帕累托圖
D.關聯(lián)圖
A在根因分析中散點圖的應用表現(xiàn):第一是在弄清一個層面的原因對另一個層面的原因的影響后,探求原因鏈。第二是剔除那些與根原因不相關的原因
?
?
11.關于根原因識別工具關聯(lián)圖的說法錯誤的是?
A.包括質量關聯(lián)圖和數(shù)量關聯(lián)圖
B.質量關聯(lián)圖可能會帶來不可靠的結果
C.數(shù)量關聯(lián)圖的結構性更強
D.質量關聯(lián)圖優(yōu)于數(shù)量關聯(lián)圖
D關聯(lián)圖有質量關聯(lián)圖和數(shù)量關聯(lián)圖兩類,基本原則都是識別不同因素間的關系,區(qū)別于方法的不同。在質量關聯(lián)圖中,要分析的因素被畫在一個空白圖表上,憑借直觀理解把因素聯(lián)系起來就可以找到關系,因此質量關系圖可能會帶來不可靠的結果。而在數(shù)量關聯(lián)圖中,在確定不同因素之間關系的時候往往需要使用簡單的數(shù)字方法,所以數(shù)量關聯(lián)圖的結構性更強,分析過程更完善。數(shù)量關聯(lián)圖優(yōu)于質量關聯(lián)圖。
?
?
12.關于線性規(guī)劃的標準型描述正確的是?
A.目標函數(shù)為極小化類型
B.所有的約束條件都是不等式
C.等式約束方程右端的常數(shù)都是非零的
D.所有決策變量都是非負的
D線性規(guī)劃模型的標準形式的特征:(1)目標函數(shù)為極大化類型;(2)所有的約束條件都是等式;(3)所數(shù)學規(guī)劃有約束方程右端的常數(shù)都是非負的;(4)所有決策變量都是非負的
?
?
?
13.常用的求解整數(shù)規(guī)劃的方法不包括以下哪種?
A.分支定界法
B.分配法
C.割平面法
D.隱枚舉法
B整數(shù)規(guī)劃的方法不包括分配法
?
?
?
14.下列方法中不屬于常用的二次規(guī)劃問題求解方法是?
A.拉格朗日法
B.內點法
C.橢球法
D.分支定界法
D分支定界法是整數(shù)規(guī)劃的求解方法
?
?
15信息一般認為由那兩部分組成
A.數(shù)據(jù)
B.元數(shù)據(jù)
C.加工過程
D.描述對象
AB信息由數(shù)據(jù)和元數(shù)據(jù)構成
?
?
?
?
?
?
?
?
16.在進行隨機抽樣時由于某些原因會產生抽樣誤差,以下關于抽樣誤差的說法,正確的是
A.抽樣誤差是隨機抽樣調查中偶然發(fā)生的代表性誤差
B.抽樣誤差的大小同樣本單位數(shù)成正比關系
C.簡單隨機抽樣比分層、分群抽樣誤差大
D.重復抽樣比不重復抽樣誤差小
A抽樣誤差是指由于抽樣的隨機性帶來的偶然的代表性誤差,選項A正確; 樣本單位數(shù)目越多,抽樣誤差越小,反之則大,選項B錯誤; 一般來說,分層抽樣誤差相對簡單隨機抽樣、分群抽樣誤差較小,選項C錯誤; 在同等條件下,重復抽樣比不重復抽樣誤差大,重復抽樣會有樣本重復,信息量就小,代表性比較低
?
?
17.下面關于第三范式關系必須符合的條件,說法錯誤的是?
A.每個屬性的值唯一
B.每個非主屬性必須完全依賴于整個主鍵
C.其他關系的屬性需要依賴于主鍵
D.每個非主屬性不能依賴于其他關系中的屬性
C暫無答案解析
增量數(shù)據(jù)ETL中捕獲數(shù)據(jù)變化的方法有:觸發(fā)器方式、時間戳方式、全表刪除插入方式、全表比對方式、日志表方式、系統(tǒng)日志分析方式等。 C:datastage,Informatica屬于常見的ETL工具,除此之外Spark等通用計算引擎也可用于ETL開發(fā)
?
18.ABtest是運營人員、產品經(jīng)理等經(jīng)常使用的工具,下面關于AB實驗中最小樣本量的描述正確的是()
A.預期提升比例越大,最小樣本量越小
B.樣本方差越大,最小樣本量越小
C.選取α值越大,最小樣本量越小
D.選取β值越小,最小樣本量越小
A檢驗方案實施后的總體B是否相對實施前的總體A有顯著提升。比例越大越說明B比A有顯著差異,則只需越少的樣本就能得出顯著的結論
?
?
19.為了比較兩個總體方差,我們通常檢驗兩個總體的
A.方差差
B.方差比
C.方差乘積
D.方差和
B比較兩個總體方差時,通常采用檢驗兩個總體方差比的F檢驗
?
?
20.關于單因素方差分析,下列說法不正確的是
A.組間平方和只包含系統(tǒng)誤差
B.組內平方和只包含隨機誤差
C.如果組間均方遠大于組內均方,那么就說明不同水平之間均值存在著顯著差異。
D.如果組間均方遠大于組內均方,那么就說明分類變量對于數(shù)值變量有顯著影響。
A組間誤差包括效應間差異和隨機誤差,故A項錯誤;
?
?
21.在業(yè)務上常常需要分析兩個變量之間的相關性并根據(jù)結果來制定后續(xù)的計劃,度量兩個連續(xù)變量的相關性可以用以下哪種指標()?
A.皮爾遜相關系數(shù)
B.斯皮爾曼相關系數(shù)
C.肯德爾曼相關系數(shù)
D.以上都可以
A相關性的度量方法:兩個連續(xù)變量使用皮爾遜相關;兩個順序性變量使用斯皮爾曼相關系數(shù);肯德爾相關系數(shù)也是秩相關系數(shù),用于有序變量
?
?
?
22.在實際應用中,若研究單個指標的方差對結果的影響,在做主成分析的時候應該選擇使用( )
A.協(xié)方差矩陣
B.相關系數(shù)矩陣
C.關聯(lián)矩陣
D.其余三者皆可
A漣鋼不一樣用相關系數(shù),一樣則用協(xié)方差矩陣。各主成分方差之和等于所有變量x的方差之和,因此用協(xié)方差矩陣可以得到指標的方差,從而繼續(xù)后續(xù)分析。
?
?
23.關于主成分分析與因子分析的區(qū)別和聯(lián)系說法正確的是?
A.每個主成分都只包含部分原始變量,這些變量代表著相應主成分的明確含義
B.每個主成分都是原始變量的線性組合,因此,各主成分之間存在一定的相關性
C.因子分析需要假設各公因子之間互不相關,特殊因子之間也不相關,公因子和特殊因子之間也不相關;但是主成分分析不需要任何假設
D.公因子和主成分都不能被很好的解釋
C
A.每個主成分都是所有原始變量的線性組合,且各變量的系數(shù)大小沒有明確的分界線,故很難對每個主成分的含義做出解釋; B.每個主成分都是原始變量的線性組合,各主成分之間相互獨立; D.因子分析中,由于使用了因子旋轉技術而使得因子得到更好的解釋,但是對于主成分來說卻很難表示出其明確的含義
?
?
24.關于因子分析的KMO檢驗說法錯誤的是( )。
A.KMO統(tǒng)計量是取值在0和1之間
B.當所有變量間的簡單相關系數(shù)平方和遠遠大于偏相關系數(shù)平方和時,KMO值越接近于1
C.當KMO值接近1時,表示各變量之間的偏相關系數(shù)應該很小
D.當所有變量間的簡單相關系數(shù)平方和遠遠大于偏相關系數(shù)平方和時,KMO值越接近于0
DKMO統(tǒng)計量越接近1,說明簡單相關系數(shù)平方和越大于偏相關系數(shù)平方和,說明變量間的相關性越高,從而用因子分析就能更好地提出具有共同特征的因子
簡單相關系數(shù)沒有考慮其余變量的影響,偏相關系數(shù)考慮并控制了其他變量的影響。
?
25.為了比較兩個總體方差,我們通常檢驗兩個總體的
A.方差差
B.方差比
C.方差乘積
D.方差和
B比較兩個總體方差時,通常采用檢驗兩個總體方差比的F檢驗
?
26.如果回歸分析中存在多重共線性,下列說法錯誤的是( )。
A.所求出的參數(shù)的含義將變得不合理
B.不會影響模型的預測結果
C.可用嶺回歸或Lasso回歸降低多重共線性對回歸結果的影響
D.存在多重共線性的變量所求參數(shù)將變得不顯著
B多重共線性會使估計量的方差變大,則顯然會讓預測結果更容易不準確
?
?
?
27.可以用于趨勢成分和季節(jié)成分序列的預測是哪種模型?
A.Winter模型
B.Holt模型
C.簡單指數(shù)平滑模型
D.以上都不是
A
Winter模型同時含有平滑值(隨機成分)和季節(jié)成分,因此可用于同時含有趨勢和季節(jié)成分的預測。Holt不含季節(jié)成分,簡單指數(shù)平滑不含隨機成分,都不合適。
?
?
28.單純形法是求解線性規(guī)劃問題最常用、最有效的算法之一,關于單純形法的說法正確的是
A.在線性規(guī)劃問題中,只要存在相應的解,則一定可以在可行域的頂點中找到。
B.單純形法的核心是根據(jù)一定的規(guī)則,一步步尋找可行域中的最優(yōu)解。
C.對偶單純形法是求解對偶問題的一種方法。
D.單純形法計算精度高,并且是一種很經(jīng)濟的算法
B
A.只有線性規(guī)劃問題的最優(yōu)解存在時,才一定可以在可行域的頂點中找到; C.對偶單純形法是使用對偶理論來求解線性規(guī)劃問題的一種方法,而不是求解對偶問題的方法; D.原單純形法以高斯消去法為基礎,并不是一種很經(jīng)濟的算法,故產生了改進單純形法,在減少迭代累計誤差的同時也提高了計算精度
?
?
29.AR模型平穩(wěn)性的判別方法有?
A.散點圖
B.單位根判別法
C.平穩(wěn)域判別法
D.自相關圖
BCD
A選項與平穩(wěn)性的判別無關,事實上時間序列的相關問題也很少使用散點圖來分析
?
?
30.根據(jù)麥肯錫問題分析方法,問題的三種類型包括:
A.恢復原狀型問題
B.問題解決型問題
C.防范潛在型問題
D.追求理想型問題
ACD
麥肯錫問題的三大類型:恢復原狀型、追求理想型、防范潛在型