機(jī)器學(xué)習(xí)課后題
第一講測驗(yàn)
1下面哪種方法屬于機(jī)器學(xué)習(xí)?( ?)(多選3 分).
A.在貓狗分類問題中,先將貓與狗的特點(diǎn)總結(jié)出來,再告訴機(jī)器,如果符合貓的特點(diǎn),則判定為貓,如果符合狗的特點(diǎn),則判定為狗。(錯(cuò)誤答案)
B.將大量名畫的真品與贗品輸入計(jì)算機(jī),讓計(jì)算機(jī)自己從數(shù)據(jù)中學(xué)習(xí)出一個(gè)模型用來判斷是真品還是贗品。(正確答案)
C.讓計(jì)算機(jī)通過對以往的房價(jià)數(shù)據(jù)進(jìn)行分析,預(yù)測未來房價(jià)走勢。(正確答案)
D.通過人為編寫好代碼,符合條件則判定為人臉,否則不是人臉,從而制作出人臉識(shí)別系統(tǒng)。(錯(cuò)誤答案)
?
2現(xiàn)在手頭上有大量的貓與狗的圖片,需訓(xùn)練出一個(gè)模型,能夠區(qū)別出這張圖片是貓還是狗,這是一個(gè)什么問題?(單選2 分).
A.回歸(錯(cuò)誤答案)
B.分類(正確答案)
C.聚類(錯(cuò)誤答案)
D.以上都不是(錯(cuò)誤答案)
?
3現(xiàn)在手頭上有大量的動(dòng)物的圖片,為了方便處理,我們想讓同一種動(dòng)物的圖片放到同一個(gè)文件夾,這是一個(gè)什么問題?(多選3 分).
A.聚類(正確答案)
B.回歸(錯(cuò)誤答案)
C.分類(錯(cuò)誤答案)
D.無監(jiān)督學(xué)習(xí)(正確答案)
?
4在無人駕駛時(shí),希望程序能夠根據(jù)路況決策汽車的方向盤的旋轉(zhuǎn)角度,那么該任務(wù)是?
(單選2 分).
A.分類(錯(cuò)誤答案)
B.回歸(正確答案)
C.聚類(錯(cuò)誤答案)
D.降維(錯(cuò)誤答案)
?
5舉個(gè)例子,假設(shè)西瓜的好壞由“色澤”,“根蒂”以及“敲聲”決定,且"色澤"、"根蒂"和"敲聲"分別有3、2、2 種可能取值,那么假設(shè)空間的規(guī)模大小為( ??????)。(填空2 分)
數(shù)值精確:37
?
第二講測驗(yàn)
1識(shí)別任務(wù)中,召回率是被預(yù)測為“正面”的測試數(shù)據(jù)中結(jié)果是正確的比例。(判斷2 分)
A.正確(錯(cuò)誤答案)
B.錯(cuò)誤(正確答案)
?
解析: 識(shí)別任務(wù)中,精確度是被預(yù)測為“正面”的測試數(shù)據(jù)中結(jié)果是正確的比例,召回率是標(biāo)簽為“正面”的測試數(shù)據(jù)中預(yù)測正確的比例。
?
2不平衡問題的領(lǐng)域有?(多選3 分).
A.醫(yī)學(xué)診斷(正確答案)
B.預(yù)測罕見事件(正確答案)
C.檢測欺詐(正確答案)
D.預(yù)測故障/失效(正確答案)
?
3下面正確的是( ??)(單選2 分)
A.將手頭上所有的數(shù)據(jù)拿來訓(xùn)練模型,預(yù)測結(jié)果正確率最高的模型就是我們所要選的模型。
(錯(cuò)誤答案)
B.將所有數(shù)據(jù)中的前百分之70拿來訓(xùn)練模型,剩下的百分之30作為測試集,預(yù)測結(jié)果正確率最高的模型就是我們所要選的模型。(錯(cuò)誤答案)
C.將所有數(shù)據(jù)先隨機(jī)打亂順序,一半用來訓(xùn)練模型,一半作為測試集,預(yù)測結(jié)果正確率最高的模型就是我們所要選的模型。(錯(cuò)誤答案)
D.將所有數(shù)據(jù)先隨機(jī)打亂順序,百分之80用來訓(xùn)練模型,剩下的百分之20作為測試集,預(yù)測結(jié)果正確率最高的模型就是我們所要選的模型。(正確答案)
?
4如果一個(gè)模型在訓(xùn)練集上正確率為99%,測試集上正確率為60%。我們應(yīng)該怎么做( ???)。(多選3 分)
A.加入正則化項(xiàng)(正確答案)
B.增加訓(xùn)練樣本數(shù)量(正確答案)
C.增加模型復(fù)雜度(錯(cuò)誤答案)
D.減少模型復(fù)雜度(正確答案)
?
5如果一個(gè)模型,它在訓(xùn)練集上正確率為85%,測試集上正確率為80%,則模型是過擬合還是欠擬合( ???),其中,來自于偏差的誤差為( ???),來自方差的誤差為( ??????)。
(單選2 分)
A.欠擬合,5%,5%(錯(cuò)誤答案)
B.欠擬合,15%,5%(正確答案)
C.過擬合,15%,15%(錯(cuò)誤答案)
D.過擬合,5%,5%(錯(cuò)誤答案)
?
6假設(shè),我們現(xiàn)在利用5折交叉驗(yàn)證的方法來確定模型的超參數(shù),一共有4組超參數(shù),我們可以知道,5折交叉驗(yàn)證,每一組超參數(shù)將會(huì)得到5個(gè)子模型的性能評分,假設(shè)評分如下,我們應(yīng)該選擇哪組超參數(shù)( ????)。(單選2 分)
A.子模型1:0.8 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5(錯(cuò)誤答案)
B.子模型1:0.9 子模型2:0.7 子模型3:0.8 子模型4:0.6 子模型5:0.5(錯(cuò)誤答案)
C.子模型1:0.5 子模型2:0.6 子模型3:0.7 子模型4:0.6 子模型5:0.5(錯(cuò)誤答案)
D.子模型1:0.8 子模型2:0.8 子模型3:0.8 子模型4:0.8 子模型5:0.6(正確答案)
?
第三講測驗(yàn)
1下列兩個(gè)變量之間的關(guān)系,哪個(gè)是函數(shù)關(guān)系(單選2 分).
A.學(xué)生的性別與數(shù)學(xué)成績(錯(cuò)誤答案)
B.人的工作環(huán)境與健康狀況(錯(cuò)誤答案)
C.正方形的邊長與面積(正確答案)
D.兒子的身高與父親的身高(錯(cuò)誤答案)
?
2下面屬于多元線性回歸的是( ??)。(多選3 分)
A.求得正方形面積與對角線之間的關(guān)系。(錯(cuò)誤答案)
B.建立股票價(jià)格與成交量、換手率等因素之間的線性關(guān)系。(正確答案)
C.建立西瓜價(jià)格與西瓜大小、西瓜產(chǎn)地、甜度等因素之間的線性關(guān)系。(正確答案)
D.建立西瓜書銷量與時(shí)間之間的線性關(guān)系。(錯(cuò)誤答案)
?
第四講測驗(yàn)
?
1支持向量分類器的判斷規(guī)則只由訓(xùn)練觀測的一部分(支持向量)確定。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
2支持向量機(jī)通過使用核函數(shù)來擴(kuò)大特征空間。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
3支持向量機(jī)可看作是一類簡單、直觀的最大間隔分類器的推廣。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
4怎樣理解非完美分類的超平面分類器?(單選2 分)
A.允許小部分訓(xùn)練觀測被誤分。(正確答案)
B.允許大部分訓(xùn)練觀測被誤分。(錯(cuò)誤答案)
C.兩種說法都對。(錯(cuò)誤答案)
D.兩種說法都不對。(錯(cuò)誤答案)
?
5?SVM算法的性能取決于?(單選2 分)
A.核函數(shù)的選擇(錯(cuò)誤答案)
B.核函數(shù)的參數(shù)(錯(cuò)誤答案)
C.軟間隔參數(shù)C(錯(cuò)誤答案)
D.以上都是(正確答案)
?
6?SVM算法的最小時(shí)間復(fù)雜度是O(n*n)?;谶@一點(diǎn),以下哪種規(guī)格的數(shù)據(jù)集并不適用于該算法?(單選2 分)
A.大數(shù)據(jù)集(正確答案)
B.小數(shù)據(jù)集(錯(cuò)誤答案)
C.中數(shù)據(jù)集(錯(cuò)誤答案)
D.不受數(shù)據(jù)集大小的影響(錯(cuò)誤答案)
?
7支持向量是最靠近決策表面的數(shù)據(jù)點(diǎn)。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
8常用的核函數(shù)有?(多選3 分)
A.線性核(正確答案)
B.徑向核(正確答案)
C.拉普拉斯核(正確答案)
D.Sigmoid核(正確答案)
?
9下面哪些是SVM在實(shí)際生活中的應(yīng)用?(多選3 分)
A.文本分類(正確答案)
B.圖片分類(正確答案)
C.新聞聚類(正確答案)
D.手寫字體識(shí)別(正確答案)
?
10假定現(xiàn)在有一個(gè)四分類問題,你要用One-vs-all策略訓(xùn)練一個(gè)SVM的模型,你需要訓(xùn)練幾個(gè)SVM模型?(單選2 分)
A.1(錯(cuò)誤答案)
B.2(錯(cuò)誤答案)
C.3(錯(cuò)誤答案)
D.4(正確答案)
?
第五講測驗(yàn)
1我們要用概率模型對數(shù)據(jù)和標(biāo)簽進(jìn)行學(xué)習(xí),需要數(shù)據(jù)/標(biāo)簽對服從某種概率分布,稱為 ??????????????????。(填空2 分)
文字模糊:數(shù)據(jù)生成分布
?
2樹的內(nèi)部結(jié)點(diǎn)用特征作標(biāo)簽,樹枝用是否符合特征來標(biāo)簽。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
3過擬合發(fā)生在模型太過偏向訓(xùn)練數(shù)據(jù)時(shí),對于決策樹可以采用修剪的方法阻止過擬合。
(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
4在構(gòu)建決策樹時(shí),需要計(jì)算每個(gè)用來劃分?jǐn)?shù)據(jù)特征的得分,選擇分?jǐn)?shù)最高的特征,以下可以作為得分的是?(單選2 分)
A.熵(錯(cuò)誤答案)
B.基尼系數(shù)(錯(cuò)誤答案)
C.訓(xùn)練誤差(錯(cuò)誤答案)
D.以上都是(正確答案)
?
5對于實(shí)值特征,可以用比較測試將數(shù)據(jù)劃分為兩部分,或者選擇范圍過濾。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
6決策樹的節(jié)點(diǎn)有兩種類型:內(nèi)部節(jié)點(diǎn)和葉節(jié)點(diǎn)。內(nèi)部節(jié)點(diǎn)表示一個(gè)特征或?qū)傩裕~節(jié)點(diǎn)表示一個(gè)類。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
7在決策樹學(xué)習(xí)中將已生成的樹進(jìn)行簡化的過程稱為 ???????????????。(填空2 分)
文字精確:剪枝 ?或 ?修剪
?
8在決策樹學(xué)習(xí)過程中,哪些情況可能會(huì)導(dǎo)致問題數(shù)據(jù)(特征相同但是標(biāo)簽不同)?
(單選2 分)
A.數(shù)據(jù)錯(cuò)誤(錯(cuò)誤答案)
B.數(shù)據(jù)有噪音(錯(cuò)誤答案)
C.現(xiàn)有的特征不足以區(qū)分或決策(錯(cuò)誤答案)
D.以上都是(正確答案)
?
9過擬合發(fā)生在模型太過偏向訓(xùn)練數(shù)據(jù)時(shí)。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
10決策樹的修剪可以采用正則化的方法。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
11在構(gòu)建決策樹時(shí),以下屬于處理有多個(gè)值的特征的方法的是(單選2 分)
A.處理成多個(gè)二值劃分(錯(cuò)誤答案)
B.處理成多個(gè)劃分(錯(cuò)誤答案)
C.以上都是(正確答案)
D.以上都不是(錯(cuò)誤答案)
?
12在構(gòu)建決策樹時(shí),以下屬于處理實(shí)值特征的方法的是(多選3 分)
A.用比較測試將數(shù)據(jù)劃分為兩個(gè)部分(正確答案)
B.處理成多個(gè)二值劃分(錯(cuò)誤答案)
C.選擇范圍過濾(正確答案)
D.以上都不是(錯(cuò)誤答案)
?
13在下列哪些情況下可以為標(biāo)簽創(chuàng)建葉節(jié)點(diǎn)。(多選3 分)
A.達(dá)到一個(gè)足夠小的訓(xùn)練誤差(正確答案)
B.剩下一定數(shù)量/比例的數(shù)據(jù)(正確答案)
C.所有數(shù)據(jù)屬于同一個(gè)類(正確答案)
D.所有數(shù)據(jù)具有相同的特征值(正確答案)
?
第六講測試
1通過梯度下降的原理,求損失函數(shù)的極小值來對模型進(jìn)行優(yōu)化是在訓(xùn)練集上進(jìn)行的。
(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
2增加訓(xùn)練數(shù)據(jù)會(huì)導(dǎo)致以下哪些結(jié)果?(多選3 分)
A.減小方差(正確答案)
B.增大方差(錯(cuò)誤答案)
C.向右移動(dòng)最優(yōu)復(fù)雜度(正確答案)
D.向左移動(dòng)最優(yōu)復(fù)雜度(錯(cuò)誤答案)
?
3與采用權(quán)重的和作為正則化項(xiàng)相比,采用權(quán)重的平方和作為正則化項(xiàng)會(huì)給予權(quán)重的較大值更多的懲罰。(判斷2 分)
A.正確(正確答案)
?
?
B.錯(cuò)誤(錯(cuò)誤答案)
4基于模型的機(jī)器學(xué)習(xí)包括以下步驟:1、選擇一個(gè)優(yōu)化標(biāo)準(zhǔn)(即目標(biāo)函數(shù)),2、建立一個(gè)學(xué)習(xí)算法,3、選擇一個(gè)模型。則正確步驟為(單選2 分)
A.213(錯(cuò)誤答案)
B.312(正確答案)
C.321(錯(cuò)誤答案)
D.123(錯(cuò)誤答案)
5通過梯度下降法最小化訓(xùn)練集的損失函數(shù)得到的參數(shù)一般不會(huì)使測試集也最小。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
6隨著分類器復(fù)雜度逐漸增加,測試集上的誤差/損失會(huì)呈現(xiàn)先下降后上升的趨勢。
(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
7
隨著模型復(fù)雜度逐漸增加,訓(xùn)練集的偏差平方和方差分別會(huì)如何變化?(單選2 分)
A.增加,減少(錯(cuò)誤答案)
B.減少,增加(正確答案)
C.增加,增加(錯(cuò)誤答案)
D.減少,減少(錯(cuò)誤答案)
8
正則化項(xiàng)時(shí)損失函數(shù)的附加標(biāo)準(zhǔn),以確保不會(huì)過擬合。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
9引入正則化項(xiàng)可以懲罰較大的權(quán)重。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
10?L1正則化往往會(huì)導(dǎo)致稀疏解決方案(大量零權(quán)重)。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
第七講測試
?
1非線性機(jī)器學(xué)習(xí)算法具有以下的什么特性?(單選2 分)
A.針對難以用準(zhǔn)則來描述的復(fù)雜模型(錯(cuò)誤答案)
B.能夠達(dá)到更深層次的抽象(錯(cuò)誤答案)
C.能夠進(jìn)行廣泛使用的分類算法(錯(cuò)誤答案)
D.以上都是(正確答案)
?
2單層感知器能對線形可分的數(shù)據(jù)集進(jìn)行分類,能解決邏輯問題異或。(判斷2 分)
A.正確(錯(cuò)誤答案)
B.錯(cuò)誤(正確答案)
?
3前饋神經(jīng)網(wǎng)絡(luò)中偏置單元可以有輸入。(判斷2 分)
A.正確(錯(cuò)誤答案)
B.錯(cuò)誤(正確答案)
?
4使用均方誤差作為代價(jià)函數(shù),有什么特點(diǎn)?(多選3 分)
A.形式簡單(正確答案)
B.通俗易懂(正確答案)
C.容易出現(xiàn)飽和現(xiàn)象(正確答案)
D.容易陷入局部最優(yōu)解(正確答案)
?
5在某種意思上,小批量梯度下降算法是以迭代次數(shù)換取算法的運(yùn)行速度。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
6神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元有兩個(gè)狀態(tài):興奮、抑制。這兩個(gè)狀態(tài)由閾值決定。(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
7感知器可以解決一下哪些問題?(多選3 分)
A.實(shí)現(xiàn)邏輯關(guān)系中的與(正確答案)
B.實(shí)現(xiàn)邏輯關(guān)系中的或(正確答案)
C.實(shí)現(xiàn)邏輯關(guān)系中的非(正確答案)
D.線性分類和線性回歸問題(正確答案)
?
8神經(jīng)網(wǎng)絡(luò)具有下面哪幾個(gè)特點(diǎn)?(多選3 分)
A.能充分逼近復(fù)雜的非線性關(guān)系(正確答案)
B.具有高度的容錯(cuò)能力(正確答案)
C.具有自組織能力(正確答案)
D.可以并行分布處理(正確答案)
?
9前饋式神經(jīng)網(wǎng)絡(luò)層間有反饋。(判斷2 分)
A.正確(錯(cuò)誤答案)
B.錯(cuò)誤(正確答案)
?
10在 ???????????????????模型中,每個(gè)神經(jīng)元同時(shí)將自身的輸出作為輸入信號反饋給其他神經(jīng)元(填空2 分)
文字模糊:反饋神經(jīng)網(wǎng)絡(luò)
?
11神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)步驟包括:1、求得權(quán)重等參數(shù),2、定義代價(jià)函數(shù),3、對測試數(shù)據(jù)進(jìn)行預(yù)測,4、根據(jù)樣本數(shù)據(jù)和標(biāo)簽采用梯度下降法進(jìn)行學(xué)習(xí),步驟的正確順序?yàn)椋海▎芜x2 分)
A.4213(錯(cuò)誤答案)
B.2413(正確答案)
C.2143(錯(cuò)誤答案)
D.4123(錯(cuò)誤答案)
?
12以下會(huì)造成梯度消失的激活函數(shù)有(多選3 分).
A.sigmoid函數(shù)(正確答案)
B.tanh函數(shù)(正確答案)
C.ReLU函數(shù)(錯(cuò)誤答案)
D.softplus函數(shù)(錯(cuò)誤答案)
?
13小批量梯度下降法在迭代的每一步中,參數(shù)的更新只用了小批量樣本的信息(判斷2 分).
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
14小批量梯度下降法和隨機(jī)梯度下降算法收斂可能需要更多的迭代次數(shù)(判斷2 分)
A.正確(正確答案)
B.錯(cuò)誤(錯(cuò)誤答案)
?
?
?