阿里云大數(shù)據(jù)助理工程師認(rèn)證ACA學(xué)習(xí)筆記和真題
阿里云大數(shù)據(jù)助理工程師認(rèn)證ACA學(xué)習(xí)筆記和真題
1?某大型企業(yè)計(jì)劃使用MaxCompute對(duì)本公司的數(shù)據(jù)進(jìn)行加工和分析,預(yù)計(jì)該項(xiàng)目會(huì)有上萬(wàn)個(gè)表、數(shù)干個(gè)本題分信任務(wù),同時(shí)有近4人的團(tuán)隊(duì)負(fù)責(zé)該項(xiàng)目的建設(shè)和運(yùn)維。從工程角度出發(fā),?()可以大大減少項(xiàng)目管理和建設(shè)的成本。
A,使用DataWorks
B,直接在MaxCompute上開(kāi)發(fā),使用腳本定時(shí)調(diào)度任務(wù)
C 使用eclipse
D.自己研究開(kāi)發(fā)一個(gè)平臺(tái),茍衛(wèi)氓該項(xiàng)目
A
2 ?DataV在制作可視化大屏時(shí),基本的交互式操作時(shí)通過(guò)()?實(shí)現(xiàn)的。
?A,?回調(diào)lD
?B.大屏觸摸
?C,系統(tǒng)時(shí)間參數(shù)
D,暫時(shí)不支持交互
A
3某公司采用阿里云DataWorks實(shí)現(xiàn)了數(shù)據(jù)分析的功能,因?yàn)闃I(yè)務(wù)變化而調(diào)整了某數(shù)據(jù)表的表結(jié)構(gòu),業(yè)務(wù)人員需要了解哪些相關(guān)表格受到了影響。此時(shí)可以采用DataWorks的( )解決這個(gè)問(wèn)題。
O A. 個(gè)性化的數(shù)據(jù)收藏功能
O B. 靈活的角色管理、數(shù)據(jù)授權(quán)管理功能
O C. 數(shù)據(jù)處理代碼的版本管理功能
O D. 可視化的血緣分析功能
D
4 ?在DataWorks中,( )是指使用系統(tǒng)或計(jì)算資源的客戶(hù),即公司。
O A. DataWorks項(xiàng)目
O B. MaxCompute項(xiàng)目空間
。C.組織
O D.個(gè)人賬號(hào)
C
5 ?DataWorks調(diào)度配置中可以設(shè)置重跑和“?出錯(cuò)自動(dòng)重跑'?,當(dāng)重跑'屬性設(shè)置為以下哪種時(shí),?“出錯(cuò)自動(dòng)重跑'屬性不會(huì)顯示出來(lái)?
A.運(yùn)行成功或失敗后皆可重跑
?B.運(yùn)行成功后不可重跑
?C.運(yùn)行失敗后可以重跑
?D.運(yùn)行成功或失敗后皆不可重跑
D
6 ?DataWorks是阿里云重要的PaaS平臺(tái)產(chǎn)品,為您提供數(shù)據(jù)集成、數(shù)據(jù)開(kāi)發(fā)、數(shù)據(jù)地圖、數(shù)據(jù)質(zhì)量和數(shù)據(jù)服務(wù)等全方位的產(chǎn)品服務(wù),以下屬于DataWorks使用場(chǎng)景的是?
A,存儲(chǔ)海量的數(shù)據(jù),進(jìn)行數(shù)據(jù)的清洗
B,使用DataWorks, 對(duì)數(shù)據(jù)進(jìn)行傳輸、轉(zhuǎn)換和集成等操作,從不同的數(shù)據(jù)存儲(chǔ)引入數(shù)據(jù),并進(jìn)行轉(zhuǎn)化和開(kāi)發(fā)
C.對(duì)數(shù)據(jù)進(jìn)行離線(xiàn)計(jì)算
D.直接把計(jì)算的結(jié)果顯示出來(lái)
B
7 ?DataV數(shù)據(jù)可視化是使用可視化應(yīng)用的方式來(lái)分析并展示龐雜數(shù)據(jù)的產(chǎn)品,以下哪個(gè)應(yīng)用場(chǎng)景不是使用DataV可以實(shí)現(xiàn)的?
O A.開(kāi)發(fā)天貓雙11、阿里云城市大腦同款數(shù)據(jù)可視化應(yīng)用
O B. 開(kāi)發(fā)工業(yè)級(jí)的數(shù)據(jù)可視化項(xiàng)目
O C. 搭建專(zhuān)業(yè)級(jí)地理信息可視化應(yīng)用
。D. 搭建企業(yè)級(jí)數(shù)據(jù)分析平臺(tái)
D
8 ?按照學(xué)習(xí)方式不同進(jìn)行分類(lèi),?以下哪個(gè)不屬于機(jī)器學(xué)習(xí)的分類(lèi)?
?A.監(jiān)督學(xué)習(xí)
?B.無(wú)監(jiān)督學(xué)習(xí)
?C ,半監(jiān)督學(xué)習(xí)
D.全監(jiān)督學(xué)習(xí)
D
9 ?機(jī)器學(xué)習(xí)PAI (Platform of Artificial Intelligence) 是阿里云人工智能平臺(tái),提供—站式的機(jī)器學(xué)習(xí)解決方案。以下哪個(gè)不屬于機(jī)器學(xué)習(xí)平臺(tái)PAI 的基礎(chǔ)設(shè)施?
?A.CPU集群
?B.GPU集群
?C. 自建集群
D . FPGA集群
C
單18.DataV制作的大屏通過(guò)()可以把作品嵌入到企業(yè)已有的門(mén)戶(hù)中去.
OA.發(fā)布后的url
O B.預(yù)覽時(shí)的url
O C.發(fā)布后得到的MD5碼
OD.發(fā)布后導(dǎo)出的JAR包
A
?10 阿里云Quick Bl報(bào)表工具支持多種數(shù)據(jù)源,方便用戶(hù)基于自己來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行分析和展現(xiàn)。目前還不支持()作為數(shù)據(jù)源。
A.API調(diào)用返回結(jié)果
B. MaxCompute
C.本地Excel文件
D.MySQL版RDS
A
單選17 組織管理是Quick BI提供的功能,為用戶(hù)提供了數(shù)據(jù)協(xié)同開(kāi)發(fā)的能力。以下關(guān)于組織管理的描述錯(cuò)誤的是?
O A.組織成員管理工作就是負(fù)責(zé)把需要在該組織中進(jìn)行協(xié)同工作的阿里云用戶(hù)加到組織中
O B.在組織層面,只有兩種組織角色:組織管理員和普通用戶(hù)
O C. 組織創(chuàng)建者默認(rèn)就是組織管理員
O D. 普通用戶(hù)可以訪(fǎng)問(wèn)組織成員管理功能模塊
D
單選21 . DataWorks中提供了簡(jiǎn)單模式和標(biāo)準(zhǔn)模式兩種工作空間模式。關(guān)于兩種模式,以下描述哪個(gè)是錯(cuò)誤的?
O A. 簡(jiǎn)單模式是指-個(gè)Dataworks工作空間對(duì)應(yīng)一個(gè)MaxCompute項(xiàng)目
O B. 標(biāo)準(zhǔn)模式是指-個(gè)Dataworks工作空間對(duì)應(yīng)兩個(gè)MaxCompute項(xiàng)目
●C. 簡(jiǎn)單模式可以升級(jí)為標(biāo)準(zhǔn)模式;標(biāo)準(zhǔn)模式也可降級(jí)為簡(jiǎn)單模式
O D. 標(biāo)準(zhǔn)模式下,開(kāi)發(fā)環(huán)境默認(rèn)不開(kāi)啟任務(wù)調(diào)度,避免開(kāi)發(fā)環(huán)境的任務(wù)周期運(yùn)行時(shí),和生產(chǎn)環(huán)境的任務(wù)搶奪資源
C
2.DataWorks數(shù)據(jù)集成主要用于離線(xiàn)(批量)數(shù)據(jù)同步。下列關(guān)于離線(xiàn)同步說(shuō)法正確的是?
A.只能實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)源的傳輸(結(jié)構(gòu)化(例如RDS、DRDS等)、半結(jié)構(gòu)化、無(wú)結(jié)構(gòu)化)
?B.只支持關(guān)系型數(shù)據(jù)庫(kù)MySQL,ROS等
?C.?dāng)?shù)據(jù)集成不僅完成數(shù)據(jù)同步(傳輸),還提供數(shù)據(jù)流的消費(fèi)方式
?D.離線(xiàn)數(shù)據(jù)同步主要由三部分組成:?Reader , Channel, Writer
D
I 單選I 35.MaxCompute的連接使用方式有多種,其中可以配置依賴(lài)、調(diào)度的方式是( )。
O A. 使用DataWorks
。B. 使用Intelij IDEA
。C. 使用MaxCompute Console
O D.目前暫無(wú)工具支持
A
22.MaxCompute架構(gòu)由四層組成,每一層完成不同的工作。現(xiàn)在執(zhí)行命令"select count(*) from table_a",最終由()處理該命令并返回結(jié)果。
A.計(jì)算層
?B .客戶(hù)端
C?.接入層
?D .邏輯層
A
23?關(guān)于MaxCompute SQL中分區(qū)的說(shuō)法,以下錯(cuò)誤的是哪一項(xiàng)?
0 A.使用MaxCompute SQL添加分區(qū)時(shí),- -次只能添加個(gè)分區(qū)
0 B. 使用MaxCompute SQL刪除分區(qū)時(shí),-次可以刪除多個(gè)分區(qū)
0 C. 對(duì)于多級(jí)分區(qū)的表,如果需要添加新的分區(qū),必須指明全部的分區(qū)值。
O D.添加分區(qū)時(shí),如果未指定IF NOT EXISTS而同名的分區(qū)已存在,則返回報(bào)錯(cuò)。
A
24.大數(shù)據(jù)面臨著一些技術(shù)性難題,其中一個(gè)是海量數(shù)據(jù)的存儲(chǔ),目前主流的處理方式是通過(guò)()來(lái)解決。
。A. 共享存儲(chǔ)系統(tǒng)
O B. 分布式存儲(chǔ)系統(tǒng)
O C. 網(wǎng)絡(luò)文件系統(tǒng)
O D.本地文件系統(tǒng)
b
單選25?.阿里云大數(shù)據(jù)體系由多個(gè)大數(shù)據(jù)組件組成,下列技術(shù)中,哪一個(gè)屬于阿里云大數(shù)據(jù)體系?
O A. Yarn
O B. ZooKeeper
O C. Pig
O D. DataWorks
d
26大數(shù)據(jù)存儲(chǔ)一般采用的是分布式存儲(chǔ)技術(shù),以下關(guān)于分布式存儲(chǔ)說(shuō)法正確的是?
O A. Hadoop的分布式存儲(chǔ)技術(shù)是GFS
O B. 分布式存儲(chǔ)要求底層有多臺(tái)高性能存儲(chǔ)服務(wù)器
o C. 分布式存儲(chǔ)實(shí)現(xiàn)數(shù)據(jù)冗余,提高了數(shù)據(jù)的安全性
O D. 分布式存儲(chǔ)方式無(wú)法存儲(chǔ)傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)
c
27?使用DataWorks進(jìn)行購(gòu)野開(kāi)發(fā)時(shí),可以創(chuàng)建不同的任務(wù)。如果某任務(wù)內(nèi)需要多節(jié)點(diǎn)配合并包含表示依賴(lài)關(guān)系的連線(xiàn)則該任務(wù)的類(lèi)型是()。
O A.?節(jié)點(diǎn)任務(wù)
?B .?工作流任務(wù)
o c .?多節(jié)點(diǎn)任務(wù)
?D .?多工作流任務(wù)
B
28.MaxCompute中荀曬由皿表方法,?一種船吏用AS ,?一種是使用LIKE ,?即create table?new_table_name as/like ... 。關(guān)千這兩種方式的說(shuō)法中正確的是().
A.?使用as能根據(jù)其后的SQL帶入數(shù)據(jù)到新建的表中,?使用like只能建空表
?B .使用as能保留源表的分區(qū)屬性,?但是無(wú)法保留lifecycle屬性
C?.?使用like能保留源表的所有屬性,?包括llfeccycle、注釋、分區(qū)等
D?.?使用like可以依賴(lài)千多張洹表,?使用as只能依賴(lài)千一張表
A
29 .MaxCompute中的表t dml中僅包含一個(gè)字段id,類(lèi)型為string.以下SQL中肯定會(huì)報(bào)錯(cuò)的是()。
O A. insert into table t dml values(2) ;
O B. insert overwrite tablet _dml select 3.14 from dual;
O C. create table t _dml bak like t dml;
O D. create table t _dml bak as select fromt dml;
A
1 多選| 4.在MaxCompute SQL中可以通過(guò)命令清空表中已有的數(shù)據(jù),以下命令正確的包括() .
口A. 對(duì)非分區(qū)表truncate table table name;
O B. 對(duì)分區(qū)表truncate table table name;
0 C. 對(duì)分區(qū)表alter table table. name drop partition;
口D.對(duì)所有表drop table table name;
AC
都是原題,這只是其中的一部分題庫(kù),想要更多的題庫(kù),可加weixin ?zgycsmb
多選40 .阿里云機(jī)器學(xué)習(xí)PAI支持多種常見(jiàn)的算法,以下算法中屬于分類(lèi)算法的有()。
O A. KNN
0 B. RandomForest
O C. K-Means
O D. DBSCAN
AB

?