阿里云大數(shù)據(jù)工程師(aca/acp)題庫和答案
1?.阿里云MaxCompute連接工具包含查詢編輯器MaxCompute控制臺、使用客戶端(odpscmd) 連接、DataWorks和MaxCompute Studio四種。其中哪一種需要手動安裝,適用于熟悉IntellJ IDEA工具的用戶?d
?
A. 查詢編輯器MaxCompute控制臺
B.使用客戶端(odpscmd) 連接
C. DataWorks連接
D. MaxCompute Studio
??
5、HDFS主要采用主從結(jié)構(gòu)模型,主節(jié)點負貴數(shù)據(jù)請求與元故照的保存以下法項中哪個節(jié)點負數(shù)數(shù)據(jù)存儲?a
A. NameNode
B. Jobtracker
C. DataNode
D. SecondaryNameNode
?
?6.海量的數(shù)據(jù)存儲是大數(shù)據(jù)應(yīng)用中面臨的重要問題,下面哪項技術(shù)或產(chǎn)品能解決海量數(shù)據(jù)存儲問題()d
??
A 阿里云的RDSMySQL數(shù)據(jù)庫
?B ?單機Redis數(shù)據(jù)庫
?C ?本地MySQL數(shù)據(jù)庫
?D ?分布式文件系統(tǒng)
??
7.有專家在總結(jié)人類科研方式的時候,指出人類一共歷經(jīng)了經(jīng)驗科學、理論科學,計算科科學四種科研方式,其中數(shù)據(jù)密集型科學的代表實驗是?c
?A.典型案例:伽利略球體落地實驗實驗
?B.典型案例:阿基米德浮力定律
?C.典型案例:超級計算機模擬核爆炸實驗
?D.?典型案例:大數(shù)據(jù)提速藥物研發(fā)的應(yīng)用
??
8.關(guān)系數(shù)據(jù)庫(Relational Database)數(shù)據(jù)按關(guān)系模型來組織的數(shù)據(jù)庫,主要用于存儲()。a
?A.結(jié)構(gòu)化數(shù)據(jù)
?B.半結(jié)構(gòu)化數(shù)據(jù)
?C.非結(jié)構(gòu)化數(shù)據(jù)
?D.結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)
??9.大數(shù)據(jù)開發(fā)的流程中,數(shù)據(jù)分析主要是發(fā)現(xiàn)隱藏在數(shù)據(jù)中的價值,下列關(guān)于數(shù)據(jù)分析的概念,描述正確的是?a
?A 常用的數(shù)據(jù)分析方法不包括傳統(tǒng)的分析算法
B 數(shù)據(jù)分析主要使用的是機器學習算法
C 數(shù)據(jù)分析是根據(jù)分析目的,用適當?shù)慕y(tǒng)計分析方法及工具,對收集來的數(shù)據(jù)進行處理與分
析,提取有價值的信息,發(fā)揮教據(jù)的作用
D 數(shù)據(jù)分析就是數(shù)據(jù)挖掘,只是說法不一樣,兩者在廣義與狹義中,表達的都是同一個意思
?
10機器學習PAI(Platform of Artificial Intelligence)是阿里云人工智能平臺,采用機器學習PAI平臺可視化構(gòu)建算法模型步驟,正確的是()a
A.新建工作空間一創(chuàng)建模型一關(guān)聯(lián)資源一操作工作流一效果預(yù)覽及發(fā)布
B.新建工作空間一關(guān)聯(lián)資源一操作工作流一創(chuàng)建模型一效果預(yù)覽及發(fā)布
C.新建工作空間一關(guān)聯(lián)資源一創(chuàng)建模型一操作工作流一效果預(yù)覽及發(fā)布
D.?新建工作空間一創(chuàng)建模型一操作工作流一關(guān)聯(lián)資源效果預(yù)覽及發(fā)布
11在數(shù)據(jù)可視化的圖表選擇中,下列選項中屬于時間序列型圖表的是?c
A.曲線圖
B.量化波形園
C.矩形狀圖
D.圓填充圖
12.使用DataV進行數(shù)據(jù)可視化開發(fā)的過程中,需要了解DataV的操作流程,下面哪一項屬于DataV正確的操作流程?b
A.準備工作一創(chuàng)建可視化應(yīng)用一添加并配置可視化組件-調(diào)整組件圖層位置一預(yù)覽并發(fā)布可視化應(yīng)用
B.準備工作一創(chuàng)建可視化應(yīng)用一調(diào)整組件圖層位置一添加井配置可視化組件一預(yù)覽并發(fā)布可視化應(yīng)用
C.添加井配置可視化組件一準備工作一調(diào)整組件圖層位置一預(yù)覽并發(fā)布可視化應(yīng)用
D.?準備工作一調(diào)整組件圖層位置一創(chuàng)建可視化應(yīng)用一添加并配置可視化組件一預(yù)覽并發(fā)布可視化應(yīng)用
13.數(shù)據(jù)可視化可以通過圖表更容易對數(shù)據(jù)進行分類、排序顯示,這體現(xiàn)了數(shù)據(jù)可視化的哪個優(yōu)勢?b
A.傳播速度快
B.數(shù)據(jù)更直觀
C.多維展示
D.容易記憶
?14.Quick Bl可以提供海量數(shù)據(jù)實時在線分析服務(wù),支持()和豐富的可視化效果,幫助用戶輕松自如地完成數(shù)據(jù)分析、業(yè)務(wù)數(shù)據(jù)探查、報表制作等工作。a
?A.拖拽式操作
?B.點擊式操作
?C.后臺調(diào)用操作
?D.?語音式操作
?15.在大數(shù)據(jù)開發(fā)的流程中,以下哪個選項符合數(shù)據(jù)挖掘的概念?d
?A.數(shù)據(jù)分析就是數(shù)據(jù)挖掘,只是說法不一樣,兩者在廣義與狹義中,表達的都是同一個意思
?B.從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程
?C.將異構(gòu)數(shù)據(jù)源的數(shù)據(jù)匯集在一起
?d從大量的數(shù)據(jù)中剔除含噪聲的數(shù)據(jù)
??
21.Spark最早是源于加州大學伯克利分校的Matei Zaharia等人發(fā)表的一篇論文,論文提出了一種()的概念。c
?A.分布式并行計算
?B.分布式文件系統(tǒng)
C.分布式彈性數(shù)據(jù)集(RDD)
D.?分布式微服務(wù)
??
22.存儲數(shù)據(jù)的結(jié)構(gòu)可以分為:結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。下列選項中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是?cd
?A.JSON文檔
?B.XML文檔
?C.日志文件
?D.圖片
?23 Apache Spark核心組件包含: Spark Streaming, Spark SQL. Spark Core, GraphX, Mub下列
?哪個選項是對GraphX組件的描述?()b
?A.提供流計算組件
?B.是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件
?C.基于內(nèi)存多語言執(zhí)行的核心引擎
?D.是一個分布式圖處理框架.它基于Spark平臺提供對圖計算和圖挖掘易用且簡潔的一個子系統(tǒng)
?24.Pig是Hadoop生態(tài)圈的組件之一,Pig的數(shù)據(jù)處理語言采取()方式,一步一步地進行處理。a
?A.數(shù)據(jù)流
?B.并行計算
?C.分布式計算
?D.?分布式協(xié)調(diào)服務(wù)
??
16.MaxCompute支持流式數(shù)據(jù)實時寫入并在數(shù)據(jù)倉庫中開展分析。高性能秒級彈性并發(fā)查詢,滿足近實時分析場景需求。體現(xiàn)了MaxCompute在大數(shù)據(jù)處理與分析中的什么作用?c
?A.彈性能力與擴展型
?B.集成AI能力
?C.支持流式采集和近實時分析
?D.數(shù)據(jù)存儲能力
??
20以下選項中屬于分布式文件系統(tǒng),且適合運行在通用硬件上的是()a
?A. HDFS
?B. Oracle
?C.MySQL
D.?Redis
?21通過選擇替代的、較小的數(shù)據(jù)表示形式來減少數(shù)據(jù)量。它可以分為有參方法和無參方法,有參方法一般使用回歸和對數(shù)的線性模型存儲參數(shù)。無參方法一般有直方圖、聚類、抽樣和數(shù)據(jù)立方體聚集等方法。該描述體現(xiàn)了在數(shù)據(jù)預(yù)處理中的哪一種策略?d
A.數(shù)據(jù)立方體
B.維規(guī)約
C.數(shù)據(jù)壓縮
D.數(shù)據(jù)歸約
E.離散化和概念分層生產(chǎn)
?
22.Hologres基于行存表的主鍵索引和查詢引擎的短路徑優(yōu)化,支持每秒數(shù)十萬QPS高性能服務(wù)型點查支持高吞吐更新,相比開源系統(tǒng)性能提升10倍以上,體現(xiàn)了Hologres在大數(shù)據(jù)處理與分析中的什么作用?b
A.亞秒級交互式分析(OLAP)
B.聯(lián)邦查詢,外表加速(Federation)
C.高性能主鍵點查(Serving)
E.?聯(lián)機事務(wù)處理(OLTP)
?這只是部分題庫,須要完整的,請加? ?zgycsmb