绪论 单元测试

1、 问题:下列对大数据的特点描述不正确的是( )
选项:
A:数据体量巨大
B:速度要求快
C:数据类型多样
D:价值密度高
答案: 【
价值密度高

第一章 单元测试

1、 问题:云主机和物理机的寿命都是永久性的。( )
选项:
A:对
B:错
答案: 【

2、 问题:对于实时性要求高的应用,需要应用实时处理架构。( )
选项:
A:对
B:错
答案: 【

3、 问题:数据仓库是用来存储数据的而不是分析数据的。( )
选项:
A:对
B:错
答案: 【

4、 问题:在DWS层中,用户行为日志数据分为公共字段和事件字段。( )
选项:
A:对
B:错
答案: 【

5、 问题:项目实施流程中没有哪一步( )
选项:
A:下载数据
B:数据仓库设计开发
C:数据导出
D:数据访问
答案: 【
下载数据

6、 问题:数据分析在企业中的作用( )
选项:
A:帮助企业经营者平衡企业的收益
B:干预经营者的决策
C:直接的获取经营的利润
D:帮助企业经营者减少投入
答案: 【
直接的获取经营的利润

7、 问题:数据结构中哪项不是页面入口的来源( )
选项:
A:应用首页
B:登录页
C:push
D:详情页
答案: 【
登录页

8、 问题:Hadoop的三大发行版本是 ( )
选项:
A:Apache
B:CDH
C:HDP
D:Java
答案: 【
Apache
CDH
HDP

9、 问题:流量分析常见指标有哪些方面 ( )
选项:
A:来源分析
B:受访分析
C:访客分析
D:转化路径分析
答案: 【
来源分析
受访分析
访客分析
转化路径分析

10、 问题:网站流量数据分析的意义有哪些 ( )
选项:
A:帮助网站运营人员获取网站流量信息
B:从多方面提供网站分析的数据依据
C:帮助提高网站流量
D:提升网站用户体验
答案: 【
帮助网站运营人员获取网站流量信息
从多方面提供网站分析的数据依据
帮助提高网站流量
提升网站用户体验

第二章 单元测试

1、 问题:Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。( )
选项:
A:对
B:错
答案: 【

2、 问题:在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。( )
选项:
A:对
B:错
答案: 【

3、 问题:在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。( )
选项:
A:对
B:错
答案: 【

4、 问题:利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。( )
选项:
A:对
B:错
答案: 【

5、 问题:在HDFS API操作中, closeFileSystem方法的功能是释放文件系统对象的资源。( )
选项:
A:对
B:错
答案: 【

6、 问题:MapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。( )
选项:
A:对
B:错
答案: 【

7、 问题:Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。( )
选项:
A:对
B:错
答案: 【

8、 问题:能在网络中安全传输文件的软件是( )。
选项:
A:VMware
B:Xshell
C:IDEA
D:Xftp
答案: 【
Xftp

9、 问题:创建了bigdata用户的命令是( )。
选项:
A:su bigdata
B:bigdata ALL
C:useradd bigdata
D:Sudoers
答案: 【
useradd bigdata

10、 问题:论文( ),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。
选项:
A:GFS
B:BigTable
C:MapReduce
D:HDFS
答案: 【
MapReduce

11、 问题:假如我们设定HDFS块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成( )个分片
选项:
A:2
B:3
C:4
D:5
答案: 【
4

12、 问题:在Linux命令行中,使用( )命令格式化hive元数据库
选项:
A:format
B:schematool
C:clear
D:del
答案: 【
schematool

13、 问题:在Hive中给表添加数据,使用( )方式给表添加数据效率更高。
选项:
A:insert into
B:Load
C:append
D:Add
答案: 【
Load

14、 问题:关系型数据库与HDFS之间相互数据迁移的工具是( )。
选项:
A:distcp
B:fsck
C:fastcopy
D:sqoop
答案: 【
sqoop

15、 问题:Notepad++功能有( )。
选项:
A:制作一般的纯文字说明文件
B:编写计算机程序代码
C:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
D:可以连接虚拟机,对虚拟机中的文件进行编辑。
答案: 【
制作一般的纯文字说明文件
编写计算机程序代码
语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
可以连接虚拟机,对虚拟机中的文件进行编辑。

16、 问题:Hadoop主要包含( )三大功能组件。
选项:
A:YARN
B:Hadoop
C:MapReduce
D:HDFS
答案: 【
YARN
MapReduce
HDFS

17、 问题:Hadoop具有( )优势。
选项:
A:高可靠性
B:高效性
C:高容错性
D:高扩展性
答案: 【
高可靠性
高效性
高容错性
高扩展性

18、 问题:下面说法正确的是( )。
选项:
A:JDK是Java语言的开发环境
B:JDK包含JRE和JVM
C:JRE是java运行时的类库
D:Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。
答案: 【
JDK是Java语言的开发环境
JDK包含JRE和JVM
JRE是java运行时的类库
Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。

19、 问题:在分布式文件系统HDFS当中提供了两种操作命令,是( )。
选项:
A:hadoop fs
B:Hadoop dfs
C:hdfs dfs
D:hdfs fs
答案: 【
hadoop fs
hdfs dfs

20、 问题:Hive是基于Hadoop技术的数据仓库工具,用来对数据进行( )。
选项:
A:提取
B:转化
C:加载
D:分析
答案: 【
提取
转化
加载
分析

21、 问题:使用beeline客户端远程访问Hive之前,需要启动的两个服务是( )。
选项:
A:hive –service metastore
B:hive –server metastore
C:hive –service hiveserver2
D:hive –service hiveserver
答案: 【
hive –server metastore
hive –service hiveserver2

22、 问题:Hive的复杂数据类型有( )三种
选项:
A:ARRAY
B:MAP
C:STRUCT
D:Char
答案: 【
ARRAY
MAP
STRUCT

23、 问题:成功安装Zookeeper集群后,查看各节点的角色信息时,会看到1个、多个( )。
选项:
A:leader
B:follower
C:zookeeper
D:zkServer
答案: 【
leader
follower

24、 问题:Kafka是一种高吞吐量的分布式发布订阅消息系统,是Apache基金会开源的消息队列,该框架由( )编写而成。
选项:
A:C++
B:Java
C:Scala
D:Python
答案: 【
Java
Scala

第三章 单元测试

1、 问题:业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。( )
选项:
A:对
B:错
答案: 【


本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注