本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-24到2020-06-30
本篇答案更新状态:已完结

第7讲 MapReduce MapReduce单元测验

1、 问题:下列说法错误的是
选项:
A:Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写
B:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
C:Map函数将输入的元素转换成形式的键值对
D:不同的Map任务之间不能互相通信
答案: 【Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写

2、 问题:在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:
选项:
A:<“hello”,1,1>、<“hadoop”,1>和<“world”,1>
B:<“hello”,2>、<“hadoop”,1>和<“world”,1>
C:<“hello”,<1,1>>、<“hadoop”,1>和<“world”,1>
D:<“hello”,1>、<“hello”,1>、<“hadoop”,1>和<“world”,1>
答案: 【<“hello”,1>、<“hello”,1>、<“hadoop”,1>和<“world”,1>

3、 问题:对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是
选项:
A:<“hello”,1,1><“hadoop”,1><“world”,1>
B:<“hello”,2><“hadoop”,1><“world”,1>
C:<“hello”,<1,1>><“hadoop”,1><“world”,1>
D:<“hello”,1><“hello”,1><“hadoop”,1><“world”,1>
答案: 【<“hello”,2><“hadoop”,1><“world”,1>

4、 问题:下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是
选项:
A:前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
B:前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
C:前者相比后者学习起来更难
D:前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
答案: 【前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好;
前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好;
前者相比后者学习起来更难;
前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型

5、 问题:MapReduce体系结构主要由哪几个部分组成
选项:
A:Client
B:JobTracker
C:TaskTracker
D:Task
答案: 【Client;
JobTracker;
TaskTracker;
Task

6、 问题:MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。
选项:
A:正确
B:错误
答案: 【正确

7、 问题:两个键值对<“a”,1>和<“a”,1>,如果对其进行归并(merge),会得到<“a”,2>,如果对其进行合并(combine),会得到<“a”,<1,1>>
选项:
A:正确
B:错误
答案: 【错误

8、 问题:MapReduce采用 策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。
答案: 【分而治之

9、 问题:所谓 过程,是指对Map输出结果进行分区、排序、合并等处理,并交给Reduce的过程。
答案: 【(以下答案任选其一都对)shuffle;
Shuffle;
SHUFFLE

第9讲 Hadoop再探讨 Hadoop再探讨单元测验

1、 问题:下列说法正确的是
选项:
A:第二名称节点无法解决单点故障问题
B:第二名称节点是热备份
C:HDFS HA提供高可用性,可以实现可扩展性、系统性能和隔离性
D:HDFS HA可用性不好
答案: 【第二名称节点无法解决单点故障问题

2、 问题:HDFS Federation设计不能解决“单名称节点”存在的哪个问题
选项:
A:HDFS集群扩展性
B:性能更高效
C:良好的隔离性
D:单点故障问题
答案: 【单点故障问题

3、 问题:下列哪些是Hadoop1.0存在的问题
选项:
A:抽象层次低
B:表达能力有限
C:开发者自己管理作业之间的依赖关系
D:执行迭代操作效率低
答案: 【抽象层次低;
表达能力有限;
开发者自己管理作业之间的依赖关系;
执行迭代操作效率低

4、 问题:下列对Hadoop各组件的理解正确的是
选项:
A:Pig:处理大规模数据的脚本语言
B:Tez:支持DAG作业的计算框架
C:Oozie:工作流和协作服务引擎
D:Kafka:分布式发布订阅消息系统
答案: 【Pig:处理大规模数据的脚本语言;
Tez:支持DAG作业的计算框架;
Oozie:工作流和协作服务引擎;
Kafka:分布式发布订阅消息系统

5、 问题:对新一代资源管理调度框架YARN的理解正确的是
选项:
A:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
B:YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMaster
C:YARN既是资源管理调度框架,也是一个计算框架
D:MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务
答案: 【YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架;
YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMaster;
MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务

6、 问题:HDFS HA(High Availability)是为了解决单点故障问题。
选项:
A:正确
B:错误
答案: 【正确

7、 问题:在HDFS Federation(HDFS联邦)中,设计了多个相互独立的名称节点,使得HDFS的命名服务能够水平扩展。
选项:
A:正确
B:错误
答案: 【正确

8、 问题:相对于Hadoop1.0而言,Hadoop2.0主要增加了HDFS HA和HDFS Federation(联邦)等特性。
选项:
A:正确
B:错误
答案: 【正确

第10讲 Spark Spark单元测验

1、 问题:Spark SQL目前暂时不支持下列哪种语言
选项:
A:Scala
B:Java
C:Python
D:Matlab
答案: 【Matlab

2、 问题:RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是
选项:
A:map
B:filter
C:groupBy
D:count
答案: 【count

3、 问题:下列说法错误的是
选项:
A:Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN
B:在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
C:RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D:RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
答案: 【RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换

4、 问题:下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是
选项:
A:count():返回数据集中的元素个数
B:filter(func):筛选出满足函数func的元素,并返回一个新的数据集
C:take(n):返回数据集中的第n个元素
D:map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集
答案: 【take(n):返回数据集中的第n个元素

5、 问题:下列大数据类型与其对应的软件框架不适应的是
选项:
A:复杂的批量数据处理:MapReduce
B:基于历史数据的交互式查询:Impala
C:基于实时数据流的数据处理:Storm
D:图结构数据的计算:Hive
答案: 【图结构数据的计算:Hive

6、 问题:Apache软件基金会最重要的三大分布式计算系统开源项目包括
选项:
A:Hadoop
B:Spark
C:Storm
D:MapReduce

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注