2020 大数据技术基础(山东劳动职业技术学院) 最新满分章节测试答案

2025年1月10日 分类:免费网课答案 作者:网课帮手
文章目录[隐藏]

本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-04-06到2020-07-31
本篇答案更新状态:已完结

第1章大数据概述 第1章 大数据概述

1、 问题:对“数据处理阶段”描述不正确的是( )。
选项:
A:人工管理阶段
B:文件管理阶段
C:文本管理阶段
D:数据库系统阶段
答案: 【文本管理阶段

2、 问题:不是大数据的关键技术( )
选项:
A:大数据的组织
B:大数据的分析
C:大数据的存储
D: 大数据的可视化
答案: 【大数据的组织

3、 问题:大数据的主要特征是( )
选项:
A:大体量
B:多样性
C:大价值
D:随机性
答案: 【大体量;
多样性;
大价值

4、 问题:数据库系统是由( )的组成。
选项:
A:硬件环境
B:软件环境
C:人员
D:数据库
答案: 【硬件环境;
软件环境;
人员;
数据库

5、 问题:分布式文件系统在物理结构上是由计算机集群中的多个节点构成的。
选项:
A:正确
B:错误
答案: 【正确

6、 问题:大数据即海量的数据集合。
选项:
A:正确
B:错误
答案: 【错误

7、 问题:所谓数据库,是以一定的组织方式将相关的数据组织在一起,长期存放在计算机内,可为多个用户共享,与应用程序彼此独立,____的数据集合。
答案: 【统一管理

8、 问题:大数据往往表现为数据价值高,但价值____的特点。
答案: 【密度低

【作业】课程导引 第1章 大数据概述 1.1大数据的应用 单元作业

1、 问题:提出一个“大数据处理”问题需求,简述大数据的应用场景。
评分规则: 【 提出问题需求:5分简述大数据的应用场景:5分

【作业】课程导引 第1章 大数据概述 1.2+1.3 单元作业

1、 问题:什么是大数据?即大数据的定义
评分规则: 【 随着社会媒体和传播感器,网络等发展产生的大量且多样的数据集合;1分是随着硬件和软件技术的发展,数据的存储处理成本大幅降低而生产出数据的集合;1分是随着云计算的兴起,大数据的存储、处理环境易于搭建而组织的数据的集合;1分是需要在新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。1分总而言之,大数据是一个综合的概念,它包括具有独特性质,且难以进行管理和分析的数据集合。1分

【作业】第2章 数据采集与预处理 2.4 大数据预处理 单元作业

1、 问题:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。假设两个班级考试,所采用的试卷不同:A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。那么利用Z-Score计算它们的标准分数,看看谁更优秀。
评分规则: 【 Z-score标准化:f(x) =(x−均值)/标准差A的Z-score=(90-80)/10=1B的Z-score=(600-400)/100=2—-写出上面中间计算过程,6分。A的Z-score

【作业】第2章 数据采集与预处理 2.2 大数据的来源 单元作业

1、 问题:按产生数据的主体划分,大数据主要有哪些来源?
评分规则: 【 1)对现实世界的测量2) 人类的记录3)计算机产生的数据

2、 问题:数据格式特性,主要包括哪三类?各举例说明。
评分规则: 【 1)结构化信息 传统的关系型数据库、可用二维表结构表示。2)半结构化信息类似XML 、HTML之类,自描述,数据结构和内容混杂在一起。3)非结构化信息各种文档、图片、视频/ 音频等。每条1分,举例1分。

第2章 数据采集与预处理 第2章 数据采集与预处理 单元测验

1、 问题:对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()
选项:
A:1
B:1.8
C:2
D:4
答案: 【2

2、 问题:半结构化数据包括()
选项:
A:Excel表格
B:HTML文档
C:银行账户上的消费记录
D:检查身体后得到的体检报告
答案: 【Excel表格;
HTML文档

3、 问题:大数据的来源途径有许多,如下哪些属于大数据来源()
选项:
A:计算机网络运行产生的日志
B:人在微博上发表的记录
C:传感器设备采集的数据
D:网络爬虫得到的数据
答案: 【计算机网络运行产生的日志;
人在微博上发表的记录;
传感器设备采集的数据;
网络爬虫得到的数据

4、 问题:所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1
选项:
A:正确
B:错误
答案: 【错误

5、 问题:数据的平滑操作,其目的在于消除数据波动产生的噪声。
选项:
A:正确
B:错误
答案: 【正确

【作业】第3章 Hadoop基础 3.1+3.2 单元作业

1、 问题:3.2 Hadoop2.0相对于Hadoop1.0新增加了哪些组件?并简述各组件的作用。
评分规则: 【 YARN(资源管理框架)Spark(基于内存的并行计算框架)Tez(DAG计算框架)Shark(数据分析处理)—–以上4个组件,每答出1个组件名称,得0.5,简述作用得0.5。答出4个,可得4分。

2、 问题:3.1 Hadoop平台的组件有哪些?并简述每个组件的作用。
评分规则: 【 HDFS(分布式文件系统)Mapreduce (分布式计算框架)YARN(资源管理框架)Hbase(分布式数据库)Hive(数据仓库)Sqoop (同步处理工具)Pig(一种强大的脚本语言)Flume(日志收集工具)Oozie(作业调度系统)ZooKeeper (分布式协调服务)Ambari (部署管理工具)Mahout (数据挖掘库)—–以上12个组件,每答出1个组件名称,得0.5,简述作用得0.5。答出10个以上,可得10分。

第3章 Hadoop基础 第3章 Hadoop基础

1、 问题:下述关于hadoop的阐述,正确的是( )
选项:
A:是一个分布式数据库与并行计算系统
B:是一个分布式存储系统与分布式数据库
C:是一个集中式存储与分布式并行运算系统
D:是一个分布式存储与分布式并行运算系统
答案: 【是一个分布式存储与分布式并行运算系统

2、 问题:MapReduce是( )计算框架
选项:
A:分布式并发
B:非分布式并行
C:分布式并行
D:非分布式并发
答案: 【分布式并行

3、 问题:为了保证系统的容错性和可用性,HDFS采用了多副本方式对数据进行冗余存储,这种多副本方式具有以下几个优点:( )
选项:
A:容易修改数据问题
B:加快数据传输速度
C:保证数据的可靠性
D:容易检查数据错误
答案: 【加快数据传输速度;
保证数据的可靠性;
容易检查数据错误

4、 问题:Hadoop具有以下哪个几个方面的特点( )
选项:
A:高可靠性
B:高效性
C:成本低
D:高可扩展性
E:支持多种编程语言
答案: 【高可靠性;
高效性;
成本低;
高可扩展性;
支持多种编程语言

5、 问题:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave。Master上运行JobTracker,Slave上运行TaskTracker 。
选项:
A:正确
B:错误
答案: 【正确

6、 问题:HDFS采用块的概念,默认的一个块大小是64MB。
选项:
A:正确
B:错误
答案: 【正确

7、 问题:YARN是新一代Hadoop( ),用户可以运行和管理同一个物理集群机上多种作业。
答案: 【资源管理器

8、 问题:Hbase是一个针对结构化数据的可申缩、高可靠,高性能、分布式和面向( )的动态模式数据库。
答案: 【

【作业】第4章HDFS分布式文件系统 4.1+4.2 单元作业

1、 问题:HDFS系统由哪些组件组成?各个组件的作用(功能)是什么?
评分规则: 【 HDFS集群由以下元素组成:数据块(B lo ck )名称节点(NameNode)数据节点(DataNode)—–以上3条,每条1分—–每个组件的作用,2分

【作业】第4章HDFS分布式文件系统 4.3 单元作业

1、 问题:简述HDFS写数据的步骤及错误处理机制。
评分规则: 【 1调用Create(),2验证,3调用Write,4写入数据,5保存内部队列,6调用Close()。—-每项1分错误处理机制1.移除故障节点,并记录未完成写入的数据;2.删除不完整的数据块,由正常数据节点组成新的数据管道;3.根据备份数,完成数据写入与备份。—-每项1分

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦
请输入手机号或商家订单号
打不开请联系客服QQ 2356025045 商家订单号在哪里?点此了解

商家订单号查看步骤

打开支付宝
方法一:我的 > 账单 > 账单详情 > 更多>复制商家订单号
方法二:我的 > 账单 >搜索关键字【网课小帮手】
> 账单详情 > 更多>复制商家订单号
方法三:联系客服QQ 2356025045
微信支付
我 > 支付 > 钱包 > 账单 > 账单详情

继续阅读