第一章 单元测试

1、 问题:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。( )
选项:
A:对
B:错
答案: 【


2、 问题:下面哪些是时空数据的应用( )。
选项:
A:从多媒体数据库中发现有趣的模式
B:气象学家使用人造卫星和雷达观察飓风
C:机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆
D:动物学家把遥感设备安装在野生动物身上,以便分析生态行为
答案: 【
气象学家使用人造卫星和雷达观察飓风
机动车辆管理者把GPS安装在汽车上,以便更好地监管和引导车辆
动物学家把遥感设备安装在野生动物身上,以便分析生态行为

3、 问题:数据挖掘生命周期的数据理解阶段,起于原始数据收集,止于熟悉数据、识别数据质量问题。( )
选项:
A:对
B:错
答案: 【

4、 问题:以下关于数据挖掘规律的描述中,不正确的是( )。
选项:
A:业务知识是数据挖掘过程每一步的中心
B:数据准备超过数据挖掘过程的3/4
C:给定应用的正确模型只能通过实验发现
D:对所有领域的每个数据挖掘问题,总有模式可循。
答案: 【
数据准备超过数据挖掘过程的3/4

5、 问题:关于数据挖掘生命周期的部署阶段,说法正确的是( )。
选项:
A:部署通常是数据挖掘项目的终点
B:执行部署步骤的通常是数据分析师
C:部署阶段要完成模型的创建
D:建立模型的目的不能仅仅是增加对数据的了解
答案: 【
部署阶段要完成模型的创建

6、 问题:“8,000”和“10,000”表示:( ) 。
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【
数据

7、 问题:“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:( )。
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【
信息

8、 问题:“飞机无法飞过高山”表示:( ) 。
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【
知识

9、 问题:数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。( )
选项:
A:对
B:错
答案: 【

10、 问题:根据顾客喜好摆放商品位置属于数据挖掘范畴。( )
选项:
A:对
B:错
答案: 【

第二章 单元测试

1、 问题:使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的( )任务?
选项:
A:探索性数据分析
B:建模描述
C:预测建模
D:寻找模式和规则
答案: 【
探索性数据分析

2、 问题:下列对学生相关属性描述中,不是标称属性的是( )。
选项:
A:学号
B:婚姻状况
C:身高
D:头发颜色
答案: 【
身高

3、 问题:下列哪些选项能表示序数属性的数据集中趋势度量( )。
选项:
A:四分位数
B:众数
C:均值
D:标准差
答案: 【
众数

4、 问题:( )可以观察从一个分布到另一分布是否有漂移。
选项:
A:盒图
B:分位数-分位数图
C:散点图
D:直方图
答案: 【
分位数-分位数图

5、 问题:考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是 ( )
选项:
A:2
B:3
C:3.5
D:5
答案: 【
3.5

6、 问题:下列哪个不是专门用于可视化时间空间数据的技术: ( )
选项:
A:等高线图
B:饼图
C:曲面图
D:矢量场图
答案: 【
饼图

7、 问题:皮尔森相关系数取值为( )时说明两个对象最不相似。
选项:
A:0.05
B:0
C:-1
D:1
答案: 【
-1

8、 问题:下列哪些指标可以度量数据的离散趋势度量:( )。
选项:
A:极差
B:五数概括
C:四分位数极差
D:四分位数
答案: 【
极差
五数概括
四分位数极差
四分位数

9、 问题:在探索性数据分析中,认为最有代表性,最能反映数据重要特征的五数概括,包括:( )。
选项:
A:中位数Q2
B:最大值
C:四分位数Q3
D:最小值
答案: 【
中位数Q2
最大值
四分位数Q3
最小值

10、 问题:四分位数极差(IQR)是第1个和第2个四分位数之间的距离。( )
选项:
A:对
B:错
答案: 【

第三章 单元测试

1、 问题:下面( )不属于数据预处理的方法?
选项:
A:变量代换
B:离散化
C:聚集
D:估计遗漏值
答案: 【
估计遗漏值

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦