本答案对应课程为:点我自动跳转查看
本课程起止时间为:2021-09-14到2021-12-31

3 Data Preprocessing Test 3

1、 问题:假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()
选项:
A:第一个
B:第二个
C:第三个
D:第四个
答案: 【第二个

2、 问题:以下哪种方法不是常用的数据约减方法()
选项:
A:抽样
B:回归
C:聚类
D:关联规则挖掘
答案: 【关联规则挖掘

3、 问题:假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()
选项:
A:18.3
B:22.6
C:26.8
D:27.9
答案: 【18.3

4、 问题:主成分分析法是一种有参的数据约减方法
选项:
A:正确
B:错误
答案: 【正确

5、 问题:离散属性总是具有有限个值。
选项:
A:正确
B:错误
答案: 【错误

6、 问题:特征提取技术并不依赖于特定的领域。
选项:
A:正确
B:错误
答案: 【错误

7、 问题:可以通过创造新的属性并加入到现有属性集中实现更有效的挖掘
选项:
A:正确
B:错误
答案: 【正确

8、 问题:通过离散化操作可以将连续属性转化为序数属性
选项:
A:正确
B:错误
答案: 【正确

9、 问题:通过数据集成可以维护数据源整体上的数据一致性
选项:
A:正确
B:错误
答案: 【正确

10、 问题:可以将异常视为缺失值,利用缺失值处理的方法处理也可以用前后俩个观测值的平均值修正该异常值
选项:
A:正确
B:错误
答案: 【正确

2 Data Test 2

1、 问题:age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。使用 z-score 规范化将 age 值 35 变换到[0.0,1.0]区间,变换后的值为()
选项:
A:0.4
B:0.1
C:0.9
D:0.3
答案: 【0.4

2、 问题:一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()
选项:
A:一年级
B:二年级
C:三年级
D:四年级
答案: 【一年级

3、 问题:假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()
选项:
A:0.821
B:1.224
C:1.458
D:0.716
答案: 【0.716

4、 问题:属性Hair_color = {auburn, black, blond, brown, grey, red, white},该属性属于()类型
选项:
A:标称
B:二分
C:序数
D:数值
答案: 【标称

5、 问题:下面不属于数据集特征的是()
选项:
A:连续性
B:维度
C:稀疏性
D:分辨率
答案: 【连续性

6、 问题:一个数据集的分布的五数概括由最小值、第一个四分位数、_、第三个四分位数、和最大值构成。
答案: 【中位数

7、 问题:定用于分析的数据包含属性age。age 值(以递增序)为:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。则数据的第一个四分位数的值为__,第三个四分位数的值为35
答案: 【20

8、 问题:考虑值集{12 24 33 24 55 68 26},其四分位数极差是:___
答案: 【31

9、 问题:数据集的属性可以划分为____和连续型两种。
答案: 【离散型

10、 问题:两个向量d1 = (1,1,2,1,1,1,0,0,0) d2 =  (1,1,1,0,1,1,1,1,1)的余弦相似度为()
答案: 【[0.8,0.83]

1 Introduction Test 1

1、 问题:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?
选项:
A:关联规则发现
B:聚类
C:分类
D:自然语言处理
答案: 【关联规则发现

2、 问题:当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
选项:
A:分类
B:聚类
C:关联分析
D:异常检测
答案: 【聚类

3、 问题:判断以下行为是否属于数据挖掘任务:根据顾客的职业将顾客进行分组
选项:
A:正确
B:错误
答案: 【错误

4、 问题:判断以下行为是否属于数据挖掘任务:根据顾客的购物记录预测顾客感兴趣的商品
选项:
A:正确
B:错误
答案: 【正确

5、 问题:判断以下行为是否属于数据挖掘任务:监测患者的心率是否异常
选项:
A:正确
B:错误
答案: 【正确

6、 问题:判断以下行为是否属于数据挖掘任务:提取声波的频率
选项:
A:正确
B:错误
答案: 【错误

7、 问题:判断以下行为是否属于数据挖掘任务:预测掷骰子的结果
选项:
A:正确
B:错误
答案: 【错误

8、 问题:数据挖掘是从大量数据中挖掘重要、隐含的、以前未知、______的模式或知识。
答案: 【潜在有用

9、 问题:从数据仓库的角度可以将数据挖掘过程划分为数据清理、数据集成、数据选择与变换、数据挖掘及_等阶段。
答案: 【知识评估

10、 问题:数据挖掘任务主要包括描述性和______任务
答案: 【预测性

4 Association Rule Mining Test 4

1、 问题:考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
选项:

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注