2020 数据挖掘与处理(北京信息科技大学) 最新满分章节测试答案
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-21到2020-07-10
本篇答案更新状态:已完结
【第1章】初识大数据(第3教学周) 【第一周】单元测试
1、 问题:大数据的特性不包括
选项:
A:数据量大
B:类型多样
C:时效要求高
D:价值密度高
答案: 【价值密度高】
2、 问题:如下关于大数据分析流程的哪一项是正确的?
选项:
A:数据采集、数据清洗、数据管理、数据分析、数据呈现
B:数据采集、数据分析、数据清洗、数据管理、数据呈现
C:数据采集、数据呈现、数据分析、数据清洗、数据管理
D:数据清洗、数据采集、数据呈现、数据分析、数据管理
答案: 【数据采集、数据清洗、数据管理、数据分析、数据呈现】
3、 问题:大数据分析与传统的数据分析的区别主要在于:
选项:
A:传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。
B:大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。
C:大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。
D:大数据分析需要借助各种分析工具完成,而传统数据分析不需要使用其他工具。
答案: 【传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。;
大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。;
大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。】
4、 问题:1、大数据目前并无统一的定义,主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。
选项:
A:正确
B:错误
答案: 【正确】
5、 问题:数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统
选项:
A:正确
B:错误
答案: 【错误】
6、 问题:大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。
选项:
A:正确
B:错误
答案: 【正确】
【作业】【第1章】初识大数据(第3教学周) 【第一周】作业题
1、 问题:大数据分析可以应用于哪些领域?对其中一个领域应用进行说明。
评分规则: 【 只要符合题意即可得分
】
【第4章】Python 大数据基础(第6、7教学周) 【第4章】单元测试
1、 问题:Python代码:r = 5 + “5”的执行结果是
选项:
A:报错
B:55
C:10
D:5
答案: 【报错】
2、 问题:1. m = [1, 2, [3]]2. n = m[:] 3. n[1] = 4 4. n[2][0] = 5 5. print(m)代码的执行结果是?
选项:
A:[1,2,[5]]
B:[1,2,[3]]
C:[1,4,[3]]
D:[1,4,[5]]
答案: 【[1,2,[5]]】
3、 问题:1. n1 = { ‘a’:1, ‘b’:2 }2. n2 = n13. n1[‘a’] = 54. s = n1[‘a’] + n2[‘a’]5. print(s)代码的结果是?
选项:
A:10
B:5
C:6
D:7
答案: 【10】
4、 问题:Python代码:type(‘abc’)的执行结果是
选项:
A:int
B:str
C:float
D:bool
答案: 【str】
5、 问题:1. import sqlite32. from faker import Faker3. f=Faker(“zh_cn”)4. conn=sqlite3.connect(“:memory:”)5. c=conn.cursor()6. c.execute(“create table user (id varchar(10) primary key, name varchar(20))”)7. for i in range(0,100):8. c.execute(“insert into user (id, name) values (‘{}’,'{}’)”.format(i,f.name()))9. c.execute(“select * from user”)10. result = c.fetchall()11. print(len(result))上述代码执行的结果是?(不用读懂,在Python开发环境中运行一下该程序,查看结果)
选项:
A:100
B:10
C:20
D:0
答案: 【100】
6、 问题:用户处理numpy的ndarray对象时,可以改变数组维度。下列描述中错误的是
选项:
A:resize方法不能修改原ndarray数组
B:reshape方法不能修改原ndarray数组
C:flatten方法不能修改原ndarray数组
D:ndim属性表示ndarray数组的维度
答案: 【resize方法不能修改原ndarray数组】
7、 问题:Numpy的Series对象在进行运算时,其默认索引值是0到n-1可以参与运算,而自定义索引值不会参与运算。
选项:
A:正确
B:错误
答案: 【错误】
8、 问题:DataFrame结构为一个二维结构,每一列可以为不同的值类型,但一列之内的类型必须相同。
选项:
A:正确
B:错误
答案: 【正确】
9、 问题:由于Python的list列表足够强大,完全可以代替ndarry这种数组。
选项:
A:正确
B:错误
答案: 【错误】
10、 问题:列表list内的数据不可修改
选项:
A:正确
B:错误
答案: 【错误】
【第5章】Python 大数据基础(第8、9、10教学周) 【第5周】单元测试
1、 问题:某网站提供形式多样的财经大数据服务:①提供一个第三方python库,调用库中方法可以直接返回DataFrame对象;②提供一个网站api,可以返回json格式字符串;③提供静态页面,内含表格数据;④提供查询功能,使用JavaScript动态脚本生成查询结果。假设上述各种服务样式均可返回所需数据,则从减少编程工作量的角度看,用户应选择的方案编号是
选项:
A:①
B:②
C:③
D:④
答案: 【①】
2、 问题:对于matplotlib的plot方法原型:plt.plot([x],y,[format], …),下列说法错误的是
选项:
A:只需要提供y轴数据,即可绘制出图像
B:plt是matplotlib中一个子库的简称
C:format表示控制字符串,包括:颜色、风格和标记
D:x轴数据必须提供
答案: 【x轴数据必须提供】
3、 问题:matplotlib提供了图形文本显示,下列函数可以在图像中任意位置显示文字的是
选项:
A:text()
B:title()
C:xlabel()
D:ylabel()
答案: 【text()】
4、 问题:使用Pandas处理数据的时候,经常会遇到重复值。下列说法中错误的是
选项:
A:duplicated()返回值中用1表示重复,0表示不重复
B:duplicated()用于判断某行是否存在重复
C:duplicated()返回一个Series对象
D:duplicated()不能删除重复值
答案: 【duplicated()返回值中用1表示重复,0表示不重复】
5、 问题:排序在数据处理中具有重要的作用。若df为一个DataFrame对象,则对其描述中错误的是
选项:
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦