2020 数据清洗与筛选技术(陕西国防工业职业技术学院) 最新满分章节测试答案
- 【作业】【第2周】大数据应用纵览 假如你是学校的大数据分析师,你如何处理每天收到的学生数据信息,这些信息包括学生考勤情况、奖学金、助学金、贷款、生活补贴等各种信息,请根据以上信息,选择一个你感兴趣的角
- 【作业】【第3周】数据可视化 利用数据可视化工具EXCEL,完成1、利用内置图表完成商务作图;2、利用单元格完成作图;3、利用文本框作图。参考链接:https:–www.zhihu.com-ques
- 【第5周】Python 大数据基础 【第5周】单元测试
- 【第5周】Python 大数据基础 python测试
- 【第6周】数据分析方法 【第6周】单元测试
- 【第1周】初识大数据 【第一周】单元测试
- 【第7周】数据分析方法 【第七周】 单元测试
- 【第4周】Python 大数据基础 【第四周】单元测试
- 【作业】【第8周】开源平台和工具 什么数据清洗,有哪些数据清洗方法,分别适合哪些场景?
- 【第8周】开源平台和工具 【第八周】 单元测试
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-15到2020-06-15
本篇答案更新状态:已完结
【作业】【第2周】大数据应用纵览 假如你是学校的大数据分析师,你如何处理每天收到的学生数据信息,这些信息包括学生考勤情况、奖学金、助学金、贷款、生活补贴等各种信息,请根据以上信息,选择一个你感兴趣的角
1、 问题:假如你是学校的大数据分析师,你如何处理每天收到的学生数据信息,这些信息包括学生考勤情况、奖学金、助学金、贷款、生活补贴等各种信息,请根据以上信息,选择一个你感兴趣的角度,通过数据帮助到同学们?作业26号上午十二点前学习委员收齐交给我。
评分规则: 【 发散思维
】
【作业】【第3周】数据可视化 利用数据可视化工具EXCEL,完成1、利用内置图表完成商务作图;2、利用单元格完成作图;3、利用文本框作图。参考链接:https:–www.zhihu.com-ques
1、 问题:利用数据可视化工具EXCEL,完成1、利用内置图表完成商务作图;2、利用单元格完成作图;3、利用文本框作图。参考链接:https://www.zhihu.com/question/19929609
评分规则: 【 详见https://www.zhihu.com/question/19929609
】
【第5周】Python 大数据基础 【第5周】单元测试
1、 问题:使用json库进行Python的内置数据类型与Json类型转换时,字典dict将被转换为
选项:
A:object
B:string
C:str
D:array
答案: 【object】
2、 问题:某网站提供形式多样的财经大数据服务:①提供一个第三方python库,调用库中方法可以直接返回DataFrame对象;②提供一个网站api,可以返回json格式字符串;③提供静态页面,内含表格数据;④提供查询功能,使用JavaScript动态脚本生成查询结果。假设上述各种服务样式均可返回所需数据,则从减少编程工作量的角度看,用户应选择的方案编号是
选项:
A:①
B:②
C:③
D:④
答案: 【①】
3、 问题:对于matplotlib的plot方法原型:plt.plot([x],y,[format], …),下列说法错误的是
选项:
A:只需要提供y轴数据,即可绘制出图像
B:plt是matplotlib中的一个字库名字
C:format表示控制字符串,包括:颜色、风格和标记
D:x轴数据必须提供
答案: 【只需要提供y轴数据,即可绘制出图像】
4、 问题:matplotlib提供了图形文本显示,下列函数可以在图像中任意位置显示文字的是
选项:
A:text()
B:title()
C:xlabel()
D:ylabel()
答案: 【text()】
5、 问题:使用Pandas处理数据的时候,经常会遇到重复值。下列说法中错误的是
选项:
A:duplicated()返回值中用1表示重复,0表示不重复
B:duplicated()用于判断某行是否存在重复
C:duplicated()返回一个Series对象
D:duplicated()不能删除重复值
答案: 【duplicated()返回值中用1表示重复,0表示不重复】
6、 问题:排序在数据处理中具有重要的作用。若df为一个DataFrame对象,则对其描述中错误的是
选项:
A:排序时无论是升序还是降序,NaN统一排到序列的开头部分
B:df.nlargest(10,”Score”)表示取Score列的前10项最大值
C:df.sort_index()表示对索引排序
D:df.sort_values()表示对数值排序
答案: 【排序时无论是升序还是降序,NaN统一排到序列的开头部分】
7、 问题:语句json.dumps({‘name’:’David’, ‘age’:20})生成的字符串中,数字20被转换为字符串类型。
选项:
A:正确
B:错误
答案: 【错误】
8、 问题:使用requests库爬取回来的字符串数据,可以加载到BeautifulSoup库中,形成一个树状的HTML页面结构,供用户检索使用。
选项:
A:正确
B:错误
答案: 【正确】
9、 问题:当在DataFrame中试图补全空值时,可以使用fillna,但该方法只能为整个DataFrame设置相同的补全值。
选项:
A:正确
B:错误
答案: 【错误】
10、 问题:使用matplotlib绘制多图时,可以使用subplots和subplot方法。如:1. fig,ax = subplot( rows,cols)
选项:
A:正确
B:错误
答案: 【错误】
【第5周】Python 大数据基础 python测试
1、 问题:这里有四个数字,分别是:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?请列举出来,并用空格分隔。
答案: 【list1=[]
count=0
for a in range(1,5):
for b in range (1,5):
for c in range(1,5):
if a!=b and b!=c and a!=c:
d=100a+10b+c
count+=1
list1.append(d)
print(‘一共有%d个三位数’ % count)
for i in list1:
print(i,end=’ ‘)】
分析:【解题思路:筛选出三位中数字相同的情况,并忽略他们。】
2、 问题:企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可可提成7.5%;20万到40万之间时,低于20万元的部分按7.5%提成,高于20万元的部分,可提成5%;40万到60万之间时,低于40万元的部分按5%提成,高于40万元的部分,可提成3%;60万到100万之间时,低于60万元的部分按3%提成,高于60万元的部分,可提成1.5%,高于100万元时,低于100万元的部分按1.5%提成,超过100万元的部分按1%提成,从键盘输入当月利润I,求应发放奖金总数?
答案: 【lirun=int(input(‘请输入你的利润:’))
if lirun <= 100000:
p=lirun0.1
if lirun >100000 and lirun <=200000:
p=100000.1+(lirun – 100000)0.075
if lirun >200000 and lirun <=400000:
p=2000000.075+(lirun – 200000)0.05
if lirun >400000 and lirun <=600000:
p=4000000.05+(lirun – 400000)0.03
if lirun >600000 and lirun <=1000000:
p=6000000.03+(lirun – 600000)0.015
if lirun >1000000:
p=10000000.015+(lirun-1000000)*0.01】
分析:【解题思路:用if语句判断各个条件区间。】
3、 问题:一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问在该数小于1000000的情况下,该数是多少?
答案: 【import math
for i in range(1,1000000):
if math.sqrt(i+100)==int(math.sqrt(i+100)) and math.sqrt(i+268)==int(math.sqrt(i+268)):
print(i)】
分析:【解题思路:如果某数是完全平方数,那么该数开方为一个整数。】
4、 问题:编写一个程序,找到所有可以被7整除但不是5的倍数的数字,2000至3200之间(均包括在内)。获得的数字应以逗号分隔的顺序打印在一行上。
答案: 【list1=[]
for i in range(2000,3201):
if i%7==0 and i%5!=0:
list1.append(i)
for i in list1:
print(i, end=’,’)#或者用print(‘,’.join(l)) ,用于把字符串用S符号连接起来】
分析:【解题思路:用if语句作为判断,注意输出格式。】
5、 问题:编写一个程序,可以计算给定数字的阶乘。假设为程序提供了以下输入:8,输出应该是:40320
答案: 【a=int(input(‘请输入一个数:’))
b=1
for i in range(1,a+1):
b=b*i
print(b)】
分析:【解题思路:可定义函数并用递归,或者用for循环。】
6、 问题:使用给定的整数n,编写程序以生成包含(i:i * i)的字典这是1和n之间的整数(包括两者)。 然后是程序应该打印字典。假设为程序提供了以下输入:8,输出结果:{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64}
答案: 【n=int(input(‘请输入一个数:’))
d=dict()
for i in range(1,n+1):
d[i]=i*i
print(d)】
分析:【解题思路:定义一个字典,用for循环。】
7、 问题:输入一串数字,以逗号为分隔符,将其转换成列表和元组输入:34,67,55,33,12,98 输出: [’34’, ’67’, ’55’, ’33’, ’12’, ’98’] (’34’, ’67’, ’55’, ’33’, ’12’, ’98’)
答案: 【value=input(‘请输入一串数字:’)
a=value.split(‘,’)
print(a)
b=tuple(a)
print(b)】
分析:【解题思路:注意字符串分隔方法。】
8、 问题:定义一个至少包含两种方法的类:getString:从控制台输入中获取字符串printString:以大写形式打印字符串。
答案: 【class A():
def getString(self):
self.x =input(‘请输入一个字符串:’)
def printString(self):
print(self.x.upper())
a=A()
a.getString()
a.printString()】
分析:【解题思路:注意定义类的格式。】
9、 问题:编写一个程序,根据给定的公式计算并打印该值:Q = [(2 * C * D)/ H]的平方根以下是C和H的固定值:C是50.H是30。D是变量,其值应以逗号分隔的顺序输入到程序中。输入:100,150,180,输出:18,22,24
答案: 【import math
c=50
h=30
d=input(‘请输入:’)
list1=d.split(‘,’)
m=list1[-1]
for i in list1:
i=int(i)
q=int(math.sqrt((2ci)/h))
if i !=int(m):
print(q,end=’,’)
else:
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦