2021答案 互联网上的大数据处理实践 最新满分章节测试答案
MODULE 05: Python数据可视化与预处理 Python基本数据统计随堂测试
1、 问题:pandas模块中的read_csv()函数在日常使用较多,它除了可以读取csv格式的文件并将结果转换成一个DataFrame外,还可以读取其他的格式化文本文件。假设有一个文本文件的每一行均含有相同个数的数值,且数据间都用一个#分隔,形如:12#34#5.67#1234
12#346#5.67#77
…
12#3.4#67#67.89请问在read_csv()函数中需要添加如下哪一个选项中的参数设置?
选项:
A:names=’#’
B:sep=’#’
C:index_col=’#’
D:engine=’#’
答案: 【sep=’#’】
2、 问题:对于一个Series或DataFrame对象来说,如下选项中说法错误的是哪一个?
选项:
A:isnull()方法可以用来判断缺失值
B:drop()方法可以用来删除缺失行
C:fillna()方法可以用来填充缺失行
D:fillna()方法可通过method参数指定缺失值用其上或其下的第一个非缺失值填充
答案: 【drop()方法可以用来删除缺失行】
3、 问题:请选出以下关于数据规约的两种形式——属性规约和数值规约说法中错误的选项。
选项:
A:属性规约是对数据集属性的规约,目的是获得有代表性的较少的数据列的规约表示。
B:PCA是重要的属性规约方法。
C:箱型图常用来实现数值规约。
D:抽样是数值规约的常见手段,常见的包括如随机抽样,聚类抽样和分层抽样。
答案: 【箱型图常用来实现数值规约。】
4、 问题:规范化是数据变换中的重要方式,请选出如下属于常用的规范化方法的选项。
选项:
A:最小-最大
B:分箱法
C:z-score
D:小数定标
答案: 【最小-最大;
z-score;
小数定标】
5、 问题:如下图片的规范化结果可能属于经典的最小-最大化规范化,请问这种说法是否正确。
选项:
A:正确
B:错误
答案: 【错误】
6、 问题:完善如下程序,填出程序中缺失的代码,两个答案中用一个#连接。程序功能为:读取文件score.csv中的成绩数据,计算平均分并统计其中语文成绩大于等于80,英语成绩大于等于85的学生的每门课程的成绩(结果按平均分从大到小排序),将结果输出至文件result.csv中并绘制如图所示的满足条件的学生平均成绩的柱状图。【测试数据与运行结果】score.csv的内容:Name,Chinese,Maths,EnglishChen,88,87,85Fang,93,88,90Wang,82,99,96Peng,77,94,84Ding,80,94,76result.csv内容和柱状图: Chinese Maths English AvgName Wang 82 99 96 92Fang 93 88 90 90Chen 88 87 85 86【待完善的代码】import pandas as pd
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦