MODULE 05: Python数据可视化与预处理 Python基本数据统计随堂测试

1、 问题:pandas模块中的read_csv()函数在日常使用较多,它除了可以读取csv格式的文件并将结果转换成一个DataFrame外,还可以读取其他的格式化文本文件。假设有一个文本文件的每一行均含有相同个数的数值,且数据间都用一个#分隔,形如:12#34#5.67#1234
12#346#5.67#77

12#3.4#67#67.89请问在read_csv()函数中需要添加如下哪一个选项中的参数设置?
选项:
A:names=’#’
B:sep=’#’
C:index_col=’#’
D:engine=’#’
答案: 【sep=’#’

2、 问题:对于一个Series或DataFrame对象来说,如下选项中说法错误的是哪一个?
选项:
A:isnull()方法可以用来判断缺失值
B:drop()方法可以用来删除缺失行
C:fillna()方法可以用来填充缺失行
D:fillna()方法可通过method参数指定缺失值用其上或其下的第一个非缺失值填充
答案: 【drop()方法可以用来删除缺失行

3、 问题:请选出以下关于数据规约的两种形式——属性规约和数值规约说法中错误的选项。
选项:
A:属性规约是对数据集属性的规约,目的是获得有代表性的较少的数据列的规约表示。
B:PCA是重要的属性规约方法。
C:箱型图常用来实现数值规约。
D:抽样是数值规约的常见手段,常见的包括如随机抽样,聚类抽样和分层抽样。
答案: 【箱型图常用来实现数值规约。

4、 问题:规范化是数据变换中的重要方式,请选出如下属于常用的规范化方法的选项。
选项:
A:最小-最大
B:分箱法
C:z-score
D:小数定标
答案: 【最小-最大;
z-score;
小数定标

5、 问题:如下图片的规范化结果可能属于经典的最小-最大化规范化,请问这种说法是否正确。
选项:
A:正确
B:错误
答案: 【错误

6、 问题:完善如下程序,填出程序中缺失的代码,两个答案中用一个#连接。程序功能为:读取文件score.csv中的成绩数据,计算平均分并统计其中语文成绩大于等于80,英语成绩大于等于85的学生的每门课程的成绩(结果按平均分从大到小排序),将结果输出至文件result.csv中并绘制如图所示的满足条件的学生平均成绩的柱状图。【测试数据与运行结果】score.csv的内容:Name,Chinese,Maths,EnglishChen,88,87,85Fang,93,88,90Wang,82,99,96Peng,77,94,84Ding,80,94,76result.csv内容和柱状图: Chinese Maths English AvgName Wang 82 99 96 92Fang 93 88 90 90Chen 88 87 85 86【待完善的代码】import pandas as pd

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦
   

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注