2021 城市大数据分析(兰州城市学院) 最新满分章节测试答案
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2021-09-13到2022-01-31
本篇答案更新状态:已完结
第二章 数据处理 D12 随堂作业
1、 问题:#D11程序05 sort_index()from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:4] #将前5行赋值给aa.sort_index(ascending=False,inplace=True) #此行功能?print(a) #输出a的结果
答案: 【sort_index()按照索引进行排序,ascending=False降序排列,inplace=True源数据覆盖】
2、 问题:#D11程序06 Series.rank()import pandas as pd #导入pandas库命名为pdser = pd.Series([5, 0, 3, 8, 4], index=list(‘abcde’)) #创建新数组,同时为其指定索引print(ser) #输出当前数组print(ser.rank()) #此行功能?
答案: 【Series.rank()按照数值进行排名,给出排序结果】
3、 问题:#D11程序07 Series.rank()import pandas as pd #导入pandas库命名为pdser = pd.Series([5, 0, 3, 8, 3], index=list(‘abcde’)) #创建新数组,同时为其指定索引print(ser) #输出当前数组print(ser.rank()) print(ser.rank(method=’min’)) #此行功能?与ser.rank()有何不同?print(ser.rank(method=’max’)) #此行功能?与ser.rank()有何不同?print(ser.rank(method=’first’)) #此行功能?与ser.rank()有何不同?print(ser.rank(method=’first’,ascending=False)) #此行功能?与ser.rank()有何不同?
答案: 【Series.rank()排名函数,有重复值时,默认按平均名次排名。method=’min’按最小名次排名,method=’max’按最大名次排名,method=’first’按第一次出现的名次排名,ascending=False降序排名】
4、 问题:from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:5] #将前6行赋值给aprint(a) #输出aa=a.reindex([0,1,6,7,2,3,4,5]) #此行功能?print(a) #输出aa.reset_index(drop=True,inplace=True) #此行功能?print(a) #输出a
答案: 【reindex()重新索引,在原2、3行之间插入索引号6、7两行。
reset_index()重建索引,建立新索引从新排序索引号。】
5、 问题:from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:4] #将前5行赋值给aprint(a) #输出ahang=[1,2,0,3,4] #创建一个新列表a=a.reindex(hang) #此行功能?print(a) #输出a
答案: 【reindex()函数按照原表索引号,以hang列表的顺序进行重新排序】
6、 问题:#D11程序10 concat()import pandas as pd #导入pandas库命名为pdfrom pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:3] #将前4行赋值给ab=df.loc[30:33] #将前30-33行赋值给bc=pd.concat([a,b]) #此行功能?print(c) #输出cc=pd.concat([a,b],ignore_index=True) #此行功能?print(c) #输出c
答案: 【concat()记录合并函数,将a和b组合成为新表c,保留原索引。
ignore_index=True删除原索引重建新索引】
7、 问题:D11程序11 from pandas import DataFrame #导入pandas库的DataFrame类from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据df[‘手机’]=df[‘手机’].astype(str) #将手机列转换为字符型bands=df[‘手机’].str.slice(0,3) #截取手机的前三位赋值给bandsprint(bands)areas=df[‘手机’].str.slice(3,7) #截取手机的4-7位赋值给areasprint(areas)tell=df[‘手机’].str.slice(7,11) #截取手机的8-11位赋值给areasprint(tell)df1=DataFrame({‘band’:bands,’areas’:areas,’num’:tell}) #此行功能?print(df1) #输出新表df1df1=df1.astype(str) #将df1中的数据转换为字符串型tel=df1[‘band’]+df1[‘areas’]+df1[‘num’] #此行功能?df1[‘tel’]=tel #将tel中的数据作为新的tel列追加到df1表中print(df1) #输出df1表
答案: 【新建表df1,三列分别为bands、areas、num。
新建tel变量,将三列进行连接后保存。】
8、 问题:#D11程序12 pd.merge()import pandas as pdfrom pandas import read_exceldf1=read_excel(r’C:\大数据程序\D9数据处理1\学生成绩.xlsx’) df2=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #分别载入两张Excel表,分别赋值给df1和df2df=pd.merge(df1,df2,on=’学号’,how=’left’) #此行功能?print(df) #输出df表
答案: 【df1表与df2表按照学号字段进行匹配,合并后df表显示学生的全部信息。】
9、 问题:#D11程序13 pd.merge()import pandas as pdfrom pandas import read_exceldf1=read_excel(r’C:\大数据程序\D9数据处理1\学生成绩.xlsx’)df2=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #分别载入两张Excel表,分别赋值给df1和df2a=df2.drop([‘姓名’,’IP地址’],axis=1)df=pd.merge(df1,a,on=’学号’,how=’left’) #以上两行的功能?print(df) #输出df表
答案: 【删除df2中的IP姓名、IP地址字段,保留学号和电话,df1表与df2表按照学号字段进行匹配,合并后df表显示学生的成绩以及电话。】
10、 问题:#D12程序14 简单计算from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行,在原数据中修改yy=df[‘英语’].astype(int)gs=df[‘高数’].astype(int)jsj=df[‘计算机’].astype(int)df[‘三门平均分’]=(yy+gs+jsj)/3 #以上四行的功能?print(df.head()) #输出处理后df表前5行
答案: 【三列成绩转换为int整数型,计算平均分,作为“三门平均分”列追加入原表中】
11、 问题:D12程序15 标准化from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行,在原数据中修改scale=(df.体育.astype(int)-df.体育.astype(int).min())/(df.体育.astype(int).max()-df.体育.astype(int).min()) #此行功能?print(‘体育成绩标准化结果:’)print(scale) #输出结果
答案: 【用体育成绩减去全班最低分,再除以(最高分-最低分),计算标准化结果】
12、 问题:D12程序16 z-score标准化from sklearn import preprocessing #导入sklearn库的preprocessing类from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行,在原数据中修改df1=df[‘体育’] #提取df表体育一列,赋值给df1df[‘体育z-score标准化’]=preprocessing.scale(df1) #此行的功能?print(df) #输出结果
答案: 【preprocessing.scale()计算零-均值(z-score)标准化结果】
13、 问题:D12程序17 数据分组import pandas as pd #导入pandas库命名为pdfrom pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行,在原数据中修改bins=[min(df.法律基础)-1,60,70,80,max(df.法律基础)+1] #此行的功能?lab=[‘不及格’,’及格’,’良好’,’优秀’] #此行的功能?demo=pd.cut(df.法律基础,bins,right=False,labels=lab) #此行的功能?df[‘法律基础等级’]=demo #此行的功能?print(df.head()) #输出处理后的df表前5行
答案: 【60以下,70以下,80以下,80以上分为四段
分别建立’不及格’,’及格’,’良好’,’优秀’四组标签
pd.cut()函数进行分组及标签匹配
将分组结果保存为法律基础等级列,追加到原表中】
一、初识可视化 章节测验1
1、 问题:第一张有意义的饼图的绘制者是
选项:
A:弗罗伦斯.南丁格尔
B:约翰.斯诺
C:查尔斯.约瑟夫.米纳德
D:威廉.普莱菲
答案: 【威廉.普莱菲】
2、 问题:拿破仑行军图的制作者是
选项:
A:威廉.普莱菲
B:查尔斯.约瑟夫.米纳德
C:弗罗伦斯.南丁格尔
D:约翰.斯诺
答案: 【查尔斯.约瑟夫.米纳德】
3、 问题:上图是世界上第一张玫瑰图,它的重要意义在于
选项:
A:它画的很漂亮
B:它帮助决策者做出了更合理的行动
C:它的创作者是白衣天使南丁格尔
D:它直观的揭示了当时士兵的死亡原因更多是感染疾病和缺乏适当的护理
答案: 【它直观的揭示了当时士兵的死亡原因更多是感染疾病和缺乏适当的护理】
4、 问题:数据可视化最主要的优势在于
选项:
A:图表可以采用丰富的色彩,容易引起他人注意
B:可视化图表制作更为简单便捷
C:人类对图像的处理速度比文本快6万倍
D:更符合互联网与大数据时代的技术发展趋势
答案: 【人类对图像的处理速度比文本快6万倍】
5、 问题:联合利华的logo体现了格式塔理论中的
选项:
A:接近原则
B:相似原则
C:对称原则
D:连续原则
答案: 【接近原则】
6、 问题:股市K线图利用了格式塔理论中的
选项:
A:接近原则
B:相似原则
C:连续原则
D:闭合原则
答案: 【连续原则】
7、 问题:红点设计大奖的logo体现了格式塔理论中的
选项:
A:连续原则
B:接近原则
C:共势原则
D:闭合原则
答案: 【闭合原则】
8、 问题:上图中的设计体现了格式塔理论中的
选项:
A:对称原则
B:简单原则
C:共势原则
D:相似原则
答案: 【共势原则】
9、 问题:广义的数据可视化包括哪些领域?
选项:
A:信息可视化
B:科学可视化
C:可视分析学
D:知识可视化
答案: 【信息可视化;
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦