2021 城市大数据分析(兰州城市学院) 最新满分章节测试答案

文章目录[隐藏]

第二章数据处理 D12 随堂作业
一、初识可视化章节测验1
三、定性数据可视化章节测验2
四、定量数据可视化章节测试3
五、时空数据可视化章节测试4

本答案对应课程为:点我自动跳转查看
本课程起止时间为:2021-09-13到2022-01-31
本篇答案更新状态:已完结

第二章数据处理 D12 随堂作业

1、问题:#D11程序05 sort_index()from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:4] #将前5行赋值给aa.sort_index(ascending=False,inplace=True) #此行功能？print(a) #输出a的结果
答案: 【sort_index()按照索引进行排序，ascending=False降序排列，inplace=True源数据覆盖】

2、问题:#D11程序06 Series.rank()import pandas as pd #导入pandas库命名为pdser = pd.Series([5, 0, 3, 8, 4], index=list(‘abcde’)) #创建新数组，同时为其指定索引print(ser) #输出当前数组print(ser.rank()) #此行功能？
答案: 【Series.rank()按照数值进行排名，给出排序结果】

3、问题:#D11程序07 Series.rank()import pandas as pd #导入pandas库命名为pdser = pd.Series([5, 0, 3, 8, 3], index=list(‘abcde’)) #创建新数组，同时为其指定索引print(ser) #输出当前数组print(ser.rank()) print(ser.rank(method=’min’)) #此行功能？与ser.rank()有何不同？print(ser.rank(method=’max’)) #此行功能？与ser.rank()有何不同？print(ser.rank(method=’first’)) #此行功能？与ser.rank()有何不同？print(ser.rank(method=’first’,ascending=False)) #此行功能？与ser.rank()有何不同？
答案: 【Series.rank()排名函数，有重复值时，默认按平均名次排名。method=’min’按最小名次排名，method=’max’按最大名次排名，method=’first’按第一次出现的名次排名，ascending=False降序排名】

4、问题:from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:5] #将前6行赋值给aprint(a) #输出aa=a.reindex([0,1,6,7,2,3,4,5]) #此行功能？print(a) #输出aa.reset_index(drop=True,inplace=True) #此行功能？print(a) #输出a
答案: 【reindex()重新索引，在原2、3行之间插入索引号6、7两行。
reset_index(）重建索引，建立新索引从新排序索引号。】

5、问题:from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:4] #将前5行赋值给aprint(a) #输出ahang=[1,2,0,3,4] #创建一个新列表a=a.reindex(hang) #此行功能？print(a) #输出a
答案: 【reindex()函数按照原表索引号，以hang列表的顺序进行重新排序】

6、问题:#D11程序10 concat()import pandas as pd #导入pandas库命名为pdfrom pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据a=df.loc[0:3] #将前4行赋值给ab=df.loc[30:33] #将前30-33行赋值给bc=pd.concat([a,b]) #此行功能？print(c) #输出cc=pd.concat([a,b],ignore_index=True) #此行功能？print(c) #输出c
答案: 【concat()记录合并函数，将a和b组合成为新表c，保留原索引。
ignore_index=True删除原索引重建新索引】

7、问题:D11程序11 from pandas import DataFrame #导入pandas库的DataFrame类from pandas import read_exceldf=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #载入Excel表数据df[‘手机’]=df[‘手机’].astype(str) #将手机列转换为字符型bands=df[‘手机’].str.slice(0,3) #截取手机的前三位赋值给bandsprint(bands)areas=df[‘手机’].str.slice(3,7) #截取手机的4-7位赋值给areasprint(areas)tell=df[‘手机’].str.slice(7,11) #截取手机的8-11位赋值给areasprint(tell)df1=DataFrame({‘band’:bands,’areas’:areas,’num’:tell}) #此行功能？print(df1) #输出新表df1df1=df1.astype(str) #将df1中的数据转换为字符串型tel=df1[‘band’]+df1[‘areas’]+df1[‘num’] #此行功能？df1[‘tel’]=tel #将tel中的数据作为新的tel列追加到df1表中print(df1) #输出df1表
答案: 【新建表df1,三列分别为bands、areas、num。
新建tel变量，将三列进行连接后保存。】

8、问题:#D11程序12 pd.merge()import pandas as pdfrom pandas import read_exceldf1=read_excel(r’C:\大数据程序\D9数据处理1\学生成绩.xlsx’) df2=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #分别载入两张Excel表，分别赋值给df1和df2df=pd.merge(df1,df2,on=’学号’,how=’left’) #此行功能？print(df) #输出df表
答案: 【df1表与df2表按照学号字段进行匹配，合并后df表显示学生的全部信息。】

9、问题:#D11程序13 pd.merge()import pandas as pdfrom pandas import read_exceldf1=read_excel(r’C:\大数据程序\D9数据处理1\学生成绩.xlsx’)df2=read_excel(r’C:\大数据程序\D10数据处理2\手机号码.xlsx’) #分别载入两张Excel表，分别赋值给df1和df2a=df2.drop([‘姓名’,’IP地址’],axis=1)df=pd.merge(df1,a,on=’学号’,how=’left’) #以上两行的功能？print(df) #输出df表
答案: 【删除df2中的IP姓名、IP地址字段，保留学号和电话，df1表与df2表按照学号字段进行匹配，合并后df表显示学生的成绩以及电话。】

10、问题:#D12程序14 简单计算from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行，在原数据中修改yy=df[‘英语’].astype(int)gs=df[‘高数’].astype(int)jsj=df[‘计算机’].astype(int)df[‘三门平均分’]=(yy+gs+jsj)/3 #以上四行的功能？print(df.head()) #输出处理后df表前5行
答案: 【三列成绩转换为int整数型，计算平均分，作为“三门平均分”列追加入原表中】

11、问题:D12程序15 标准化from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行，在原数据中修改scale=(df.体育.astype(int)-df.体育.astype(int).min())/(df.体育.astype(int).max()-df.体育.astype(int).min()) #此行功能？print(‘体育成绩标准化结果：’)print(scale) #输出结果
答案: 【用体育成绩减去全班最低分，再除以（最高分-最低分），计算标准化结果】

12、问题:D12程序16 z-score标准化from sklearn import preprocessing #导入sklearn库的preprocessing类from pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行，在原数据中修改df1=df[‘体育’] #提取df表体育一列，赋值给df1df[‘体育z-score标准化’]=preprocessing.scale(df1) #此行的功能？print(df) #输出结果
答案: 【preprocessing.scale(）计算零-均值（z-score）标准化结果】

13、问题:D12程序17 数据分组import pandas as pd #导入pandas库命名为pdfrom pandas import read_exceldf=read_excel(r’C:\大数据程序\D11数据处理3\学生成绩1.xlsx’) #载入Excel表数据print(df.head()) #输出前5行df.dropna(inplace=True) #删除含有空值的行，在原数据中修改bins=[min(df.法律基础)-1,60,70,80,max(df.法律基础)+1] #此行的功能？lab=[‘不及格’,’及格’,’良好’,’优秀’] #此行的功能？demo=pd.cut(df.法律基础,bins,right=False,labels=lab) #此行的功能？df[‘法律基础等级’]=demo #此行的功能？print(df.head()) #输出处理后的df表前5行
答案: 【60以下，70以下，80以下，80以上分为四段
分别建立’不及格’,’及格’,’良好’,’优秀’四组标签
pd.cut()函数进行分组及标签匹配
将分组结果保存为法律基础等级列，追加到原表中】