2022知到答案 网络数据爬取与处理 最新完整智慧树知到满分章节测试答案
第一章 单元测试
1、 问题:以下描述错误的是( )。
选项:
A:Jupyter notebook是一个基于网页交互的编程环境
B:Jupyter notebook可通过Markdown语法编写说明文档
C:Anaconda只提供了Jupyter notebook编程环境
D:Anaconda是一个开源的Python发行版本
答案: 【
Anaconda只提供了Jupyter notebook编程环境
】
2、 问题:以下描述错误的是( C)。
以下哪一项不属于数据科学的基本任务( )。
选项:
A:获取数据
B:处理数据
C:分析数据
D:存储数据
答案: 【
存储数据
】
3、 问题:以下关于数据科学的说法中,正确的是( )。
选项:
A:数据科学就是研究数学的科学
B:计算工具的革新,数据量的持续增长推动了数据科学的发展。
C:数据科学只适用于科学研究,对我们日常生活没有关系
D:对大数据的采集就是数据科学
答案: 【
计算工具的革新,数据量的持续增长推动了数据科学的发展。
】
4、 问题:智能健康手环的运用了以下哪一项数据采集技术( )。
选项:
A:统计报表
B:网络爬虫
C:API接口
D:传感器
答案: 【
传感器
】
5、 问题:下列关于大数据特点的说法中,错误的是( ).
选项:
A:数据规模大
B:数据类型多样
C:数据生成和处理速度快
D:数据价值密度高。
答案: 【
数据价值密度高。
】
第二章 单元测试
1、 问题:下列选项哪不是爬虫程序的常见类型( )。
选项:
A:聚焦网络爬虫
B:通用网络爬虫
C:增量式网络爬虫
D:深层式网络爬虫
答案: 【
深层式网络爬虫
】
2、 问题:以下关于实现网络爬虫程序的描述中,错误的是( )。
选项:
A:通过Python编写网络爬虫程序,本质上是模拟人类浏览网页的行为
B:通过爬虫程序获取的数据文件均为HTML文件
C:编写爬虫程序前,可以使用浏览器自带的开发者工具,对我们发出的请求和接受到的响应进行分析
D:网络爬虫是自动获取互联网上公开数据的程序
答案: 【
通过爬虫程序获取的数据文件均为HTML文件
】
3、 问题:通过浏览器访问网站服务器的过程,描述错误的是( )。
选项:
A:TCP协议规范了超文本标记语言的语法格式
B:HTTP协议规范了请求与响应的过程
C:互联网上公开数据的地址是由URL协议规范
D:参与对象包:括浏览器、域名解析服务器、网站服务器
答案: 【
TCP协议规范了超文本标记语言的语法格式
】
4、 问题:下列不属于常用反爬虫手段的是( )。
选项:
A:限制访问频率
B:人工筛查
C:对请求头的检测
D:验证码校验
答案: 【
人工筛查
】
5、 问题:以下关于爬虫程序的描述中,正确的是( )。
选项:
A:爬虫程序可以爬取互联网上任意数据
B:爬虫程序执行时应避免对服务器造成过载
C:通过爬虫程序获取的数据可用于商业用途
D:通过爬虫程序获取的数据可在互联网上公开
答案: 【
爬虫程序执行时应避免对服务器造成过载
】
第三章 单元测试
1、 问题:以下关于re库的描述中,错误的是( )。
选项:
A:re库是Python的第三方库
B:可re库提取HTML文档中的数据
C:re.findall( )方法返回的数据类型为列表
D:可通过re库实现字符串的正则表达式匹配
答案: 【
re库是Python的第三方库
】
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦