2022 搜索引擎技术基础(华中科技大学)1467622444 最新满分章节测试答案
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2022-03-28到2022-06-30
1. 引言 第一章测试
1、 问题:搜索引擎的核心价值是
选项:
A:让人们最便捷地获取信息,找到所求
B:总能搜索到用户想要的信息
C:方便的网购
D:便捷的网上交流
答案: 【让人们最便捷地获取信息,找到所求】
2、 问题:世界上第一个基于互联网的检索服务的搜索引擎是
选项:
A:Gopher
B:Wanderer/Wandex
C:Archie
D:Yahoo!
答案: 【Archie】
3、 问题:世界上第一个搜索引擎是
选项:
A:Gopher
B:Wanderer/Wandex
C:Archie
D:Yahoo!
答案: 【Wanderer/Wandex】
4、 问题:第一个全文字符检索的搜索引擎是
选项:
A:Gopher
B:Infoseek
C:Lycos
D:WebCrawler
答案: 【WebCrawler】
5、 问题:全球最大的中文搜索引擎是
选项:
A:谷歌
B:百度
C:雅虎
D:新浪
答案: 【百度】
6、 问题:Google的创始人是
选项:
A:拉里·佩奇(Larry Page)和 谢盖尔·布林(Segey Brin)
B:埃利克·施密特(Eric Schmidt)
C:桑达尔·皮查伊(Sundar Pichai)
D:马克·艾略特·扎克伯格(Mark Elliot Zuckerberg)
答案: 【拉里·佩奇(Larry Page)和 谢盖尔·布林(Segey Brin)】
7、 问题:以下关于搜索引擎的表述,正确的是
选项:
A:根据一定的策略、运用特定的计算机程序搜集互联网上的信息
B:在对信息进行组织和处理后,为用户提供检索服务的系统
C:它是一种网上信息检索工具,多以Web(万维网)站点形式存在
D:搜索引擎网站的主要资源与一般网站没有什么不同
答案: 【根据一定的策略、运用特定的计算机程序搜集互联网上的信息;
在对信息进行组织和处理后,为用户提供检索服务的系统;
它是一种网上信息检索工具,多以Web(万维网)站点形式存在】
8、 问题:搜索引擎获得成功的原因是
选项:
A:简单易用
B:互联网上的海量数据
C:界面漂亮
D:资金充沛
答案: 【简单易用;
互联网上的海量数据】
9、 问题:搜索引擎面临哪些挑战
选项:
A:海量数据
B:海量需求
C:复杂处理
D:快速服务
答案: 【海量数据;
海量需求;
复杂处理;
快速服务】
10、 问题:下面说法正确的是
选项:
A:百度创立于2000年
B:百度名字取自于诗句“众里寻他千百度”
C:百度的创始人是马化腾
D:百度公司于2008年8月5日美国纳斯达克上市
答案: 【百度创立于2000年;
百度名字取自于诗句“众里寻他千百度”】
2. 搜索引擎的结构与组成 第二章测试
1、 问题:下面说法错误的是
选项:
A:停止词指在文档中没有太多实际意义的词,这些词是没有必要进行索引的
B:静态摘要比较简单,但是由于多Topic问题的存在,效果往往不好
C:现代搜索引擎往往采用静态摘要
D:对用户的初始查询进行修改是比查询扩展更泛的一个概念
答案: 【现代搜索引擎往往采用静态摘要】
2、 问题:以下搜索引擎的说法正确的是
选项:
A:根据一定的策略、运用特定的计算机程序搜集互联网上的信息
B:在对信息进行组织和处理后,为用户提供检索服务的系统
C:搜索引擎通过蜘蛛或爬虫获取页面信息
D:爬虫是通过页面间的链接关系自动获取页面信息
答案: 【根据一定的策略、运用特定的计算机程序搜集互联网上的信息;
在对信息进行组织和处理后,为用户提供检索服务的系统;
搜索引擎通过蜘蛛或爬虫获取页面信息;
爬虫是通过页面间的链接关系自动获取页面信息】
3、 问题:搜索引擎的结构包括
选项:
A:网页抓取模块
B:预处理模块
C:索引模块
D:检索模块
E:用户接口
答案: 【网页抓取模块;
预处理模块;
索引模块;
检索模块;
用户接口】
4、 问题:搜索引擎的网页的遍历算法主要包括
选项:
A:高频词优先
B:深度优先
C:广度优先
D:热门词优先
答案: 【深度优先;
广度优先】
5、 问题:以下关于深度和广度优先遍历算法表述正确的是
选项:
A:广度优先先沿一条路径采到叶节点,再从同层其他路径进行采集
B:深度优先效率较低
C:广度优先效率较高
D:深度优先先采集完同一层网页,再采集下一层网页
答案: 【深度优先效率较低 ;
广度优先效率较高 】
6、 问题:评估搜索引擎质量的指标包括
选项:
A:全
B:新
C:快
D:准
E:稳
答案: 【全;
新;
快;
准;
稳】
7、 问题:关于网络爬虫,下面说法不正确的是
选项:
A:分布式系统的通讯开销是影响性能的关键
B:网站之间采用深度优先遍历算法,某一个网站采用广度优先遍历算法
C:网络爬虫的遍历算法要尽量避免握手的次数,减少通信开销
D:由成百上千甚至成千上万台服务器组成的分布式系统
答案: 【分布式系统的通讯开销是影响性能的关键;
网络爬虫的遍历算法要尽量避免握手的次数,减少通信开销;
由成百上千甚至成千上万台服务器组成的分布式系统】
8、 问题:中文分词方法可以分为
选项:
A:基于词典(字符串匹配)的分词方法
B:基于统计的分词方法-统计语言模型
C:基于链接的分词方法
D:混合分词方法
答案: 【基于词典(字符串匹配)的分词方法;
基于统计的分词方法-统计语言模型;
混合分词方法】
9、 问题:对于基于统计的分词方法,以下说法正确的是
选项:
A:对需要分词的材料进行分析,得到相应的单字出现的概率
B:相邻的字出现的概率,远远大于单字出现的概率之和,则有可能成为一个词
C:可以结合上下文识别生词
D:对常见词的识别精度差,计算量大
答案: 【对需要分词的材料进行分析,得到相应的单字出现的概率;
相邻的字出现的概率,远远大于单字出现的概率之和,则有可能成为一个词;
可以结合上下文识别生词;
对常见词的识别精度差,计算量大】
10、 问题:搜索引擎的主要组成部分有
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦