愚愚学院之学生
级别: 荣誉元老
UID: 2282
精华: 1
发帖: 626
威望: 314 点
积分转换
愚愚币: 0 YYB
在线充值
贡献值: 0 点
在线时间: 2008(小时)
注册时间: 2006-07-13
最后登录: 2024-09-27
楼主  发表于: 2006-10-23 16:37

 Internet查询常识

搜索引擎的种类
  随着搜索引擎的数量剧增,其种类也越来越多。它们可以按照工作语种、内容组织方式及搜索范围等方式加以区分。
1. 按工作语种区分

  搜索引擎按工作语种可以区分为下列类型:
(1) 单语种搜索引擎。单语种搜索引擎是指搜索时只能用一种语言查询的搜索引擎。

(2) 多语种搜索引擎。多语种搜索引擎是指那些可以用多种语言查询的搜索引擎。如Altavista,该网站可以用25 种语言进行查询。

2. 按内容组织方式区分

  搜索引擎按内容组织方式可以区分为下列类型:
(1) 目录式搜索引擎(网站级)。目录式搜索引擎提供了一份按类别编排的Internet 网站目录,各类下边排列着属于这一类别的网站的站名和网址链接,有些搜索引擎还提供了各网站的内容提要。

(2) 全文搜索引擎(网页级)。当全文搜索引擎搜索到一个网站时,会将该网站上所有的文章(网页)全部记录下来,并收入到引擎的数据库中。只要用户输入查询的关键词在引擎数据库中的某个主页中出现过,则这个主页就会作为匹配结果提供给用户。

3. 按搜索范围区分

  搜索引擎按搜索范围可以区分为下列类型:
(1) 独立搜索引擎。维普的搜索属于该类搜索引擎,这类搜索引擎检索时只在自己的数据库内进行,由其反馈出相应的查询信息,或者是相链接的站点指向。每个独立的搜索引擎都会有自己的查询特色,例如:目录查询、全文查询、简单查询、高级查询等。

(2) 多元搜索引擎。多元搜索引擎又称集成搜索引擎。它是将多个独立搜索引擎在一起,提供一个统一的检索界面,当用户提出检索提问后,它会将其发送给多个搜索引擎,同时检索多个数据库,并进行相关度排序后,将结果显示给用户。利用这类搜索引擎能够获得更大范围的信息源,检索的综合性、全面性也有所提高。不过这样的搜索引擎的缺点是查询时间相对较长。

搜索引擎的一般查询规则

  利用搜索引擎既可以检索出Internet 上的文献信息,还可以查找到公司和个人的信息;既可以通过输入单词、词组或短语进行检索,还可以使用逻辑算符及位置算符等对多个词进行组合检索;既可以以词语查询有关主题的页面信息,也可以以特定的域名、主机名、URL 等查找有关的网站信息。搜索引擎是基于一些基本的查询规则来实现这些查询条件的,但各个搜索引擎所采用的查询规则又不尽相同。下面介绍的是常用的一般查询规则。

1. 布尔逻辑算符
(1) 逻辑“与”
  逻辑“与”一般用“AND”表示,有的搜索引擎还可以用“&”表示。使用逻辑“与”是为了要求检索结果的Web 页面中同时出现所有输入的检索词,提高查准率。
(2) 逻辑“或”
  逻辑“或”一般用“OR”表示,有的搜索引擎还可以用“|”表示。使用逻辑“或”是为了允许检索结果的Web 页面中出现输入检索词的任何一个,提高查全率。
(3) 逻辑“非”
  逻辑“非”一般用“NOT”表示,有的搜索引擎还可用“!”表示。使用逻辑“非”是为了要求检索结果的Web 页面中出现NOT 前的检索词,但排除含有NOT 后的检索词的页面信息,以缩小检索范围。

2. 连接符
  连接符有加号(+)和减号(-)。
(1) 在检索词前使用“+”时,表示所有检索结果的页面中都必须包含该词。例如:检索式“+A+B”,表示查得的页面中应出现“A”和“B”方面的信息;而检索式“A+B”,则表示在检索结果页面中一定含有“B”,但不一定有“A”的信息。

(2) 检索词前使用“-”时,表示任何检索结果的页面中都不能包含该词。例如:检索式“microwave-ceramic”,则表示查找关于microwave 的页面,但排除那些和ceramic 有关的页面。

3. 截词符

  截词符一般用星号(*)表示。当“*”置于一个词的未尾时,表示将相同词干的词全部检索出来。例如;检索式“compu*”,则表示可以检索到computer、computing、compulsion 等词。有一些搜索引擎支持自动截词,用户不需要专门输入截词符,系统自动将相同词干的词全部找出来。请用户注意:“*”不能用在检索词的开始和中间。维普目前不支持前截词和尾截词查询。
4. 邻近符 

  邻近符(NEAR)用于检索在一定区域范围内同时出现的检索词的文献,它指定了检索词之间的距离。用NEAR/n(n 为1,2,3…)精确控制检索词之间的距离,表示检索词的间距最大不超过n 个单词。例如:检索式“Computer near/10 Network”,可查找出computer 和Network 两词之间插入不大于10 个单词的文献,检索结果输出时,间隔越小的排列位置越靠前。

5. 空格、逗号、括号、引号的作用(请注意:维普目前不支持括号检索)

(1) 空格
  空格的作用与逻辑“与”(AND)相同。例如:检索式“aircraft engine”,表示可查出含有“aircraft”及“engine”的页面。在汉字作为关键词输入时,切记不要在构成关键词的两个字之间插入空格,否则,就会发生两个字之间进行逻辑“与”的检索错误。例如:用户要查找“飞机”这个关键词,但却输入了“飞机”,由于“飞”和“机”两字之间插入了空格,而被处理为“与”的关系,查出所有同时含有“飞”和“机”两个字的页面。这个检索结果的范围要比“飞机”作关键词的结果扩大了很多,许多结果中已不含有与“飞机”相关的信息。

(2) 逗号
  逗号(,)的作用类似于逻辑“或”(OR),也是查找那些至少含有一个指定关键词的页面,区别是,检索结果输出时,包含指定关键词越多的页面,其排列的位置越靠前。例如,检索式“计算机,网络,多媒体”,可查出包含三个关键词中的任何一个或几个的页面,而同时含有“计算机”、“网络”和“多媒体”的页面输出时排在前面。

(3) 括号
  括号“( )”的作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。例如,检索式“多媒体and (计算机or 网络)”,表示要求先执行括号中的“OR”运算,再执行括号外的“AND”运算。

(4) 引号
  引号(“ ”)的作用是,括在其中的多个词被当作一个短语来检索。绝大部分主要搜索引擎都支持短语检索,找到含有与短语词序和意义完全相同的页面。例如,检索式“electronic magazine”,表示把electronic magazine 当作一个短语来搜索。如果不加引号,搜索引擎就会把两词之间的空格按“与”处理,查出包含electronic 和magazine 的页面,结果应与用户要求的主题内容相去甚远。

6. 限定字段检索

  限定字段检索,即限定检索词在搜索引擎数据库中某个字段范围进行查找,如网页标题、站点、网址、链接等。

(1) 标题检索
  标题检索就是在网页的标题中查找输入的检索词,使用的命令一般是“title”,其格式为:
title:检索式
例如:title:mars
title:mars landings
title:“mars landings”

(2) 站点检索
  站点检索就是在网站地址域名中检索输入的词,以查找用户指定站点上的所有页面。使用的命令一般是“host”,其格式为:host:域名中的词,例如:
检索式“host:digital.com”,表示可以检索出WWW 服务器中主机名为“digital.com”的网页。假如想要查找关于火星着陆方面的资料,并且只想在教育网站(后缀为.edu)中查找,可以输入这样的检索式:“mars landings”+ host:edu

(3) URL 检索
  有些搜索引擎提供在URL 的文本中进行检索的功能,这和站点检索非常相似。使用的命令一般是“url”,其格式为:
url:URL 中的词
例如,检索式“url:home.html”可以检索出在网页地址中含有“home.html”的页
面。

(4) 链接检索
  链接检索就是在与特定网页或域有链接的所有网页中进行检索。使用的命令一般是“link”,其格式为:
link:特定网页或域中的词
例如,检索式“link:thomas.gov”可以检索出与“thomas.gov”至少有一次链接的页
面。
分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。