分享

网络信息检索技巧之二

 梨落野花 2006-12-11

11.尽可能将搜索范围限制在特定的领域里
比如:在 Yahoo 中文网站中,你要查找的是与电脑相关的知识,那么你没有必要让搜索引擎在休闲与运动、健康与医药、艺术与人文等其他分类中查找。你可以进入电脑与因特网这一类,选中检索此目录下的网站。然后再开始搜索。
                                                         
                                                         
12.
使用更特定的词汇
比如,不用服装,而用西服;不用“ flower ”而用“ rose ” 但要尽可能删去一些同义词或近义词。
                                                         
                                                         
13.
指定关键词出现的字段
在关键词前加t:,搜索引擎将仅在网站名称中查询,即只显示在网站名称中包含关键字的网站。
在关键词前加u:,搜索引擎将仅在网址(URL)中查询。
                                                         
                                                         
14.
限制查询范围
范围限制的能力越强,则越能准确地找到需要的信息。搜索引擎提供的范围限制类型大体有分类范围、地域范围、时间范围、网站类型范围以及其他特殊范围。一些搜索引擎,提供了许多特殊范围的限定,如域名后缀(comgovorg等)、文件类型(文本、图形、声音等)。这些范围限制、实现的方法各不相同:有些是通过在关键词前加特殊的字符,有些是通过下拉式菜单。
                                                         
                                                         
15.
尽量少用空格
在输入汉字作关键词的时候,不要在汉字后追加不必要的空格,因为空格将被认作特殊操作符,其作用与AND一样。比如,你输入了这样的关键词 ,那么它不会被当作一个完整词电脑去查询,由于中间有空格,会被认为是需要查出所有同时包含”“两个字的文档,这个范围就要比电脑作关键词的查询结果大多了,更重要的是它偏离了本来的含义。
                                                         
                                                         
16.
修改IE浏览器的默认搜索引擎
IE4.0/IE5.0的工具栏上,点击搜索图标,IE就会调用缺省的搜索引擎Excite为你检索。要想改变缺省的搜索引擎,你必须改动Win98的注册表。IE4.0修改方法是:关闭IE,打开注册表编辑器,找到[HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\Main],在右侧窗格中双击查找,输入要改变的默认搜索引擎网址,例如把缺省搜索引擎改为google,此时就键入http://www.google.com/
IE5.0/6.0
修改方法是:打开注册表编辑器,找到[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Internet Explorer\Search],在右侧窗格中修改CustomizeSearchSearchAssistant的内容,输入要改变的默认搜索引擎网址。
                                                         
                                                         
17.
使用词组提速搜索
如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组)”的网页。
                                                         
                                                         
18.
如何运用词组选择
一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能奏效,尤其是在Altavista这个站点上,因为它采用了“Ask Jeeves”引擎技术,该技术就常见问题给出预置的答案。
Altavista上输入“ Why is the sky blue(为什么天是蓝的)”,就会在“Ask Jeeves"部分找到答案,并给出若干网页回答这个问题。然而简单明了的提问方法只对一部分搜索奏效。其他词组也可以作为搜索条件,尤其这些词组中有一个词十分独特或者该词组是几个词独特的组合。试一试用人名、产品名、甚至是嵌入程序中的字符串去搜索。
                                                         
                                                         
19.
巧妙利用错误信息
将全部或部分错误信息作为词组进行搜索。比如:当夏时制时间变化时,Netscape Navigator (浏览器)会产生一条错误信息,该信息包含词组“book marks have changed on disk(磁盘书签已变动)”。在googleHotBot站点上输入该词组,就会找到对该问题的解释以及如何处理。
                                                         
                                                         
20.
最容易忽视的搜索方法
有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术简单得似乎不值一提,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的站点。如果猜不中,那么到Yahoo去,或用搜索引擎。例如,要找Dell公司现有附件的说明书,直接去该站点www.,想知道Oracle公司有什么新闻,试一试www.oracle.com,然后再去新闻栏看一看。人们在搜索引擎中得到很多无用信息,却忘了试一试该方法。这种技术还可用于其他搜索目的,并不一定与公司有关。政府机构、职业协会、教育机构也可以提供很好的信息资源。有关人口统计请去www.,还能去www.看看最近的会议清单。
                                                         
                                                         
21.
从页面上部或底部寻找作者姓名、组织机构名称或公司名称
如果是个人页面,那么是否有作者的简介,看看他的受教育程度、职位、所属单位等;如果是一个组织机构或公司,是否有详细的介绍页面,其历史怎样?发布这些信息的目的如何?这些个人或单位你是否听说过?是否是你所熟悉的?信誉是否良好?等这些都有助于让你判读出其页面内容的可信程度。
                                                         
                                                         
22.
URL上可以得到一些该网站的线索
比如:凡带“ ~ ”符号的大都是个人主页。从域名的后缀上也可以得到一些大概的线索:
.edu
是教育类网站,既可能是严肃的学术研究,也可能是学生随意制作的主页。
.gov
.gov.cn 是政府网站,一般比较权威、可靠,不会随意发布不准确的信息。
.com
.com.cn 是商业网站,最常见。在介绍自己的产品时往往会夸大其辞,所以要注意批判性地接受。
.net
网络服务公司,为商业或个人用户提供服务。
.org
一般是非赢利性组织,其观点可能带有倾向性。
                                                         
                                                         
23.
点到该站点的主页上,看一下该组织的相关资料
如果页面上没有其主页的链接,可以直接访问域名前部的地址,那往往就是该网站的首页。如: http://www./staticp ... r_schedule/asp.html 这一大串网址,你只需要把地址中“/staticpages”以后的所有字母都删去,只留下 http://www.,然后敲回车,往往就能看到该网址的首页。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多