• 正在加载中...
  • GOOGLE网页搜索

    谷歌网页搜索(Googlewww.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。谷歌网页搜索技术,大部分在百度等搜索引擎中也适用。同样,这些搜索技术是来源于传统数据库检索技术。GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。

    编辑摘要

    基本信息 编辑信息模块

    中文名: GOOGLE网页搜索
    时间: 1998年9月 发明者: Larry Page与Sergey Brin
    所属公司: GOOGLE

    目录

    简介/GOOGLE网页搜索 编辑

    谷歌网页搜索(Google,www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同"网页快照",通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的"网页快照"功能。[1]

    网络地址/GOOGLE网页搜索 编辑

    中文网址:http://www.google.cn/
    英文网址:http://www.google.com/

    谷歌搜索的意义/GOOGLE网页搜索 编辑

    谷歌网页搜索技术,大部分在百度等搜索引擎中也适用。同样,这些搜索技术是来源于传统数据库检索技术,因而,对这部分的学习,能为后续章节的数据库检索奠定基础,并能获得直观的认识。本部分结合应用实例的讲解也能让我们加深信息检索对解决实际问题、提高搜索效率的认知。
    本节中一些实例中的括号“【】”中的内容直接在谷歌搜索框中输入可查看效果,最快捷的方式是将实例的链接在新窗口中打开,既能看到输入的检索策略,也能直接看到搜索效果。

    搜索语法与高级搜索说明/GOOGLE网页搜索 编辑

    谷歌网页搜索之高级搜索需要注意的是,所有的搜索语法和搜索符号必须是半角状态(即英文输入模式)。很多搜索语法也可以通过谷歌网页搜索之高级搜索来实现(如图2),在谷歌首页点击“高级”即可进入高级搜索界面。

    一般搜索技术与实例/GOOGLE网页搜索 编辑

    默认模糊搜索、自动拆分短语

    谷歌网页搜索谷歌网页搜索

    同许多搜索引擎一样,当直接在搜索框中输入搜索词时,谷歌默认进行模糊搜索,并能对长短语或语句进行自动拆分成小的词进行搜索。

    实例:【市场研究报告】,自动拆分为市场研究、市场、研究等。

    短语精确搜索

     给关键词加上半角引号实现精确搜索。

    实例:【"市场研究报告"】

    通配符

     谷歌的通配符是星号“*”,必须在精确搜索符双引号内部使用。用通配符代替关键词或短语中无法确定的字词,实例:

    搜索市场调查研究报告、市场年度研究报告等内容时:【"市场*研究报告"】
    搜索歌词:【"I be * waiting for you"】
    搜索诗句:【"解落*秋叶"】
    搜索另类说法,如“轻轻的我走了,正如我轻轻的来”的另类说法:【"*的我走了,正如我*的来"】
    搜索英文的多种形态,如comput、computing等:【"comput*"】

    点号匹配任意字符

     与通配符星号“*”不一样的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有[、(、-等

    搜索有关中国的各种大全:【"大全.中国"】,或者不要精确搜索的双引号【大全.中国】百度支持不明显。

    布尔逻辑

    布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多搜索引擎一样,多个词见的逻辑关系默认的是逻辑与(空格)。当用逻辑算符的时候,词与逻辑算符之间用需要空格分隔,包括后面讲的各种语法,均要有空格。逻辑非是特例,即减号必须与对应的词连在一起。对于复杂的逻辑关系,可用括号分组。

    逻辑与:【电子行业 AND 研究报告】,用空格和AND 以及小写搜索结果差别不大。此例是搜索电子行业的研究报告。
    逻辑或:【电子行业 AND 研究报告 AND (人才 | 风险)】此例是搜索电子行业的人才或风险方面的研究报告。
    逻辑非:【电子行业 AND 研究报告 AND (人才 | 风险) -2007】此例是搜索电子行业的人才或风险方面的研究报告,但不要2007年的。

    约束条件

    加号“+”用于强制搜索,即必须包含加号后的内容。一般与精确搜索符一起应用,如:

    【研究报告 +"学术信息资源开放目录"】

    同义词

    仅限于英文搜索。一般来说,加~符号会比不加搜索出来的多一些。总体来说效果不是很明显。百度和谷歌都支持。

    【~PC】能搜索出Computer、windows等内容。

    数字范围

    用两个点号“..”表示一个数字范围。一般应用于日期、货币、尺寸、重量、高度等范围的搜索。用作范围时最好给一定的含义。百度不支持。

    【奥运会 1980..2004】当我们搜索奥运会的时候,特别是在2008年的时候搜索这个词,出现在搜索结果前几页的几乎全是2008年北京奥运会的相关信息,但是有人想了解进几届在其它地方主办的奥运会的情况。实例中就是搜索1980年到2004年间的奥运会信息。
    【格力空调 2000..2800 元】搜索价格区间。本例仅仅搜索格力空调的价格在2000元到2800元之间的信息。
    【格力空调 ..2800 元】2800元以下的。
    【格力空调 2800.. 元】2800元以上的。

    括号分组

    逻辑组配时分组,避免逻辑混乱。括号“()”是分组符号。

    【(格力空调 | 海尔空调 )元 2800..】2800元以上的格力空调或者海尔空调。

    谷歌高级搜索语法与实例/GOOGLE网页搜索 编辑

    标题中搜索

    谷歌网页搜索谷歌网页搜索

    通常标题是内容的高度概括,在标题中搜索的结果准确率会更高。谷歌搜索中限定搜索网页或文档标题的语法是:intitle或allintitle。allintitle是intitle的变体,相当于在各个搜索词前加上intitle。二者差别不明显,我们一般直接用intitle。

    【intitle:市场研究报告】在标题中搜索“市场研究报告”。

    正文中搜索

     仅仅在网页或文档的正文部分搜索。歌搜索中限定搜索网页或文档正文的语法是:intext或allintext。

    【intext:市场研究报告】在正文中搜索“市场研究报告”。 可以与在标题中搜索的结果(搜索结果条数、准确度)进行对比。

    网址中搜索

    歌搜索中限定搜索网址的语法是:inurl。是In-系指令中最强大的一个,换句话说,这个高级指令能够直接从网站的URL入手挖掘信息,只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源--甚至隐藏内容。网站构建者通常将某一类信息集中在一个网站的目录中,所以搜索URL中的词本身就是对某一方面内容的一个限定。如果在加上一定的词进行组配,搜索结果将更贴近需求。

    搜索图片--【inurl:photo】,搜索所有网络地址中包含“photo”的关键词的页面结果。如果说Google图象搜索侧重于展示图片,inurl搜索则让你在看到图片之前了解到页面大致的文字内容,更方便判断。  利用这一指令,你往往能够找到关键词的组图内容(指令中的photo也可以替代为picture、image等) 。
    搜索音乐--【inurl:mp3 毕业生】,在所有网络地址中包含“mp3”的页面中搜索“毕业生”。这个时候返回的“毕业生”肯定是音乐,而不是关于“毕业生”的其它话题。Google中搜索音乐的另一有效方式是MP3可以替换为wma/rm等。
    搜索软件--【inurl:download qq】,直接查找QQ软件的下载页面。
    搜索电子论文--【inurl:eprint "Information Retrieval"】 搜索有关Information Retrieval的电子论文(通常这类搜索结果能直接下载全文)。
    搜索特定网站中的内容【inurl:lib.nit.net.cn 讲座】搜索http://lib.nit.net.cn 网站中有“讲座”的内容,其中网络地址可以有目录,如lib.nit.net.cn/dlib 。

    锚链链接搜索

    在做网站中有时候用锚点来链接一个页面中的其它部分内容,这样方便浏览和定位。如本页面上方的目录导航,就是通过锚点链接来实现的,也就是说锚点链接的内容通常是网页内容中重要的章节或内容的开始部分,因而对它们的搜索也更能反映网页的主题内容,提高搜索结果的准确度。对于熟悉网页制作的人来说,可以从网页源代码中查看有锚点的HTML代码,如这就是一个锚链的链接:
    网页第一部分谷歌网页搜索在锚链链接中语法是:inanchor或allinanchor。搜索范围限制在页面的链接锚点描述文本进行搜索。

    【inanchor:信息经济学】搜索网页中有“信息经济学”锚链链接的网页。

    文档类型限定

    谷歌网页搜索不仅仅能搜索网页,还能搜索各种文档,通过文档类型限定只对文档进行搜索,从而不显示页面的内容。语法是:filetype。这个语法非常有用,我们在网上常常要找一些范文或参考资料的时候常用这个语法。filetype是根据文件后缀搜索特定文件类型,比如支持的文档有:pdf、ppt、doc、xls等;网页文件:htm、asp、php等。

    【市场研究报告 filetype:doc】 搜索有关市场研究报告的WORD文档。

    定义搜索

    谷歌网页搜索中搜索定义的语法是:define。用于搜索定义或解释。在阅读、学习、研究或撰写论文中,遇到陌生的词或缩写,可以用该语法得到确切的定义或解释。而且可以了解多种语言的定义情况。 【define:文献】得到关于文献的多个定义来源。

    网页相关信息搜索

    谷歌提供的网页相关信息搜索的语法是:info。通过这个语法能将网页的快照信息、网页链接情况、被链接情况和类似网页的信息供选择浏览。查看样例:【info:lib.nit.net.cn】,info语法是其它几个语法的集合:

    cache:搜索谷歌缓存的页面(快照信息)
    【cache:lib.nit.net.cn】当前cache语法不支持谷歌中文,本处给的链接实例是在谷歌英文中搜索的结果。用cache语法的一般情况是:当一个链接无法访问时(或信息被屏蔽时);当信息已经被修改,想看以前的信息时。
    related:搜索与特定网页相关的网站
    【related:google.cn】搜索的结果就是更多的搜索引擎。related语法对于发现某一类信息非常有用,比如当你用related搜索一个图书馆网址的时候会出来大量图书馆的网站,如【related:lib.nit.net.cn】;当搜索某期刊网址的时候,能搜索出大量给学科领域的相关期刊,如【related:www.lis.ac.cn】
    link:搜索所有链接到某个特定URL上的页面
    【link:lib.nit.net.cn】搜索链接到宁波理工学院图书馆的页面。做网站的人往往想知道是哪些网页链接了该网站。也可用于发现某一个页面(新闻、信息等)被什么网页引用(如博客中)或收藏。其实,最好的搜索策略应该是这样:【link:lib.nit.net.cn -site:lib.nit.net.cn】,删除自己链接自己的页面。
    site:搜索范围限制在某网站或顶级域名中。
    【医药 site:edu.cn】搜索我国教育科研网中关于“医药”的信息,比如医药院校或专业的信息等。这样能排除很多医药领域的公司信息。
    【site:lib.nit.net.cn】查看宁波理工学院图书馆的网页被谷歌收录(索引)的数量。比较不同图书馆(网站)在网络上的“大小”。
    【服务 site:lib.nit.net.cn】搜索宁波理工学院图书馆网站上的所有关于“服务”的页面。URL可以带路径,现在搜索该URL下的所有页面。

    混合使用搜索技术/GOOGLE网页搜索 编辑

    谷歌网页搜索谷歌网页搜索

     在搜索实践中,往往是多种搜索技术混合使用以满足特定的信息需求,前面的一些实例中就有体现。但是,混合使用的时候也要注意一些问题。

    混合搜索实例

     查找产业报告类的全文资料
    当然,可以直接用【产业报告】搜索,如果你掌握了一定的搜索语法知识,你可以这样搜索:【产业报告 filetype:doc】,能搜索到word格式的许多行业的产业报告文档。
    而且,你还可以近一步进行限定,搜索仅2005年以来的相关内容:【产业报告 filetype:doc 2005..】。这样搜索到的信息资源并不逊色于专门的数据库。
    查找市场调查报告范文
    与上例不同的是还用到了intitle进行限定,从而得到相对精确的搜索结果。【intitle:市场调查报告 filetype:doc】
    搜索非教科网上关于web2.0的会议
    【web2.0 会议 –inurl:edu.cn】
    搜索“轻轻的我走了,正如我轻轻的来”的另类说法,既然是另类说法,当然就不能包含“轻轻”。
    【"*的我走了,正如我*的来" –轻轻】
    混合使用intitle、site:【intitle:医药 site:edu.cn】
    inurl限定:限定搜索特定类别的信息。【"我和你" inurl:mp3】
    搜索特定网站内的文档(一网打尽!)。【filetype:ppt site:lib.nit.net.cn】

    不混合使用情况

     不混合使用有抵消的搜索:【药品说明书 sitenet.cn –inurl:net】
    不要重复使用同一语法结构【药品说明书site:cn site:com】但是可以【药品说明书 (site:cn | site:com)】
    在混合使用语法时,不要用别名。如allintitle。
    不要使用过多的语法将结果限制得特别狭窄,采取逐步增加限制的方法,一般不要一步到位。

    有趣的谷歌应用/GOOGLE网页搜索 编辑

    假日图标

    谷歌每逢节假日、纪念日或重大事件,会更改首页图标以示纪念。谷歌假日图标从1999至今的链接:http://www.google.com/holidaylogos.html

    随机私人相片

    随着使用数码相机拍照的人越来越多,很多人也喜欢将照片发布到网络上,网络上也有很多分享照片的网站。因为数码相机排的照片都会产生默认的文件名,比如我的数码相机默认的文件名是这样的模式:IMG_0295.JPG,很多人会象我一样懒,往网络上传照片或给朋友发送照片的时候是不会重命名照片的文件的。因而,我们可以通过类似的文件名,在谷歌中搜索出很多的照片。网络地址http://www.diddly.com/random/ 就是一个根据不同品牌、型号的数码相机随机产生照片的文件名,然后到谷哥中搜索。
    其实,我们可以通过谷歌搜索语法,在中文版本(http://images.google.cn/ )中实现搜索某一型号数码相机的照片,如:【"IMG_*.JPG" filetype:jpg】 说明:分号是短语搜索符(或精确搜索符),其中的星号是通配符filetype:jpg 是限定搜索文件的类型是JPG格式
    还有更多的格式,如(搜索时,多个#号用一个号*代替):
    "dcp*.jpg" - Kodak, range of 0 to 4000
    "dsc*.jpg" - Nikon, range of 0 to 4000
    "dscn*.jpg" - Nikon, range of 0 to 4000
    "mvc-*.jpg" - Sony Mavica
    "mvc*.jpg" - Sony Mavica

    重复输入一个关键词多次

     我们可以试一试,重复输入一个关键词若干次,然后比较搜索结果,如:“信息检索 信息检索 信息检索”,你会发现搜索结果数会变少,有时候也不一定会有太多变化。

    10个单词的限制

     包括关键词和语法结构加在一起,超过这个限制的部分会被忽略。

    手气不错

     在谷歌首页,有“手气不错”这个按钮(如图1中的标识1),当你输入搜索词后,若按“手气不错”会直接得到谷歌认为最相关的网站,试一试“www”、“web”,或者你的名字、感兴趣的字词看看,都链接到什么网站上去了。

    计算数字

     直接在谷歌网页搜索输入框中输入算式进行计算,除法是“/” ,乘法是“*”。用惯了网络的人,会觉得比掏出手机来按按钮要爽。

    最有“性格”的城市

    谷歌实验室中的趋势搜索。

    更多谷歌应用

     谷歌除了一些搜索服务外,还有一些其它网络服务,点击首页的“更多”(如图1中的标识3),等看到更多的谷歌服务内容。 

    特色/GOOGLE网页搜索 编辑

    GOOGLE支持多达132种语言,包括简体中文和繁体中文;
    GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
    GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带;
    GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
    GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
    GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
    GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。 [2]

    主要功能解读/GOOGLE网页搜索 编辑


    基本搜索:+,-,OR

    谷歌网页搜索谷歌网页搜索

    GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。
    示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
    搜索:“易筋经 吸星大法”
    结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。
    注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

    GOOGLE用减号“-”表示逻辑“非”操作
    示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
    搜索:“易筋经 -吸星大法”
    结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。
    注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 - 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。

    GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。

    示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
    搜索:“britney OR beatles”
    结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第1-10项。搜索用时0.08秒。
    搜索:“布兰妮 OR 披头士”
    结果:找不到和您的查询-布兰妮 OR 披头士-相符的网页。
    注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。

    “+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率
    例:查阅天龙八部具体是哪八部。
    分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
    1.如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
    2.如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 -金庸”。

    辅助搜索

    通配符、大小写、句子、忽略字符以及强制搜索
    GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
    GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
    GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
    示例:搜索包含“long, long ago”字串的页面。
    搜索:“"long, long ago"”
    结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第1-10项。搜索用时0.28秒。
    注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。

    GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。
    示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、  “I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
    搜索:“"+who +am +i"”
    结果:已向英特网搜索"+who +am +i". 共约有362,000项查询结果,这是第1-10项。搜索用时0.30秒。
    注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

    高级搜索

    site,link,inurl,allinurl,intitle,allintitle

    “site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。
    示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
    搜索:“金庸 site:edu.cn”
    结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第1-10项 。搜索用时0.31秒。
    示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,

    搜索:“金庸 古龙 site:sina.com.cn”
    结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第1-10项。搜索用时0.34秒。
    注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。

    “link”语法返回所有链接到某个URL地址的网页。
    示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页
    搜索:“link:www.newhua.com”
    结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第1-10项。搜索用时0.23秒。
    注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。

    inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
    示例:查找MIDI曲“沧海一声笑”。
    搜索:“inurl:midi 沧海一声笑”
    结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第1-10项。搜索用时0.01秒。

    示例:查找微软网站上关于windows2000的安全课题资料。
    搜索:“inurl:security windows2000 site:microsoft.com”
    结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第1-10项。搜索用时0.37秒。
    注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgi-bin/phf”中的“/”当成空格处理。

    allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
    示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
    语法:“allinurl:"cgi-bin" phf +com”
    搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有40项查询结果,这是第1-10项。搜索用时0.06秒。

    allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
    示例:查找日本明星藤原纪香的照片集。
    搜索:“intitle:藤原纪香 写真”
    结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第1-10项。搜索用时0.03秒。

    GOOGLE的罕用高级搜索语法:related,cache,info

    related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。

    cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

    info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
    示例:查找和新浪首页相关的一些资讯。
    搜索:“info:www.sina.com.cn”
    结果:有关www.sina.com.cn的网页信息。
    新浪首页
    北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
    人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |, 软件下载....
    Google 提供这个网址的信息: 查看Google网页快照里www.sina.com.cn的存档 寻找和www.sina.com.cn类似的网页 寻找网页有链接到www.sina.com.cn 寻找网页包含有'www.sina.com.cn' [3]

    其他重要功能/GOOGLE网页搜索 编辑

    目录服务

    如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。  

    工具条

    为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。

    新闻组(USENET)搜索

    新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。

    输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
      

    搜索结果翻译

    曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,这是个伟大的改进。

    不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。

    搜索结果过滤

     网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。

    PDF文档搜索

    很多人对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
    示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
    搜索:“inurl:pdf ecommerce”
    结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。
    下面是某项搜索结果:
    [PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
    Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
    Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
    一般文字档 - 类似网页
    可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。

    图像文档搜索

    GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。

    GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
    不过,非常遗憾的是,图像搜索功能还不支持中文。 [4]

    搜索技巧训练/GOOGLE网页搜索 编辑

    关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。

    例一:查找《镜花缘》一书中淑士国酒保的酸话原文。

    分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
    搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”
    以上的关键字选择技巧可以谓之“特定词法”。

    例二:“黄花闺女”一词中“黄花”是什么意思。

    分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
    搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
    以上的关键字选择技巧可以谓之“近义词法”。

    例三:刘德华同志的胸围是多少。

    分析:首先声明,这是把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。

    搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华胸围 身高 -阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
    以上的关键字选择技巧可以谓之“相关词法”。

    其他常用搜索个案

    例一:找人

    分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。

    例二:找软件

    分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
    搜索:“winzip 8.0 下载”
    结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第1-10项。搜索用时0.22秒。

    分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
    搜索:“winzip 8.0 inurl:download”
    结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第1-10项。搜索用时0.44秒。

    在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。

    共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
    搜索:“winzip 8.0 sn”
    结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第1-10项。搜索用时0.30秒。

    例三:找图片

    除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。

    分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
    搜索:“"britney spears" inurl:photo”
    结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第1-10项。搜索用时0.23秒。

    分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
    搜索:“intitle:"britney spears" picture”
    结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第1-10项。搜索用时0.40秒。

    分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
    搜索:“"britney spears" site:geocities.com”
    结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第1-10项。搜索用时0.47秒。

    例四:找MP3

    分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
    搜索:“"say you say me" inurl:mp3”
    结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第1-10项。搜索用时0.17秒。

    分析二:也可以通过网页标题,找到这类提供MP3的网页。
    搜索:“"say you say me" intitle:mp3”
    结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第1-10项。搜索用时0.73秒。

    当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。

    例五:找书

    分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。

    分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德风车 桑乔”迅速找到该书。

    GOOGLE搜索FAQ/GOOGLE网页搜索 编辑

    Q:如何全面的了解google.com?
    A:查看网站相关页面“http://www.google.com/about.html”。

    Q:如何切换google.com的初始语言界面
    A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你期望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。

    Q:如何设定每页搜索结果显示数量?
    A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。

    Q:搜索到的链接无法打开怎么办?
    A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击Google的“网页快照”查看在GOOGLE服务器上的网页缓存

    Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
    A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到。

    添加视频 | 添加图册相关影像

    参考资料
    [1]^引用日期:2009-12-11
    [2]^引用日期:2009-12-11
    [3]^引用日期:2009-12-11
    [4]^引用日期:2009-12-11
    扩展阅读
    1Google–PageRank技术解密

    互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。未经许可,禁止商业网站等复制、抓取本站内容;合理使用者,请注明来源于www.baike.com。

    登录后使用互动百科的服务,将会得到个性化的提示和帮助,还有机会和专业认证智愿者沟通。

    互动百科用户登录注册
    此词条还可添加  信息模块

    WIKI热度

    1. 编辑次数:9次 历史版本
    2. 参与编辑人数:4
    3. 最近更新时间:2016-02-27 15:37:40

    互动百科

    扫码下载APP