配色: 字号:
第四章 搜索引擎与网络搜索技巧(课件)
2012-04-25 | 阅:  转:  |  分享 
  
第四章搜索引擎与网络搜索技巧搜索引擎与网络搜索技巧第一节搜索引擎概述第二节常用搜索引擎介绍第三节Interne
t信息搜索技巧本章要求了解搜索引擎的基本知识;掌握搜索引擎的分类、主要功能特点、典型代表及其检索方法;灵活运用搜索引擎的
检索策略与技巧解决实际问题。第一节搜索引擎概述搜索引擎(searchengine)利用能够从互联网上自动收集网页的S
pider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这个过程,并把爬过的所有网页收集回来。第二步:
建立索引数据库由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词以
及与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,然后用这些相关信息建立网页索引数据库。第三步:检索界面的建立
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,按照所有相关网页针对该关键词的相关度数值排
序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。每个搜索引擎都必须
向用户提供一个良好的信息查询界面,一般包括关键词及分类目录两种信息查询途径。关键词检索直接输入一个关键词,提交搜索引擎查询,这
是最基本的查询方式;输入两个以上的关键词(短语),当做一个独立运算单元提交搜索引擎查询,也叫短语检索;提交多个关键词,用布尔逻
辑组配方式查询,这种方式也叫定制搜索。分类目录检索按照搜索引擎提供的分类目录逐级查询,用户一般不需要输入检索词,只需选择类别进
行查询,这种方式也叫分类检索。工作方式全文搜索引擎(百度、Google)分类目录搜索引擎(Yahoo、dmoz)元搜索引擎
(搜魅网、觅搜)内容结果综合/通用/水平搜索引擎(百度、Google)特色/专业/垂直搜索引擎(学术搜索、地图搜索)全文搜
索引擎全文搜索引擎分类目录搜索引擎分类目录搜索引擎元搜索引擎元搜索引擎垂直搜索引擎第二节常用搜索引擎介绍国内
搜索排行榜(2011)百度http://www.baidu.com/谷歌中国http://www.google.co
m.hk/搜狐-搜狗http://www.sogou.com/SOSOhttp://www.soso.com/
必应http://cn.bing.com/雅虎全能搜http://www.yahoo.cn/网易-有道http
://www.youdao.com/新浪-搜索http://search.sina.com.cn/中国搜索http
://www.zhongsou.com/1、Google搜索引擎Google的其它功能计算器和单位换算器5+22;
1磅=?克天气查询天气承德;tqchengde;chengdetq手机号归属地查询136806
邮编区号查询重庆邮编区号股票、基金查询清华同方;qhtf定义查询定义HTML;define:HTML货币转
换100RMB=?USD;3.5USD=?GBP2、百度(baidu)搜索引擎门户网站及其搜索引擎中国有四大网站被称
为“门户网站”(新浪、搜狐、网易和腾讯)。之所以他们被称为中国最大的门户网站,因为它们除了提供搜索服务、目录服务以外,还汇聚了大量
的综合性互联网信息资源并提供有关信息服务,使得人们能自觉自愿地登陆这些网站开始“网上冲浪”,恰似因特网的大门一样。3、新浪网站及
其搜索引擎新浪搜索4、搜狐网站及其搜索引擎搜狗(Sogou)5、网易网站及其搜索引擎有道(youdao)6、腾讯网站及
其搜索引擎搜搜(SOSO)7、迅雷搜索迅雷超线程下载技术迅雷:全球使用人数最多的下载软件。迅雷是一款免费下载软件,号称
第三代快速下载工具。它使用的多资源超线程技术(P2SP)基于网格原理,能够将网络上存在的具有某个相同文件的服务器和计算机资源进行有
效的整合,构成独特的迅雷网络并以最快的速度进行传递,据说下载速度是网际快车的7-8倍,支持断点续传。迅雷搜索引擎狗狗搜索(ht
tp://www.gougou.com):是互联网上最大的资源搜索引擎。能帮助您方便、快速的获取影视、音乐、软件、游戏、书籍等下载
资源,以及高清影视在线播放地址;狗狗采用迅雷独有的搜索技术,能快速全面收录互联网上海量下载资源,并且可智能检测资源安全性,保障您的
下载安全。8、深度搜索引擎——中英文学术搜索引擎深度搜(http://www.shendusou.com/)深度是由美国硅
谷留学生于2009年创立的新一代知识搜索引擎技术公司,致力于为国内广大知识群体提供学术及知识搜索应用的崭新技术平台。“深度搜”
目前已收录4万种权威中英文学术期刊杂志,上亿篇中英文学术论文、文献,主要集中在自然科学,社会科学,医疗卫生及知识产权等领域。9、
SCIRUS——英文学术搜索引擎SCIRUS(http://www.scirus.com/)SCIRUS是由荷兰爱思唯
尔科学公司ElsevierScience于2001年4月推出的迄今为止国际互联网上最全面的科技信息专用搜索引擎。它以自身拥有
的资源为主体,对网上具有科学价值的资源进行整合,集聚了带有科学内容的网站及与科学相关的网页上的科学论文、科技报告、会议论文、专业文
献、预印本等。第三节?搜索策略与技巧搜索策略有比较明确的搜索概念或搜索目标希望较全面地了解某个主题/领域的优选网站及相
关资源单一引擎无法满足搜索需求,想更多地了解网上相关信息想搜索信息量大、信息宽广的综合性内容要检索专业性、针对性较强的
信息资源搜索技巧好的搜索请求应该包含多个能概括搜索目标、限制搜索范围的关键词,提供足够的检索关键词将是成功检索的第一步。养
成使用多个关键词搜索的习惯,关键词之间用空格隔开。“-”(逻辑非)的作用就是为了去除无关的检索结果,提高检索结果的相关性。【例
】某同学准备去大连实德集团应聘,想先了解一下实德集团的情况(而非实德足球俱乐部的信息)。大连实德–足球在要查询的关键词两端
加上双引号(半角),可以实现精确的词组检索,是提高查准率的有效方法。这一方法在查找名言警句或专有名词时显得格外有用。Googl
e等国外搜索引擎支持通配符检索(百度不支持)Google使用的通配符属于“全词通配符”,用(星号)表示,即:检索英文时一个
“”代替一个单词而不是单词中的某个或几个字母;检索中文时一个“”代替一个汉字。在查找歌词、诗歌、短语、成语等,对其中某个单词
或汉字记忆不准时,用通配符可以快速找到原文。指定文件类型搜索(filetype)在网页标题中搜索(intitle)在网页
链接中搜索(inurl)在指定网域中搜索(site)文件类型限定关键词filetype:文件类型通过限定搜索结果的文件类
型达到精准搜索的目的。filetype语法中最实用的是PDF文档搜索。PDF由ADOBE公司开发,现在已经成为互联网上国际通用的
电子文档标准格式。注:filetype后的冒号为英文半角字符且冒号后不能有空格。网页标题限定intitle:关键词网页设
计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。Intitle语法限定只在网页标题中搜索关键词,通常可以找到高相关
率的专题页面。url链接限定关键词1inurl:关键词2网页url中的信息常常有某种特定含义,有很多网站把某一类具有相同属
性的资源名称显示在网页网址的路径或文件名称中;INURL语法限定关键词2必须出现在网页URL中,通常能提供非常精确的专题资料。提
供书籍下载的url常含有book、ebook、shu、shuji论坛的url中常含有bbs、forum音乐方面的url常
含有music、yinyue、mp3、midi提供软件的url常含有soft、software、ruanjian图片的ur
l常含有showpic、image、Gallery网域/站点限定关键词Site:站点/域名表示搜索结果限定于某个具体网
站或网站频道,如“cdpc.edu.cn”,或者是某个域名,如“com.cn”等。注:网站域名不能有“http”以及“www”前
缀。搜索引擎自带的帮助系统是不应被忽略的重要组成部分,在这里可以学到更多的搜索技巧和搜索规律;善用帮助系统是培养学生文献检索的
自学能力和提高信息素养的一个重要环节。检索实习(第四章)利用搜索引擎查找与你所学专业相关的专业网站,给出网址并做简要介绍。
利用搜索引擎查找本专业领域或自己感兴趣的视频文件并下载保存,对于无下载链接的视频文件如何保存?利用搜索引擎查找“工业三废”是指
什么?检索有关“工业三废的污染治理”方面的PDF/DOC/PPT格式文件,写出检索式,下载一篇密切相关的全文文献。利用搜索引擎查
找“天空软件站”网站内有关格式转换(音/视频、图片、文档)的软件,写出检索式、软件名称及下载地址。查询“中国商标网”的网址并利用
该网站检索某知名商标的商标图像及申请人名称。利用搜索引擎查找有关简历制作的网站,下载一套适合本专业的简历模板及封面。网易学院—
—国内知名度较高的IT教程库http://tech.163.com/school/在线观看视频教程http://www.q
q.com/腾讯公司成立于1998年11月,是目前中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一。
成立十年多以来,腾讯始终处于稳健、高速发展的状态。2004年6月16日,腾讯公司在香港联交所主板公开上市。搜搜作为腾讯旗下的搜
索引擎网站于2006年3月正式发布并开始运营,搜搜目前已成为中国网民首选的三大搜索引擎之一,主要为网民提供实用便捷的搜索服务,致力
打造一个个性化、社区化、智能化、移动化的创新搜索平台。电子技术检索结果http://www.sowang.com搜索引
擎指南网全文搜索引擎水平搜索引擎目录式搜索引擎元搜索引擎垂直搜索引擎提炼多个关键词逻辑符减号“-”善用
帮助系统精确匹配“”通配符“”巧用搜索语法提炼多个关键词搜索一:马蹄莲能放在卧室里吗?搜索二:发芽的土豆中含
有一种毒素,如果摄入过多,可因呼吸麻痹而导致死亡。这种毒素是什么?使用逻辑符号-使用精确匹配“”搜索一:人们用“沉鱼落雁
,闭月羞花”指代中国古代四大美女,其中“沉鱼”、“闭月”分别指谁?搜索二:英文谚语“raincatsanddogs”的汉语
意思是什么?使用通配符搜索一:奥运会主题歌“one__onedream”?搜索二:成语“__屯__聚”?巧用
搜索语法例如:查找有关“数据仓库”方面的技术性文档,使用filetype:pdf,得到的搜索结果要比基本搜索精炼、有用的多。
例如:查找有关“数字图书馆解决方案”方面的专题内容,使用intitle语法,搜索结果更符合需求。例如:查找有关“英语翻译”方面的
书籍,使用inurl:ebook,可直接定位于提供相关图书的站点。例如:要搜索各高校有关“科学发展观”的页面,使用site:ed
u.cn将搜索范围限定在中国教育科研网站内。善用帮助系统图书搜索Google图书搜索中的图书主要有两个来源:出版商和图书
馆。在这里可以对图书全文进行搜索,查找您感兴趣的图书,并了解何处可选购或借阅该书。可以查看图书的基本信息授权图书,可以看到
该书的几页完整内容或随意浏览整部图书所有图书直接链接在线书店,您可以从那里购买图书搜索结果地图搜索Google地图:动态
的网上地图,可以帮助查询详细地址、寻找周边信息,并规划点到点行车路线。Google翻译:最好的在线翻译网站,支持的语言总数已达5
1种。翻译结果逻辑性强,易于读懂;可以用你的语言来搜索使用其它语言的网站;插入一段JS代码可创建你的多语言个性化网站。翻译功能
详情见google网页搜索特色1999年底李彦宏和徐勇于美国硅谷创建了百度,2000年1月回国发展定址于北京中关村。百度目前已成
为全球最大的中文搜索引擎,可查询数十亿中文网页,每天完成上亿次搜索。除网页搜索外,还提供MP3、资讯、图片、贴吧、影视等多样化的搜
索服务。http://www.baidu.com检索技术:‘空格’表示AND关系;‘|’表示OR关系,两端加半角空格;
‘–’表示NOT关系,减号前加半角空格;“”表示词组/整体单元(完整关键词)查询百度产品大全http://www.sin
a.com.cn/新浪网于1998年成立,是一家服务于中国及全球华人社群的在线媒体及移动增值服务提供商。新浪在全球范围内的注册
用户超过2.8亿,日浏览量超过9亿次,是中国及全球华人社群中最受推崇的互联网品牌。2005年新浪推出自主研发的搜索引擎,提供网站
、网页、新闻、博客、地图、视频、音乐、图片、论坛等查询服务。在关键词的查询反馈结果中,在同一页面上包含各频道的综合搜索结果,最大程
度地满足用户的检索需要。新浪搜索新浪下载爱问?知识人——新浪旗下中文互动问答平台爱问?共享资料——新浪旗下在线资料分享站
新浪试题库——新浪旗下在线模拟考试系统http://www.sohu.com/1995年,张朝阳博士从美国麻省理工学院回归祖
国。次年8月,依据风险投资创办搜狐的前身“爱特信信息技术有限公司”。1998年2月,爱特信推出搜狐,中国首家大型分类查询搜索引擎横
空出世,搜狐品牌由此诞生。搜狗是搜狐公司于2004年8月推出的全球首个第三代互动式中文搜索引擎。搜狗以网页搜索为核心,在音乐、图
片、新闻、地图等多领域提供垂直搜索服务。通过说吧建立用户间的搜索型社区;搜狗浏览器能大幅提高上网速度;搜狗拼音输入法是当前网上最流
行、用户好评率最高、功能最强大的拼音输入法。搜狗产品大全http://www.163.com/网易是国内较早成立的大型门户网
站之一,在开发互联网应用、服务及其它技术方面,网易始终保持国内业界的领先地位。1997年6月创立以来,凭借先进的技术和优质的服务,
网易深受广大网民欢迎,多次被中国互联网络信息中心评选为中国十佳网站之首。作为网易自主研发的全新中文搜索引擎,有道搜索致力于为互联
网用户提供更快更好的中文搜索服务。它于2006年底推出测试版,并于2007年12月11日推出正式版。主要提供网页、图片、热闻、视频
、音乐、博客等传统搜索服务,同时推出海量词典、阅读、购物搜索等创新型产品。有道产品大全定义:搜索引擎是一种网络信息资
源检索工具,是以各种网络信息资源为检索对象的查询系统。第二代搜索目录搜索元搜索引擎1995Yahoo!1994G
opher1993Archie1990Google1998Baidu2000……第三代搜索网页搜索搜索引擎的
发展历史索引生成器(网页数据库)爬行器(蜘蛛)查询检索器(用户查询)因特网搜索引擎的工作原理第一步:从互联网上抓
取网页因特网搜索引擎基本查询方法搜索引擎的分类全文搜索引擎是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数
据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是名副其实的搜索引擎。信息量大、查全率高
;冗余多、查准率低Google:目前世界上使用最为广泛的搜索引擎,网页索引数量已达一万亿。百度:目前中国人气最旺的搜索引擎。
目录搜索引擎是以人工或半自动方式搜集信息,由编辑员审核并将符合要求的网站(站名、网址链接、摘要信息等)建立索引并提供给用户网站链接
列表。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。查准率高,质量可靠;维护量大,更新慢雅虎分类目录:世界上
最早、最有价值的分类目录体系。第一分类目录:开创于2008年,力求打造成中国最好的开放式分类目录。元搜索引擎并不拥有自己的索
引数据库,而是在接受用户查询请求后,同时在多个引擎上搜索,然后按来源或自定的规则将搜索结果反馈给用户。信息量更全;检索速度及效果
不够理想百Google度(BaiGoogledu):整合了谷歌和百度的搜索结果,支持IE、遨游等浏览器。觅搜(MetaSoo)
:可搜索google、百度、雅虎、搜狗、有道等搜索结果。垂直搜索引擎是针对特定的行业、领域、主题的专门搜索引擎,搜索结果更加专业
、深入、具体和有序,能够为用户提供更有针对性的信息。图书搜索学术搜索旅游搜索汽车搜索职位搜索搜索特色:网页快照:缓
存在服务器上的网页类似网页:与搜索的网页网址相关的其他网页网站排名:搜索结果按照网站的被链接数量由高到低排列Google是
由两名斯坦福大学的理学博士生拉里·佩奇和谢尔盖·布林在1996年早期建立的,2005年Google宣布在中国设立研发中心。Goog
le目前被公认为万维网上最大的搜索引擎,2008年7月,Google官网公布其网页索引数量已达一万亿。搜索特色:手气不错:直接进入与关键词最匹配的网页高级搜索:通过限定检索范围达到精确检索的目的语言工具:搜索特定语言或国家的网页检索技术:自动使用逻辑与检索,多关键词之间用空格分开支持逻辑或检索,操作符“OR”必须大写支持逻辑非检索,操作符”-”前要加空格符支持词组/完全字符串检索,词组两端加双引号“”不区分大小写在Google检索框输入中央电视台,点击“手气不错”,则直接进入央视主页主要功能手气不错主要功能高级检索限定语种限定更新日期限定检索词出现的位置限定网域限定检索词的匹配方式限定文件格式主要功能高级检索检索过去一年教育网上有关北京数字图书馆的简体中文网页检索结果界面Google学术搜索提供可广泛搜索学术文献的简便方法。其每一个搜索结果都代表一组学术研究成果,可以帮助您在整个学术领域中确定相关性最强的研究.学术搜索?查找报告、摘要及引用内容?了解任何科研领域的重要论文?通过图书馆搜索链接找到收藏该篇文献的单位搜索结果
献花(0)
+1
(本文系cdpclib首藏)