第二课时 信息检索工具的工作原理
教学目标:
了解因特网信息检索工具的工作原理,进一步提高搜索技能,熟练地使用检索工具获取所需信息。
教学内容:
1.介绍全文搜索和目录搜索引擎的工作原理
2.资源搜索的定律及策略
教学重点、难点:
介绍全文搜索和目录搜索引擎的工作原理
课时数:1课时
例:一位女士住在北京市,她想买一种交通工具上班,她的情况如下:
⑴每个月的工资均是1500元。 ⑵她喜欢的颜色是紫红 ⑶家离公司的距离约500米
问:你建议她应买什么样的交通工具?(从价格、颜色等方面考虑)
一、全文搜索引擎的工作原理

1.搜索引擎的组成
⑴搜索器:定期自动到各个网站上抓取网页。
⑵索引器:分析抓取的网页,索引,存入服务器的数据库中。
⑶检索器:接收用户提交的关键词不达意,从索引数据库中提取相关资源,呈现结果给用户。
2.搜索引擎的工作流程图

例:在“百度”搜索引擎中输入“屯昌概况”。

二、目录搜索引擎的基本工作原理
⑴人工采集、存储网络信息,手工为每个风站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。
⑵网络目录
按主题性质分类,依据:某种分类依据
信息链呈树状结构:总目录—专题目录—链接—网站
⑶全文搜索引擎与目录搜索引擎的区别
全文搜索引擎
|
目录搜索引擎
|
需要关键词查询
|
浏览主题,了解某一主题的相关资源。
|
搜索器在因特网中抓取网页,索引器按关键词不达意建立数据库。
|
人工采集并存储网络信息。
|
信息资源多、复杂,不易了解主题内容
|
网页内容丰富、学术性较强
|
只需要搜索器定期“抓”网页
|
维护费用大、更新速度慢
|
三、资源检索的三个定律
⑴相关性定律
相关性基于词频统计
早期的搜索结果排序基于此定律,如:Infoseek、Excite、Lycos
⑵人气质量定律
科学引文索引的机制(论文被引用次数越多赵权威)
超链分析的方法:1998年
⑶自信心定律
它是解决搜索引擎公司的生存和发展问题的定律。
GoTo.com(Overture)是自信心定律的最早实践者。
此定律与相关性排序、词频统计、超链分析和竞价拍卖有关系。
GoTo市值13亿美金,收入高达雅虎总收入的35%。
传统的搜索引擎靠CPM来收费,GoTo的搜索引擎靠竞价排名,点击收费,开创了真正属于互联网的收费模式。
四、资源检索的策略
搜索内容
|
搜索引擎
|
一般的信息资源
|
综合性的(百度、google)
|
图片、视频
|
特色的
|
专业性较强
|
专业搜索引擎
|
全面了解网上信息资源
|
元搜索引擎
|
安排任务
以课件形式展示
任务1:登录搜狐,搜寻黎族同胞的文化。
任务2:登录3个目录搜索引擎,搜索本周电视节目单,并画出各自找到“电视节目单”所选择的目录路径。
采用搜索引擎: 网址:
搜索内容: 关键字:
目录路径:
任务3:搜索“上网太多会对身体健康产生什么样的影响”,以文字、数据和图片说明。
任务4:回顾人类载人航天的历史。(包括重要历史的时间、事件、人物以及相应的图片资料)
任务5:搜索中国解放后的战争电影作品。
文章评论
|