分享

知识性搜索引擎浅谈

 vipuser 2006-06-29

据yahoo公开发布的Internet用户搜索需求数据显示:获取知识性内容信息约占用户需求的30%。所谓的知识性需求,既包括对某一具体数据的需求,如2005年中国国民生产总值,今日天气预报、中关村三星手机报价;也包括对某一类型数据的需求,如如何保养皮肤,互联网行业状况,保先材料等。

对于满足用户的知识性需求,传统搜索引擎由于存在以下弊端而先天不足:首先,它缺乏对深层次的动态信息(如论坛信息、博客信息)的支持,目前鉴于收录成本,传统搜索引擎对一些生成动态页面内容的后台数据库内容往往不收录或限定其收录的数量;其次,即便符合用户需求的内容页已经为搜索引擎spider所收录,但由于网页权重等因素(pagerank算法的局限性),在成千上万个字面相关的网页中它未必能”脱颖而出”排在检索结果的最前面,从而大大加重了用户的查找负担;更何况,有些信息并非以文本方式存在于互联网上,而是以隐形知识的方式存在于网络终端的网民头脑中,巧妇难为无米之炊,搜索引擎当然不能提供用户其需求的信息。

知识性搜索引擎就是在这样的需求和背景下产生的,它是专门针对知识需求而设计的搜索引擎,但又明显异于专业搜索引擎(专门搜索引擎)。专业搜索引擎(专门搜索引擎)与传统搜索引擎原理是一致,都是由本地服务对spider抓取来的网络信息进行索引以供用户进行查询,其差异仅在于收录资源的类型及进而导致的排序算法和显示方式。而知识性搜索引擎的建库不需要spider,它首先是一个知识问答平台,通过分值头衔等奖励机制鼓励用户回答问题,从而挖掘出用户头脑中的隐形知识,满足提问用户的信息需求。而所有的这些提问和回答也汇总为一个知识库数据,通过分类索引后供用户检索使用。

实质上是知识挖掘和管理

最早的知识性搜索引擎,当推韩文的naver ,而在中文领域,国内三家比较著名的网络信息组织公司也先后推了知识性搜索引擎,分别是新浪的爱问、百度的知道、雅虎的知识堂。其共同特征为:

第一,      网民以问题的方式提出自身关心或需要的内容,具有很强的针对性。所有网友都可以对此问题进行回答,其回答的过程是一个将传统搜索引擎上能搜索到的信息、某些没被传统搜索引擎收录的动态论坛、博客、书面出版物或者是数据库上的信息、存储在网友头脑中的认识和经验(包括技能)等进行精简、提取、整合组织、加工,并按照某种逻辑性有序排列的过程。信息一旦经过加工整合处理后便形成一种新知识,既包括对显性知识的整合、也包括对隐性知识的挖掘,以知识含量更高的知识单元形式表达出来,是知识内容的提纯和浓缩,其实质属于一种广义的知识创新。

第二,      采用人——人对话方式,提问者与回答者之间的交流是双向互动,改变了传统检索模式中单向的信息流向。同时由于积分体系的激励机制,调动了网友的积极性,从而确保了知识组织的质量。网友彼此间进行充分的知识分享和信息交流,最终形成对一个知识点的学术的、民间的、诙谐的以及跨国界的解决方案。

第三,      用户既是信息的享用者也是信息的提供者。不同的知识点汇集在一起形成一个广大用户共同建立的知识信息库,这知识库明显是知识在更高层次上的集成化、网络化,是知识内容的提纯和浓缩。知识库在分类索引后以提供检索的方式为更多的人提供有效的信息服务,是知识共享的基础和方式。

知识性搜索引擎的目标是在最需要的时间将最需要的知识传送给最需要的人。从特征可以看出,知识性搜索引擎具备了知识管理主要三个功能:一是对显性知识的序化,建立知识库;二是对隐性知识的挖掘,实现隐性知识的显形化,并充分调动了参与网民的知识、智慧和创新能力,相当于具备了流动人才库;三是对知识库的组织,提供检索供知识共享。因此知识性搜索引擎实质上是知识挖掘和管理。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多