分享

中文网络资源指南分类体系比较分析

 小小舒馆 2012-12-04
摘要:通过对六种中文搜索引擎网络资源指南一、二级类目的比较分析,总结现有中文网络分类目录类目设置的规律及存在的主要问题,提出制定规范的网络信息分类标准的必要性、可行性与一般原则。
  
  关键词:网络资源指南;网络信息;分类法;比较分析
  
  网络资源指南是重要的网络信息宏观组织模式之一。目前,大量提供互联网信息导航服务的商业网站除提供基于网上机器人自动搜索、全文检索技术为主的搜索引擎服务外,也提供由人工或半自动维护建库、以分类导航或分类摘要查询为主的网络资源指南导航服务。相对于搜索引擎检索服务,网络资源指南所提供的网络信息链接一般需经信息专业人员进行评价、筛选、组织,因此,其具有较强的专业性、权威性、条理性,信息价值更高。网络资源指南展示给用户的是逐级浏览的等级目录树,用户需从最底层类目的链接中获得所需信息。一个完整的目录树,暨网络资源指南的分类体系是否全面、科学、稳定,将直接影响用户利用网络资源指南查询信息的效果。
  本文对六种知名中文搜索引擎网络资源指南分类目录一级类目及个别通用二级类目设置情况进行对比,分析现有网络资源指南分类体系类目设置的一般规律、存在的主要问题,提出制定规范的网络信息分类标准的可行性及一般原则。
  
  一、六种中文搜索引擎网络资源指南类目对比选择
  目前较为知名六种中文搜索引擎网络资源指南分类目录:新浪1、搜狐 2、中文雅虎 3、网易【 、google中文[5l、北极星_6 J,将六种搜索引擎的一级类目设置进行列表对比,即将名称主题近似的类目置于表格同一行中,对六网站共有类目情况进行直观比较。
  同时,选取六种搜索引擎共有一级类目“计算机与互联网”的二级类目同样进行比较(限于篇幅,二级类目不进行列表)。
  1.六种中文搜索引擎网络资源指南一级类目对比(见表1)2.六种中文搜索引擎网络资源指南二级类目对比将六种中文搜索引擎“计算机与互联网”主题类目下的二级类目设置进行对比。所有类目去除标有“@”
  符号的交替类目(即由下级类目上置或其它类目镜像的类目),并将各网站相近主题类目后标有相同数字代码,以便于直观比较。各网站“计算机与互联网”下二级类目如下:
  (1)新浪共有26个二级类目:硬件1、软件2、网络安全3、黑客3、病毒与安全3、程序设计语言4、多媒体5、IT认证与培训6、互联网7、通讯与网络8、组织9、电脑游戏10、新闻与媒体11、社区/论坛 天12、免费资源13、网上教程14、信息产业16、研究机构16、综合信息17、政策法规18、会议与商展19、桌面排版21、网络门户22、科学计算26、IT人士27、系统集成29。
  (2)搜狐共有15个二级类目:硬件1、软件2、杀毒与安全3、程序/f弋码4、动漫/FlaSh5、IT资讯6、互联网7、游戏10、免费下载13、免费教程14、机构/会展19、搜索引擎25、数码产品30、手机31、桌面/壁纸33。
  (3)中文雅虎共有20个二级类目:硬件1、软件2、安全与加密3、程序设计语言4、多媒体5、培训与考试6、因特网7、通讯与网络8、组织9、新闻与媒体11、资讯与文件18、桌上排版21、便携电脑24、移动PC24、个人网页28、公元2000年危机34、绘图35、竞赛36、历史37、酷站38。
  (4)网易共有20个二级类目:硬件1、软件2、病毒与安全3、程序设计及语言4、多媒体技术5、认证/考试6、计算机网络与通讯8、IT组织机构9、电脑游戏10、IT技术研讨及论坛12、免费资源13、学习资源14、电脑网络报刊15、电脑资讯17、电脑设计 术2O、中国门户网站22、中文信息处理23、搜索引擎/网址推荐25、网页制作39、信息家电4O。
  (5)Google中文共有19个二级类目:硬件1、软件2、安全3、编程4、多媒体5、教育6、互联网络7、数据通讯8、组织9、电动游戏1O、新闻11、聊天室和论坛12、电子书15、公司16、计算机辅助设计2O、计算机信息科学23、掌上型24、操作系统32、人工智能41。
  (6)北极星共有5个二级类目:硬件1、软件2、黑客/网络安全3、程序 代码4、互联网7。
  
  二、六种搜索引擎网络资源指南分类目录体系分析
  1.一级类目设置趋同、呈现一定的规律性目前,各网站分类目录一般都选择网络用户比较关心的主题作为一级类目,一级类目主题呈现趋同性。
  如“娱乐休闲”“艺术”“计算机与互联网”“医疗健康”“科学技术”“新闻媒体”“商业经济”“社会文化”“生活服务”“教育就业”“体育健身”“政法军事”“文学人文”“国家地区”,以上主题类目为六大搜索引擎中五个以上网站共有的一级类目(共l4个),占一级类目总数(25个)的56%。另有一些类目,如“社会科学”类目,新浪、搜狐、中文雅虎、北极星将其设为一级类目,而有的网站将其放置到二级或三级类目中,网易将其设置在“社会文化”类目下,Google设置在“科学”类目下,均为二级类目。
  2.二级类目设置随意性较大选取六个网站共有的“计算机与互联网”类目分析,不同网站二级类目数量和主题内容均有较大差异。
  如“计算机与互联网”类目下新浪有26个二级类目,而北极星仅有5个二级类目,大部分网站类目在20个左右。六个网站中五个以上网站共有主题类目7个,占总类目数(41个)的l7% ;三个以上网站共有主题类目数仅l4个,占总类目数的34%。多数二级类目设置较为随意。
  3.特色类目设置突出网站个性各网站都设置了一些自己独有特色的一级类目,如新浪的“求职与招聘”、网易的“旅游自然”“情感绿洲”、Google中文的“家庭”“购物”,这些类目往往是将低层次类目提升为一级类目,或在类目名称设计上追求新意,但有些类目内涵较难理解。
  4.同一主题概念类目名称缺乏统一标准如“计算机与互联网”与“电脑与因特网”,“医疗健康”与“卫生与健康”,“商业经济”与“工商经济”,“网络安全”与“安全与加密”,“计算机网络与通信”与“通信与网络”等都是同一主题概念或相近主题概念类目的多种称谓,统一网站一级类目名称具有可行性。
  5.分类体系不全、知识体系不严密、分类标准不明确一个完整的综合性分类体系在划分基本类目时,应囊括所涉及到的全部知识领域。而六大网站虽然有许多共性一级类目,但没有一个网站能分析出其一级类目的分类标准,这必然造成对目录体系不是十分了解的用户往往很难确定一个深层主题的类目入口。如雅虎一级类目中未设“体育”类目,在“计算与互联网”类目中许多网站没有设置“操作系统”“计算机辅助设计”等二级类目。
  6.类目排列无序、层次不清各网站的类目排列没有规律性,没有类似体系分类法几大部类的划分。如前所述,不同网站往往将同一类目放置不同的类目层,或隶属于不同上位类目,给信息的查找带来较大困难。多数网站采用多重列类或设置镜像类目的方式,揭示了类目之间的多维关系,一方面不同思维用户可以从不同角度获得所需信息,另一方面也带来了分类体系的混乱,往往使人感到无所适从。
  7.不同类目分类层次不均衡、类目注释不清有的类目只有两层,有的类目多达六、七层,不同类目子目数量相差较大,甚至有的最底层类目下没有相关网页链接。如中文雅虎的“参考资料--百科全书”二级子目下只有一个“知识在线”网页链接。由于分类采用网状结构,对类目进行多维揭示,而多数类目没有注释,对类目之间横向关系缺乏提示,有时往往弄不清同名类目之间联系,如新浪“娱乐休闲”的“电影与电视”子目中有三级子目“新闻与媒体”,而一级类目“新闻媒体”中又有“电视”二级子目,难以弄清同名类目之间关系。
  
  三、制定规范的网络信息分类标准
  1.制定规范的网络信息分类标准的必要性与可行性目前,网络信息分类没有统一标准的问题,给用户的使用带来了诸多的不便。首先,用户无法从学科角度查询网络信息;其次用户在使用不同网站时,必须熟悉各种不同的分类体系才能较快地查询到所需信息。
  统一网络信息分类体系,已是迫切需要解决的新课题。
  从各网站类目设置分析,网络分类目录在一级大类的划分上有趋同性,即从主观上存在统一网络目录分类体系的可能,即使在没有统一标准的情况下不同网站也不约而同或相互参考地设置了多数相似的一级类目。从各网站分别设置一些特色类目来看,统一分类标准并附加若干动态类目应该是未来网站分类目录的发展趋势。
  2.制定规范的网络信息分类标准的一般原则
  (1)聚类标准:分类表以社会普遍认同的知识范畴、专业领域、行业划分为构建分类体系的基础,以“主题和专题”作为主要聚类标准,以“学科和专业”作为辅助聚类标准。也可构建面对普通用户的以主题为主、面向专业用户以学科分类为主的二元分类体系。
  (2)类目设置:一级类目设置以20个左右为宜,类目除需设置“社会科学”“科学技术”“经济”“教育”“医药卫生”“体育”“艺术”等学科类目外,还需设置“休闲娱乐”“生活服务”等查询率比较高的主题类目。原属于二级类目的“计算机与互联网”这样的重点类目需突出列类,上置为一级类目。
  (3)类目层次:类目层次一般应控制在3~5级,虽然层次越深,知识组织越严密,但过多的层次直接影响用户的查询耐心。
  (4)类目名称:类目名称应使用网络信息本身和用户查询最常用的术语,类名应通用、精炼并尽量叙语化。
  (5)多重列类:类目设置采用分面技术和多重聚类技术,结合超文本技术,实现类目间多维链接,满足用户从不同角度、多途径查找信息的需要。
  (6)类目排列:各知识领域划分出来的子类有很大差异,应根据不同性质和特点分别选择排列方法。一般按照“内容相关”“逻辑相关”“形式相关”等有利于用户理解和把握的次序排列,共性区分的问题集中排列,相同标准区分的类目按相同的次序排列,对于无明显逻辑联系的类目可按字顺排列。
  (7)网站排列:网站链接是用户查询的最终信息获得,大量网站序化排列的主要目的是使用户快速的选择到对自己最有价值的资源。可按重要程度、点击率、字顺等方式排列。
  (8)类目注释:通过精练的文字指明类目包含的内容或通过列举下位类的方式提示本类重点内容、隐蔽较深内容。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多