数字图书馆用户信息获取行为研究

qywal 2015-05-31

展开全文

　　随着数字图书馆的发展，用户对文献资源的利用方式逐渐转向在线形式。据教育部图工委统计，国内高校2012年馆均电子文献采购经费180万元，是2007年的2.2倍。在电子文献资源的使用大幅增加的情况下，如何获取数字图书馆用户信息行为的相关信息，以便为数字图书馆信息平台建设、电子资源配置提供依据，成为值得研究的问题。

　　对网络用户信息行为的定量研究方法有日志数据挖掘、系统软件计数及网络数据采集等途径。这些方法在改善现有评估手段的同时，也不同程度的存在一定局限性，主要有以下几点：

　　1.数据获取对业务环境的依赖性强。日志挖掘方法中，用户端和服务器端缓存（Cache）、代理（Proxy）及防火墙地址转换（NAT）等技术都会影响对数据的获取和处理，从而削弱挖掘效果。获取系统软件计数数据时一般依赖电子资源数据库厂商提供，实时性较差且有时难以获得完整数据。

　　2.行为信息提取内容较少。基于服务端系统软件计数或日志挖掘的方法很难收集到用户端个体信息，现行的基于网络层统计的方法又侧重于用户行为模式的判断，忽略行为内容的分析。如基于snort的过量下载检测方法，其处理的数据层次局限于网络层，没有对应用层数据作进一步处理，基于DPI的pdf文件下载检测方法仅对特定类型进行捕获，同样也没有针对应用层信息进行分析和处理。