引用文献:
[1] E. Han, Karypis. Centroid-Based Document Classification: Analysis & Experimental Resultsl. The Fourth European Conference on Principles and Practice of Knowledge Discovery in Databases, 2000
[2] E. Han. http://www.cs./?han/data/tmdata.tar.gz.
[3] Huaping Zhang. Chinese Lexical Analysis Using Hierarchical Hidden Markov Model. Second SIGHAN workshop affiliated with 41th ACL. Sapporo Japan, July, 2003, pp. 63-70
[4] Y. Yang. An evaluation of statistical approaches to text categorization. Information Retrieval, 1999, 1(1): 76-88.
[5] P.P.T.M. van Mun. Text Classification in Information Retrieval using Winnow. http://citeseer.ist./cs.
[6] Andrew McCallum, Kamal Nigam. A Comparison of Event Models for Naive Bayes Text Classification. AAAI/ICML-98 Workshop on Learning for Text Categorization[C]. Menlo Park, CA: AAAI Press. 1998, 41-48.
[7] SVMTorch. http://www./~bengio/projects/SVMTorch.html.
常见问题
1. 我从您的主页上下载了部分语料库,但是系统显示文件是access的快捷方式,文件很大,但是不知道如何打开,使用?
答:不能使用access打开,可以使用UltraEdit打开。
2. 我下载了你主页上的中文语料,解压后在matlab中为什么不能Load?
答:".mat"只是表示该文件存储的是词频矩阵,跟matlab没有关系。
3. 我打开您语料中的.mat文件时有错误,是怎么回事呢?或者您能把它存成其他格式吗,比如.txt文件。
答:可能是因为你采用别的软件来打开它。目前已提供预处理后的txt文件下载。
|