分享

数据挖掘数据集下载资源(转)

 无名小卒917 2014-07-18
正文 字体大小:

数据挖掘数据集下载资源(转)

(2011-08-07 10:58:04)
标签:

杂谈

1、气候监测数据集 http://cdiac./ftp/ndp026b

2、几个实用的测试数据集下载的网站

http://www.fs./fire/fuelman/

http://www.cs./~roweis/data.html
http://www.cs./~roweis/data.html
http://kdd.ics./summary.task.type.html
http://www-2.cs./afs/cs./project/theo-20/www/data/
http://www-2.cs./afs/cs./project/theo-11/www/wwkb/
http://www.phys.uni./~duch/software.html
在下面的网址可以找到reuters数据集:http://www.research./~lewis/reuters21578.html
该网址有各种数据集:http://kdd.ics./summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs./afs/cs/project/theo-11/www/naive-bayes.html

3、UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn/
http://www.ics./~mlearn//MLRepository.htm

4、statlib
http://liama./SCILAB/scilabindexgb.htm
http://lib.stat./

5、关于基金的数据挖掘的网站
http://www./index.asp

http://lans.ece./~strehl/

6、进行文本分类&WEB
http://www-2.cs./afs/cs/project/theo-11/www/naive-bayes.html

http://www./TR/WD-logfile-960221.html
http://www./Daemon/User/Config/Logging.html#AccessLog
http://www./1998/11/05/WC-workshop/Papers/bala2.html
http://www-2.cs./afs/cs./project/theo-11/www/wwkb/
http://www./traces-logs.html
http://www-2.cs./webkb
http://www.cs./research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf
http://www.cs./projects/kddcup/index.html

7、时间序列数据的网址
http://www.stat./~reinsel/bjr-data/

8、apriori算法的测试数据
http://www.almaden.ibm.com/cs/quest/syndata.html

9、数据生成器的链接
http://www.cse./~kdd/data_collection.html
http://www.almaden.ibm.com/cs/quest/syndata.html
10、关联:
http://flow.dl./sourceforge/weka/regression-datasets.jar
http://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData

11、WEKA:
http://flow.dl./sourceforge/weka/regression-datasets.jar
1。A jarfile containing 37 classification problems, originally obtained from the UCI repository
http://prdownloads./weka/datasets-UCI.jar
2。A jarfile containing 37 regression problems, obtained from various sources
http://prdownloads./weka/datasets-numeric.jar
3。A jarfile containing 30 regression datasets collected by Luis Torgo
http://prdownloads./weka/regression-datasets.jar

12、癌症基因:
http://www.broad./cgi-bin/cancer/datasets.cgi

13、金融数据:
http://lisp./pkdd99/Challenge/chall.htm

14、一个很好的资源网址为:http://kdd.ics./,里面包含的数据资源如下(按应用领域划分)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约