由于最近手头项目需要,我查阅了Python相关的机器学习库。我将不断地更新本贴,从而详细说明各个库的优劣。 一、前提 在Pthon下做机器学习,需要科学计算包和绘图库的支持,科学计算则是NumPy或SciPy,似乎NumPy更流行些。画图工具包则必定为matplotlib。这些都是开源、免费使用的,选择这些库主要的原因是做线性代数中的矩阵计算极为便利,而且效率比自己开发高的多。 二、机器学习库 (1)scikit-learn [http:///] Python下做机器学习,首推scikit-learn。该项目文档齐全、讲解清晰,功能齐备,使用方便,而且社区活跃。 ![]() (2)Orange [http://orange./] 机器学习是其的功能之一,主要还是侧重数据挖掘,可以用可视化语言或Python进行操作,拥有机器学习组件,还具有生物信息学以及文本挖掘的插件。 ![]() (3)shogun [http:///] shogun,非日本的老外弄的一个机器学习库,还专门配了一个我们能看懂的日文名“将军”(是日本幕府时代的将军)。文档齐全,开发活跃,更新快,运算速度也很快。主攻大尺度的核函数,尤其是大尺度核函数下的SVM。具有很多SVM的高级用法,比如多核配用等。支持Python、R、C++、Matlab等语言。 ![]() (4)其它 A.pyml(a python module for machine learning,支持svm/knn/k-means==) http://mlpy./ B.milk(python的机器学习工具包,主要是针对监督学习,包括svm/knn/决策树) http://pypi./pypi/milk/ 本文参考了oschina.net及http://www.cnblogs.com/wuren/archive/2013/03/27/2985352.html |
|