大数据专题Java机器学习软件介绍编写程序是最好的学习机器学习的方法。你可以从头开始编写算法,但是如果你要取得更多的进展,建议你采用现有的开源库。在这篇文章中你会发现有关Java中机器学习的主要平台和开放源码库包。 环境本节描述可用于机器学习的java环境或工作台。他们被称为环境,因为他们为执行机器学习任务提供了图形用户界面,但也提供了Java api供使用者开发自己的应用程序。 WekaWaikato Environment for Knowledge Analysis (Weka) 是一个机器学习的平台开发,由新西兰的怀卡托大学用Java编写的。提供一个图形用户界面,命令行界面和Java API。这可能是最流行的Java机器学习库和最好的开始机器学习或实践的起点。
KNIMEKonstanz Information Miner (KIME) 是一个德国康斯坦茨大学开发的分析和报告平台。它是关注医药研究开发的,但可扩展到一般商业智能。它提供了一个图形用户界面(基于Eclipse)和Java API。
RapidMinerRapidMiner 在过去被称为另一个学习环境(YALE),是由德国多特蒙德大学开发的技术。它提供了一个GUI和Java API来开发自己的应用程序。它提供了数据处理、可视化建模和机器学习算法。
ELKIEnvironment for DeveLoping KDD-Applications Supported by Index-Structures (ELKI) 是一个Java开发的数据挖掘工作台,由德国慕尼黑大学开发。它有一个专注于处理关系数据库的数据,用于异常值检测和分类(基于距离函数的方法)。它提供了一个迷你GUI,命令行接口和Java API。
库包下面是机器学习的库包,它们都有Java API,提供器学习在某个方面成就。 Java-MLJava Machine Learning Library (Java-ML) 提供了一个用Java实现机器学习算法的集合。每个算法它都提供了一个标准接口,但是没有ui,没有相关引用以便进一步阅读相关的科学文献。它包括数据操作方法、聚类、特征选择和分类。
JSTATJava Statistical Analysis Tool (JSTAT) 提供了标准的纯Java实现机器学习算法,包括small-ish问题。作者承认开发这个库包是为了自己修炼学习。然而算法列表令人印象深刻。它包括分类、回归、合奏、集群和特征选择方法。
大数据Mahout (Hadoop)Apache Mahout提供了在Apache Hadoop平台上(分布式使用map-reduce模式)使用机器学习算法的实现。这个项目提供了一个专注于聚类和分类算法和一个受欢迎的应用程序驱动实现,其针对推荐系统使用协同过滤。
MLlib (Spark)Apache Mchine Learning Library提供了用于Apache Spark的平台(HDFS,但不是使用Map-reuce模式)实现的机器学习算法。支持Java平台,Scala和Python绑定。库包是很新,算法的列表也很短,但发展迅速。
MOAMassive Online Analysis (MOA) 是一个新西兰怀卡托大学为数据流挖掘开发的开源的平台设计。某些地方像Weka,它提供了一个GUI,命令行接口和Java API。它提供了一长串的算法着重分类和支持异常值检测和解决概念漂移。MOA使用Advanced Data mining And Machine learning System (ADAMS) 作为管理工作流。
SAMOAScalable Advanced Massive Online Analysis (SAMOA) 是一个由雅虎开发的分布式流媒体机器学习框架。它被设计为运行在Apache Storm 风暴和Apache S4上。系统可以利用MOA 所提供的算法如分类等任务。
自然语言处理本节是关于从机器学习的分支称为自然语言处理(NLP)的Java库和项目。
Computer Vision(CV)
Deep Learning深度学习本节列出使用神经网络和深入学习的关键Java库.
机器学习流行算法一览最好的开源报表工具更多机器学习专题
函数语言主要优点是秉承数学的严谨性与可推导性,该文比较了纯函数语言Haskell在代数方程上与Scala语言的不同性,突出了Haskell纯函数语言的特点。 ....
最近一个爆炸新闻是apple收购了名不经传的FoundationDB,之前苹果是使用Cassandra作为来保存各种资源包括用户上传的资料影音媒体图片等等。这一....
树的生老病死 空间是在变换的、时间是在流逝的(时间 = 空间的变化)。整个世界是在发展变化的。是否理解这个世界,关键在于是否理解了“空间”和“时间”。当程序....
Spark比Hadoop并没有想象得那么快,以前号称快100倍,实际只快19%,这是 Making Sense of Performance in Data A....
北京的中国人zxh0(微博:@我不是达芬奇鹰)使用Go语言编写了JVM项目 jvm.go 引起业界注意,著名网站infoworld给予了高度评价,认为虽然该项目....
|
|