分享

Matlab机器学习:统计与机器学习工具箱

 goandlove 2019-06-02

GrowthNudge 

你的成长,我来助推!

公众号《成长助推》致力于分享成长需要的实用工具、技能、思维方式,以助推你的成长为目标,直接省心的提供高效有价值的内容。

今日助推小目标:

1. 工具箱简单说明。统计与机器学习工具箱;

2. 8046页的PDF文档下载。MathWorks的关于该工具箱的超详细用户手册:Statistics and Machine Learning Toolbox User's Guide。

统计与机器学习工具箱

MathWorks公司有很多属于机器学习分支的软件包,提供用于数据分析的高质量算法以及用于可视化图形工具。这些软件包可以相互集成或与其他Matlab函数集成,用以生成用于机器学习中的强大系统。

这些工具箱包括但不限于以下几种:统计与机器学习工具箱;神经网络工具箱;计算机视觉系统工具箱;系统辨识工具箱等;

今天主要给大家简单介绍《统计与机器学习工具箱》,它提供用于从大量数据中获取趋势和模式的数据分析方法,包括分类工具、回归工具和聚类工具等;

分类方法用于将数据区分为不同的类别。例如图像形式的数据可用于按照是否有肿瘤对器官图像分类。分类学习通常应用于手写识别,信用评分和面部识别等问题中。分类方法包括支持向量机(SVM),决策树和神经网络等。

回归方法允许基于当前数据构建模型预测未来的数据。在有新数据可用时可以持续更新回归模型;数据只使用一次来创建模型,那么它处于批处理方法;在数据可用时合并新数据的回归方法,属于递归方法。

聚类方法在数据中发现自然分组,目标识别是聚类方法的一个应用。例如,如果想识别图像中的汽车,那么就去查找图像中属于汽车部分的关联数据,虽然汽车具有不同的形状和尺寸,但他们仍然有许多共同的特征。

工具箱具有许多功能来支持这些应用领域。

用户手册(User's Guide)

该手册内容丰富,共8046页,2016年。

分类算法可以将一个分类应变量建模为一个或多个预测元的函数。工具箱提供了涵盖多种参数化和非参数化分类算法的应用程序和函数,如:

逻辑回归;

促进式和袋装决策树;

朴素贝叶斯分类;

K-最近邻(kNN)分类;

判别分析(线性和二次变量);

支持向量机(SVM);

回归方法可将一个连续应变量建模为一个或多个预测元的函数。工具箱提供各种回归算法,包括线性回归、广义线性模型、非线性回归和混合效应模型。

线性回归是一种用于描述作为一个或多个预测元变量的连续应变量的统计建模技术。它有助于您理解和预测复杂系统的行为,或者分析实验、金融和生物数据。

非线性回归是一种有助于描述实验数据中非线性关系的统计建模技术。通常将非线性回归模型假设为参数模型,将该模型称为非线性方程。工具箱还提供强大的非线性拟合,用于处理数据中的异常值。

工具箱提供包括用于执行聚类分析的算法,通过根据相似度测量对数据分组来发现数据集中的规律。可用的算法包括 k-均值、k-中心点、分层聚类、高斯混合模型和隐马尔可夫模型。当不知道聚类的数量时,可以使用聚类评估技术根据特定指标确定数据中存在的聚类数量。

进入《成长助推》公众号,给后台发送关键词“机器学习”即可,自动回复已备好。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多