分享

每个机器学习工程师都应该知道的基本算法

 庆亮trj21bcn0z 2017-11-21

机器学习作为一门多领域交叉学科,已经存在很长时间了,但近些年才开始火热起来。本文中列出了你需要知道的机器学习领域的算法,了解这些你就可以解决在机器学习中所遇到的任何问题。但这只是个覆盖大部分基础算法的清单,并不是全部。

回归算法

每个机器学习工程师都应该知道的基本算法

回归算法对变量之间的关系建模。最初是一种统计技术,它现在已经成为每个机器学习工程师必须掌握的重要工具。

常见的回归算法:

  • 最小二乘回归(Least Squares Regression)

  • 线性回归(Linear Regression)

  • Logistic回归(Logistic Regression)

回归介绍视频:https://www./learn/regression-models/lecture/Kz1eV/introduction-to-regression

聚类算法

每个机器学习工程师都应该知道的基本算法

聚类算法可以将数据点分到具有相似属性的组中。他们通过查找数据中的固有结构来将数据划分到不同的组中。一个组中的事物属性的关联比其他组中的关联的更密切。

聚类算法有硬聚类和软聚类两种类型。硬聚类是指数据点明确的完全属于一个组或完全不属于一个组。软聚类是指一个数据点可以不同程度地属于许多不同的组。

常见的聚类算法:

  • K均值(K-means)

  • 层次聚类(Hierarchical Clustering)

聚类介绍视频:https://www./watch?v=ZueoXMgCd1c

降维算法

每个机器学习工程师都应该知道的基本算法

当特征的数量与数据点的数量要大很多时。降维算法可以帮你将特征的数量减少到目前问题所需要的数量。他们可以删除多余的特征,帮助你获得更好的结果。

降维算法有两种工作方法。第一种方法是通过特征选择,算法选取可用特征的子集。第二种方法是特征提取,将高维空间中的数据压到低维度。

常见的降维算法:

  • 主成分分析(PCA)

  • 低方差滤波(Low Variance Filter)

  • 高相关滤波(High Correlation Filter)

  • 随机森林(Random Forests)

  • 反向特征消除/前向特征构造(Backward Feature Elimination / Forward Feature construction)

更多的内容可以查看:https://www./2015/05/7-methods-data-dimensionality-reduction.html

决策树算法

每个机器学习工程师都应该知道的基本算法

决策树创建一个根据数据做出决策的模型。在树状结构中制作一个分叉,直到每个数据点都有对应的预测。与其他深度学习的算法不同,它们的结果很容易理解,并且它们很容易在许多不同的数据类型中使用。

常见的决策树算法:

  • 分类和回归树(classification and regression tree)

  • C4.5和C5.0

  • 随机森林(Random Forests)

  • 卡方自动交互检测(CHAID)

推荐教程:https://www./blog/2016/04/complete-tutorial-tree-based-modeling-scratch-in-python/

深度学习

每个机器学习工程师都应该知道的基本算法

机器学习和人工智能的概念是深度学习炒火的。他们是人造神经网络的现代版本,利用廉价的计算来训练更大的神经网络。它们证明了它们具有解决一些最难问题的能力。如AlphaGo。

常见深度学习:

  • 栈式自编码器(Stacked Auto-encoders)

  • 卷积神经网络(CNN)

  • 递归神经网络(RNN)

  • 胶囊网络(Capsule Networks,https:///what-is-a-capsnet-or-capsule-network-2bfbe48769cc)

推荐教程:https://www./library/view/deep-learning/9781491924570/ch04.html

本文为编译文章,转载请注明出处。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多