新课上线：fast.ai推出针对程序员的机器学习课程

过而能改得佛法 2018-10-03

展开全文

来源：fast.ai

编译：Bing

今天，数据科学家Jeremy Howard发布了fast.ai最新的（也是最全面的）课程：Introduction to Machine Learning for Coders。这门课程在旧金山大学中录制，是数据科学研究生课程的一部分，涵盖了目前机器学习中最重要的使用基础。其中共有12节课，每节课大约2小时。课程要求你有至少一年的编程经验，以及高中数学基础。以下是论智对课程内容的大致编译：

现在网上有很多优秀的机器学习课程了，最出名的Andrew Ng的Coursera课程。但是由于课程推出的时间较早，有些过时，因为其中用到的是Matlab。而我们这次的新课程使用的是现在流行的工具和库，例如Python、pandas、scikit-learn和PyTorch。与很多领域中的教育资料不同，我们的方法是“编程为先”而不是“数学为先”。这很适合每天编写代码的人，但可能不会过多地练习数学知识（我们会在必要的时候穿插讲解数学）。更重要的是，这项课程非常“个性化”，我们并不会讲到各种类型的模型，只是关注在实践中真正有用的东西。

在课程中，我们会讲到两种主要类型的模型：基于决策树的模型（尤其是经过bagging的决策数森林），以及基于梯度下降的模型（逻辑回归和它的变体）。决策树模型搭建的结构如下图所示（实际工作中你可能会用到比这更大的树）：

Terence Parr教授和Prince Grover关于决策树可视化技术的研究，利用了他最新的animl可视化库

决策树方法非常灵活易用，用bagging和boosting结合后，可以在很多实用任务上运用。但是，当它们用到训练之外的数据上时，可能有些困难，而且在图像、音频、自然语言等类型的数据上会表现得不太精确。这些问题通常都能用梯度下降的方法解决，这些会在我们课程的下半部分讲到，然后简单地讲些深度学习神经网络的知识作为结尾。（如果你曾经上过我们的Practical Deep Learning for Coders的课程，可能会觉得有些地方概念有重合，但是我们教授的方法是不同的）

你将学会如何从零开始创建完整的决策树森林，并编写自己的深度学习模型，从零开始训练。在这一过程中，你会学到很多有关数据处理、模型测试和产品开发的技巧（包括有关数据产品的道德问题）。

下面是对每节课程的简要介绍。

Lesson 1—Introduction to Random Forests

第一课将向同学们展示如何创建一个随机森林，随机森林也许是应用最广泛的机器学习模型了，其中会以Kaggle竞赛中的Bull Book for Bulldozers项目为例，用随机森林创造出解决方案，结果可以达到Kaggle排行榜的前25%。你将学到如何用Jupyter Notebook创建并分析模型，如何下载数据，以及其他可能在实践中用到的机器学习基础技巧。