第一课 机器学习简介课程主讲是谷歌机器学习技术总监,他主要是介绍他在2001年加入谷歌之后致力于机器学习技术的研究与应用,他很有预见性提出要通过机器学习手段解读数据内隐藏的潜在关系与含义,提到了课程目标是帮助学习者在机器学习道路上顺利前行。软件工程师学习机器学习可以在一下三个方面能力获得提升:1.提供可缩短编程时间的新工程应用2.自定义用户产品,基于机器学习算法的程序,迁移能力更强3.解决以前人工无法判别与识别的问题 另外学习机器学习课程,还可以帮助软件工程师改变思维方式,从数学和软件工程思考方式转换到自然科学的思考方式,像科学家一样思考、愉快的探索其中奥秘。 第二课 框架处理课程目标有两个
课程老师来自谷歌技术团队,介绍了什么是监督式机器学习,在监督式机器学习中如何创建模型与输入信息,对以前从未见过的数据做出有用的预测。当训练模型时候,会为其提供标签,关于什么标签,解释如下: 标签 是指我们要预测真实事物,以垃圾邮件过滤为例,标签可以是垃圾邮件或者非垃圾邮件等内容,它是我们试图预测的目标, 特征 是我们表示数据的方式,以垃圾邮件过滤为例,特征可以从电子邮件中提取,可以是关键字、收件人、发件人、各种路由或者标题信息等多个维度信息,以及任何可以从电子邮件中提取并提供给机器学习系统的信息。 样本 样本是一份数据,以垃圾邮件过滤为例,它可以是一份邮件, 有标签样本 具有特征信息比如 关键字、路由信息、收发件人等、具有标签信息比如垃圾邮件或者非垃圾邮件等等。 无标签样本 具有特征信息,但是我们不知道它是否是垃圾邮件,需要对其做预测分类 模型 可将样本映射到预测标签,模型有内部参数得到,这些参数通过学习得到。 回归与分类 回归模型可预测连续值。例如,回归模型做出的预测可回答如下问题:
分类模型可预测离散值。例如,分类模型做出的预测可回答如下问题:
第三课 深入了解机器学习复杂的模型与数据有很多,研究方法也有很多,但是我们从最简单、最熟悉的方法入手这能帮助我们了解更多复杂的方法,让我们以数据为基础,用第一个小模型练习一下,小型数据集包含房子面积与价格,房子的面积作数据做为X轴、房子的价格是Y轴,我们尝试用线性回归学习,生成一个模型,然后用它根据房子面积来预测价格,阐述了回归问题中损失计算、针对单个样本L2误差,在训练过程中预测值与真实值差距越大,平方误差越大,在训练过程中,误差是整个样本真实值与预测值之间的误差,训练是要减小整体误差,而不是某一个样本的误差。 平方损失:一种常见的损失函数 接下来我们要看的线性回归模型使用的是一种称为平方损失(又称为 L2 损失)的损失函数。单个样本的平方损失如下:=标签跟预测值之间的差异=(预测值 - 标签(x))^2= (y - y')^2 均方误差 (MSE) 指的是每个样本的平均平方损失。要计算 MSE,请求出各个样本的所有平方损失之和,然后除以样本数量: 其中: (x, y) 指的是样本, 其中 x 指的是模型进行预测时使用的特征集(例如,温度、年龄和交配成功率)。 y 指的是样本的标签(例如,每分钟的鸣叫次数)。 prediction(x) 指的是权重和偏差与特征集 结合的函数。 D 指的是包含多个有标签样本(即 (x, y) )的数据集。 N 指的是 D 中的样本数量。 虽然 MSE 常用于机器学习,但它既不是唯一实用的损失函数,也不是适用于所有情形的最佳损失函数。 线性回归 - tensorflow演示代码
谷歌免费 机器学习视频教程 官方学习地址:https://developers.google.cn/machine-learning/crash-course/ 关注【OpenCV学堂】 |
|