数据:从现实生活抽象出来的一些事物或者规律的特征进行数字化得到。 学习:在数据的基础上让机器重复执行一套特定的步骤(学习算法)进行事物特征的萃取,得到一个更加逼近于现实的描述(这个描述是一个模型它的本身可能就是一个函数)。我们把大概能够描述现实的这个函数称作我们学到的模型。 更好:我们通过对模型的使用就能更好的解释世界,解决与模型相关的问题。 一个有关于机器学习的故事想必大家都听说过了地心说与日心说这样的关于太阳系的模型,今天咱们谈谈另一个人开普勒。在开普勒之前没人能给出足够准确的行星运动规律。开普勒发现了行星运动的三大定律,分别是轨道定律、面积定律和周期定律。作为第谷·布拉赫的接班人,开普勒认真地研究了第谷多年对行星进行仔细观察所做的大量记录。最后得到了这些非常精确的模型,事实上开普勒的多年工作就是在做“人肉的机器学习”做出了一个大概差不多对的模型。 为什么是大概差不多对?(个人观点)是现有的信息与知识理论所致。就像牛顿的万有引力定律完美的解释了很多的自然现象。但是后来在经过宏观高速世界的洗礼爱因斯坦的相对论更加具有普适性。一个人从三楼掉了下去牛顿说这是万有引力,但是爱因斯坦说这是空间的运动。也许再过一段时间会有更加合适的理论出现,就是这个道理。那什么是对的什么是真理?自然本身是真的换句话只有上帝知道答案,我们只能逼近于它。 |
|