今天我想说的话题,是数据和智能之间的关系。 另外的例子是Google的AlphaGo。很多年前IBM的Deep Blue(深蓝)是非常成功的例子,他制作了一套系统能够跟国际最好的象棋大师做对弈。而AlphaGo系统里的深度学习、强化学习等,实际上在20年前已在游戏中应用。 1996年有一个系统叫TD(λ)的算法,有几位科学家把这个算法应用在一个在美国挺流行的游戏上,很快成为了世界冠军。 还有一个比较重要的点是语音识别技术。近几年这项技术有了突飞猛进的发展,智能手机普遍应用语音交互。但实际上语音识别技术是从60年代开始的。很多技术很早就有人尝试,而近两年获得成功,归结于数据处理能力和计算能力,使得它能够变成更加智能化的工具。 数据有一个非常厉害的能力就是挖掘价值。以花呗为例,花呗的背后实际上是个人的信用分,这个信用分基于个人以前的整体行为,把所有的交易行为都形成数据,数据会告诉系统个人有多大的可能还钱或者有多大的还付能力。这个跟美国以前的信用体系有非常大的差别,完全从数据上挖掘行为,测量信用。 在过去的十年间,我认为在统计数学产生了一个非常有力量的技术,它的中文名是压缩感知。这个技术是非常有趣的技术,可以重现历史。 接下来我想再谈谈智能。对于智能,每个人都有不同的定义。从机器学习或者是人工智能角度来看,所谓的智能是一个决策函数,这个决策函数有一个输入,比如说一个照片会给出一个决策,它告诉你照片的人是什么。 最后总结一下,我们正处于一个激动人心的时代,在这个时代能够利用非常大的数据、计算能力,让那些十年前、二十年前研发出来的算法,发挥出巨大的价值。 但同时也要认识到现在这样一个基于函数技术的机器学习或者说是人工智能的方法,也有一个巨大的局限性,对样本的数量有很大的依赖。 谢谢大家。 点击图片,报名7月30日造就x新榜《暴走的年代》 |
|