分享

对话李彦宏:百度为何要如此急切地与互联网公司决裂?

 造就Talk 2020-07-21

编者按:互联网的应用无疑使人类生活水平有了质的飞跃,然而百度创始人李彦宏却拒绝再把百度定义为一家互联网公司,拿出一副立刻要跟互联网公司决裂的架势,将人工智能作为公司未来的战略定位,并在7月5日的百度AI 开发者大会现场,亲自在北京五环乘坐无人驾驶汽车,不禁让众人期待到底我们离无人驾驶的普及还有多远?

而对于无人驾驶这样一个炙手可热的产品,百度又为何将核心技术免费对外开放?除了无人驾驶,百度还将推出什么能改变我们生活的智能产品?

这次,李彦宏携新作《智能革命》,与我们进行了一场深度对话,详细解答了那些近来关于人工智能最为热议的种种问题。访谈经过编辑,有删节。

摘掉互联网公司的帽子

记者:我们现在处于互联网时代,它所带来的便利已经渗透到每一个生活层面,但在这个移动互联网风起云涌的时点上您却说,互联网仅仅是这场技术革命里的前菜,而人工智能才是主菜,是因为百度在移动互联网领域已经落后了吗?

李彦宏:在互联网出现之前,其实人和人已经可以沟通了,但是人和物无法进行交流。互联网做里什么事情呢?只是提高了人和人之间的沟通效率,它并没有发生本质的改变。

那么人工智能能够做到什么?能够做到人和物之间进行沟通和交流,所以它的改变是更加根本性的,影响力会更大。所以我们说人工智能是主菜,这个表达跟百度领先与否并无直接关联。

记者:那么,是不是可以这样理解,是因为人工智能非常重要,所以百度必须脱离互联网的概念,把人工智能作为公司的未来战略?

李彦宏:任何一个公司今天在做它的业务的时候,不管是什么业务,都要用到互联网,所以这个时候再说百度是一个“互联网公司”,意义确实已经不大了。

我认为百度是一家更为技术驱动的公司。

拿AI作为一个例子,我们从2012开始就开始使用深度学习,那时候AI还没有那么吸引人,很多人觉得这种技术根本没有用武之地。但是在过去五年,我们看到AI有很多实际的应用,所以我们就大规模地投资AI,建立了百度大脑这个AI平台。

从全盘的角度来讲,人工智能就是整个百度公司的一个技术基础,该沉淀的数据都要沉淀,该整合的技术都应该整合,该开放的要向所有的业务部门去开放。人工智能确实会带来无穷无尽的可能性,在这方面百度目前确实也是非常领先的。

如果这个机会我们能够抓住,百度是可以变成一个完全不一样的公司,变成一个比现在影响力大得多的公司。

数据为先还是算法为先?

记者:您曾提到人工智能的能源是巨大的数据积累,这也使百度这样搜索引擎公司在研究人工智能具有先天优势。但这是否意味着,数据获取能力远超算法设计能力?

李彦宏:这可能是AI时代大家的第一反应或观察到的事情。因为如果你有足够多的数据,即便是算法稍微差一点,得出来的结果也是不错的。以至于我们百度内部的高级工程师总结出来一句话,叫“数据秒杀一切算法”。

但真正推动社会进步的是算法,而不是数据。

大家知道,工业革命的标志是蒸汽机的发明,可其实在瓦特发明他的蒸汽机之前的100年,蒸汽机就已经被发明出来了。那个时候的蒸汽机最早是出现在英国的煤矿行业。

为什么是这样呢?

因为早期的蒸汽机它的技术非常落后,需要耗费大量的能源,而煤矿边上就是能源最最集中、最最廉价的地方,无论多么的耗能,反正有的是能源。人们最早是要把这个煤矿开采煤时渗出来的水给提上去,才发明出了蒸汽机。但是今天当我们想起工业革命的时候,大家想到的是瓦特发明了蒸汽机,而不是英国的煤矿。

所以在今天的这个时代,大家说“数据就是新的能源”,我觉得这一点都没错,“数据秒杀算法”也是对的,但是真正推动这个社会进步的还是算法,还是技术。

AI时代的百度

记者:百度在人工智能的领域里,涉及面十分广泛,但在所有产品之中,百度最为着重研究的是哪几个方面?

李彦宏:百度人工智能的核心就是百度大脑。

百度大脑有四项基础能力,即语音、图像、自然语言理解和用户画像。它们最能够突出表现当今世界人工智能最热、最核心、最强大的能力。这几个能力虽然都是属于人工智能中比较典型的应用,但是它的发展阶段也是很不一样的。

记者:语音和图像识别是大部分人都在运用的人工智能,相比与其他公司的类似产品,那么百度在这两方面有什么不一样的创新吗?

李彦宏:百度大脑的语音识别现在已经到了第二代,使用深度学习的技术进行语音识别,准确率能够达到97%,已经超过了人对语音的识别能力。

图像最近几年也有了长足的进展。当前,百度地图的全流程数据生产自动化程度已超过80%,全景图像的自动化识别提取准确率高达95%。能精准识别店铺名称、门牌号、停车场标识,甚至营业时间。

这两者都属于人工智能当中认知的部分,所以深度学习的算法非常适合处理这些形式。

相对来说,自然语言的理解、或处理能力就更加难一些,并处在一个更加早期的阶段,因为它除了认知方面的能力之外,还要求有推理、规划等等能力,才能够真正地理解自然语言。

记者:用户画像也是百度的四大黑科技之一,听说连美国电影《魔兽世界》也来找你们合作,这个功能给他们带来了什么样利益?

李彦宏:用户画像的能力,其实从传统意义上来讲并不是人工智能的领域,但是由于近年来大数据的发展,尤其是大型互联网公司有能力搜集很多用户的数据之后,再用人工智能的方法、用机器学习的方法,把一个人的特征描绘得非常非常清楚。

所以今天,用户画像也变成了人工智能、或者说变成了百度大脑的一个重要功能。

电影《魔兽》利用了百度大脑的用户画像功能来提升它的票房。

它把人群分成三类,一类人是不管怎么样都要看的,另外一类是不管怎么样都不会看的,这两种人他们都不太关心。它关心的是它可以影响的人群,再通过用户画像把这些人从摇摆的转换成真正去电影院看的。(原来)他认为如果有5%的票房提升就很满意了,最后实际上提升超过了200%。

记者:“度秘”是一款特别有趣的人工智能系统,从您的亲身经历来看,它在人们的生活里会扮演什么样的角色?它的未来会朝什么方向发展?

李彦宏:度秘是一个智能个人助理。它除了能够识别语音和图像之外,其实更关键、更核心的技术,是能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,尽管不是每一次都能理解。

电影吧里面也有度秘,你可以问它“这是什么电影?”或者让它给你推荐个电影。它在若干个领域已经学得人模狗样了。贴吧有1000多万个,每个领域都可以无限的细分下去,我们都可以把度秘训练成那个领域的专家。

记者:百度在人机交互方面也有很多新的突破,新发布的DuerOS被国内外同行称为“具有划时代意义的对话式人工智能操作系统”,您能简单地向读者解释一下这个系统吗?

李彦宏: Duer操作系统可以简单理解为是一套人机交互的操作系统,你可以用自然语言来控制机器,还可以跟它对话,它是懂你的。

Duer OS的定位,是要让冰箱、桌子等日常用品在任何环境下都具备与人对话的能力。这相比算法的开源,又往前推演进了一步,这就好比之前提供了电脑芯片,现在开始提供类Windows的操作系统,可怕的是它连接的不光是虚拟世界,而是真实的世界。

记者:据我所知,人脸识别技术现在的发展也非常迅速,目前阿里巴巴也在做类似的技术开发,您觉得小度人脸识别与阿里巴巴的这项技术相比,有哪些特点?

李彦宏:主要是围绕三个维度展开的。

首先是大数据,小度机器人学习了近2亿张人脸的图片,这绝对是人类一辈子也无法实现的任务,一方面人一辈子见不到这么多人脸,另一方面,也远远超出了人脑记忆的极限,何况这是一个非标的人脸特征记忆。

其次是GPU的红利:小度相比起人类,它永远不知道疲惫,可以24小时不间断地工作,而且单位时间内的工作效率是人类的无数倍。

最后是算法,百度也开源了自己的深度学习源代码paddle(多机并行GPU训练算法),主要优化在于提升每台机器的数据处理能力,业内评价是“相当简洁、设计干净、稳定,速度较快,显存占用较小”,而开源不仅降低了准入门槛,也可以吸引更多开发者使用深度学习,提高整体的性能。

为何要开源?

记者:百度将阿波罗自动驾驶技术免费对外开放,我们也关注到硅谷大神伊隆马·马斯克也将特斯拉所有专利技术开放出来,这里面除了表示百度的自信之外,还有什么其他考虑吗?

李彦宏:因为过去一年中,无人驾驶汽车技术的发展使得主要的汽车厂商和一些与汽车相关的运营商,比如说UBER、Lyft等都很焦虑。

这就出现一些什么情况呢?

大家都花巨资去投资或者收购一些小的无人驾驶汽车创业公司,他们的员工可能在百度或者谷歌做过一两年的无人驾驶,创业出来再做一遍,然后就获得了几千万、上亿美金的风投,像福特、UBER这样的公司就会几亿美金甚至十几亿美金去购买这样的小公司。

但是我们觉得这样的现象是非常不合理的,因为这相当于每个人都在重新发明一遍轮子。

大家没有必要再重新做一遍我们做过的事情。因此我们把已经积累了三年左右的无人驾驶技术开放出来,让大家免费使用。这样一来,所有跟汽车有关的产业都可以在更高的起点上去做他们应该做的事情,去增加他们独特的价值。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多