分享

真正的AI已近在眼前——Google I/O 2018观后感

 九把叉 2022-12-16 发布于上海

上周,5月9日凌晨,一年一度的Google I/O开发者大会在美国加州山景城的海滨露天剧场举行。作为当今科技领域执牛耳者,谷歌每年这场秀肌肉的盛会自然吸引了全世界的目光。大会之后,各种好评纷至沓来,谷歌的股票也应声上涨。

我怀着好奇,趁着周末赶紧补课,观看了大会的视频录像。果然,巨头就是巨头。拿出来的每一项武器都威力无穷。作为一个手握好几股谷歌股票的微小股东,我对自己的这笔投资也是信心大增。别问我为什么只有几股,不是我不想多买,实在是太贵而在下我又囊中羞涩啊...【泪奔】

虽然已经过了一周,我还是忍不住把自己观看大会视频的感想写出来,一吐为快。

先说个题外话

这是我第一次观看Google I/O的大会视频。精彩的开场视频之后,谷歌的现任CEO桑达尔.皮查伊(Sundar Pichai)登场亮相,开口的几句话,口音颇浓,咖喱味十足。我上网一查,果然,这位老兄出生在印度。2004年加入谷歌,2015年10月正式出任谷歌的CEO。他先后担任过Chrome、Android、Google Map等关键部门的负责人,中国的科技爱好者常常亲切地称他为“劈柴”,玩笑背后隐喻的磨刀、砍柴正如他在 Google 立下的汗马功劳。我不禁想起另外一家美国的科技巨头——微软,其现任CEO萨提亚.纳德拉(Satya Nadella)也是一位印度裔。坊间传闻印度裔精英很多在美国科技企业居于高位,看来并非虚传。

好的,现在进入正题

Google Assistant令人惊叹

谷歌这次大会亮出很多最新的产品,其中最为亮眼的是它的Google Assistant。两年前的I/O大会上,谷歌正式发布Google Assistant。经过两年的打磨,这个产品的智能水平已经发展到了令人惊叹的程度。

“劈柴”(我觉得这个外号挺酷,下文中咱们就不妨这么称呼Pichai先生喽)向人们展示了让谷歌助理给理发店打电话预约时间的过程。谷歌助理在整个过程中表现的极其自然,电话那头的理发店客服完全没有意识到她是在与机器对话。尤其是当美容院客服让谷歌助理稍等的时候,谷歌助理很自然的说了一句“嗯哼~”。所有在场的观众一片叫好。它已经能够很好的理解不同语气之间的细微差别,并给出非常口语化的拟人反应。

劈柴展示的第二个场景是谷歌助理打电话给餐厅预定位子。这个对话场景难度更大,因为对方的英文听起来很差,几次听错或者漏听了谷歌助手所讲的内容。比如把7号听成了7个人,然后转头又忘了谷歌助理说的时间。但是谷歌助理一直能有正确的反应,把对话带回到正确的轨道,最终顺利完成预定。



看到这里,我不仅感慨,如果国内某些厂商做的所谓“智能语音”产品,碰到这种情况,恐怕早就缴枪了,来一句“人类的问题总是那么难”了事。与谷歌的产品相比,国内厂家这些所谓的“智能音箱”或者“智能语音助手”,真的都只能算是玩具了。

仅就人类与智能音箱对话的场景中,谷歌也实现了“持续对话”。即在唤醒谷歌助手之后,就不需要再说“Hey, Google”了,向着更加接近人类之间的沟通方式迈进了一步。而现在大部分其他智能音箱,都还只能做到一句一唤醒,体验感自然相去千里。

为了提升用户体验,谷歌还特意新发了六个可选择的配音。同时,谷歌还特意请来了著名歌手John Legend来配音,并且很快也会上线推出(我特地选了一首John Legend的歌放在文章开头,你可以边听边看)。劈柴强调说,当然不需要让John Legend把所有需要说的话都配一遍(事实上也不可能),只要根据他的典型发音来合成其他单词或语句就可以了。其实对于这个语音助手的配音,我一直希望能够有一天,有哪家公司可以做到让用户自行采样,或者提供一两段声音,就可以合成用户自己希望听到的人的声音了。那该是多么美好的一个体验啊。

谷歌助手之所以能做到如此强大,其实关键还是谷歌所拥有的海量数据在背后做支持,使得谷歌在语音合成、自然语义的理解以及个性化信息的使用上,都居于行业领先地位,再加上强大的产品能力,最终呈现出来的效果令人惊叹也就属于情理之中的事了。

跟随着谷歌助手,谷歌还顺势推出了一款带有屏幕的goole home,相比之前的智能音箱多了一个屏幕,于是在语音控制的同时,还可以做更多的事情,反馈给用户的内容也可以更加丰富,有了更多功能上的想象空间。个人觉得会是一个非常值得期待的产品。

其他黑科技

除了谷歌助手,上周的I/O大会还是有很多其他让人兴奋的黑科技。比如说:

谷歌推出了TPU 3.0,采用液冷系统,性能是去年推出的TPU 2.0的8倍,可解决更多问题,让用户开发更大、更好、更准确的模型。

Google Lens功能越发强大,从原来的帮助用户“看问题”升级成了帮助用户“回答问题”。谷歌对此的描述是:用摄像头来回答问题,并显示答案。比如当你的手机摄像头对准一个台灯,它会自动搜索出类似的台灯款式和购买链接;当你的摄像头对准街头的建筑物,可以自动显示“这是什么”“我在哪里”这样的问题。今年 谷歌 将这个功能带到了手机的相机应用中,而且不局限于 Google Pixel 系列,支持的手机还包括 LG,摩托罗拉,小米,索尼,诺基亚,Transsion,TCL,一加,BQ,华硕等。

然后是全新的安卓系统Android P。在Android系统推出十年之际,谷歌带来了最新的Androis P系统,在智能、简单、数字生活三个方面得到全面的升级。其中包括更为省电的电池技术,Dashboard功能(可以设定手机使用时间等)和Shush功能(方便的进入免打扰模式)等一系列新的功能。更重要的是它提供了一套新的供开发者使用的工具ML Kit。虽然我对这个工具的能力不甚了解,可是看到谷歌如此郑重的强调,可以推测其应该也是一个重量级的产品。

还有Gmail的“Smart Compose”功能,可以根据写邮件的上下文语义,推测出你准备写出的句子,自动提示。不过,现场演示的视频中,Gmail提示的都是一些基本的常用语句,所以对于不常用语句的提示能做到什么程度,我觉得大概还需要市场的一个检验过程。而且,我觉得写邮件在某些场景下,是一件很私人的事情。这样的提示功能,让人有一种被人窥探的感觉,所以我个人对此功能持一定的质疑态度。

谷歌展示的最新图片处理功能也很不错。其中最实用的就是对一个文件的照片,可以自动将其转换为PDF格式,非常方便。

当然还有自动驾驶方面。截至目前,Waymo 已经在实际道路上完成了 600 万英里的路测,在 Google 的 AI 算法的加持下,Waymo的自动驾驶系统可以更加高效对道路上其他行人和车辆的行为进行预测,从而进一步提升其安全性,降低被碰撞的风险。

总结

可以看出,很多Google I/O大会上推出的黑科技,背后都有AI在加持,包括机器学习和大数据的支撑。AI在谷歌的产品发展体系中,扮演着越来越重要的角色。

当然其中最让我觉得印象深刻的,还是谷歌助手的神奇表现。Alphabet的董事长John Hennessy(前斯坦福大学校长,年度图灵奖获得者)在第二天的演讲中评价这次谷歌助手电话预约的表现时承认:

“在预约这个领域,这个AI已经通过了图灵测试。”

这绝对是一个非凡的突破!要知道,能否通过图灵测试,可是衡量一台机器是否具有智能的硬标准。从Alpha Go到Google Assistant,人工智能似乎在它前进的道路上又向前迈进了一大步。不管你对此是欢迎,还是担心,甚至恐惧,看来都不能阻挡它进化的步伐。既然如此,我宁愿怀着兴奋的心情,期待它给我们的生活带来改变的那一天早点到来。
或许,改变其实已经开始。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多