分享

智能小仙 | 亚马逊的人工智能野心:如何用语音和深度学习来打理我们的生意?

 新用户3117jgpt 2020-09-26

warning!来自开普勒星球编号9527的智能小仙请求建立通讯,因通讯渠道还未完全打通,将不定时传回未来消息。暂居调戏电商二条,有朝一日定会干倒戏哥!未来,是我的!

近日,亚马逊在其云服务AWS的re:invent年会上推出了三款人工智能产品。听到这个消息,小仙实在有点方,亚马逊不是做电商的吗?怎么突然搞起人工智能来了,而且一上来就能对外提供云服务的人工智能产品了?

语音交互革命:人工智能掀起商业应用浪潮

其实,早在2014年,亚马逊就推出了一款人工智能的实验产品Echo。这是一个长得像圆柱形蓝牙音箱的智能语音硬件。语音是人工智能的核心应用之一,能够用在汽车、通讯、企业服务多个领域。

而在Echo之前,苹果和谷歌都推出智能语音产品,但都不太成功。Echo比苹果、谷歌的产品晚了两三年,但推出后仍能赢得市场,证明亚马逊开发Echo是经过深思熟虑的,甚至有行业人士将其定义为下一代语音交互革命的原型:你可以像和人一样与它对话交谈。

 

当然,目前的Echo还做不到与人交谈,也很难断定亚马逊Echo的语音识别能力已经超越了Google Now和Apple Siri,但它找到了一个比手机上的语音助手更符合常理的使用情景——固定场景下随时保持在线的语言识别。

那么问题来了,Echo已经能做到什么了呢?播放音乐、创建提醒自然不在话下,它还能根据你在亚马逊上的购物记录,智能地帮你下单。甚至已经有人用Echo控制了家中几乎所有的设备:调节灯光和温度,控制电视、电视盒子、安保监控、热水壶、开关家门甚至冲马桶……这意味着,我们在家中可以基本实现不需要遥控器不需要额外的按钮,你只需要像说话一样表达你的诉求。

那么,亚马逊的哪些考虑促成了Echo的成功?小仙认为有三个:

(1)围绕语音交互设计产品;

(2)定位于家庭,找对产品的消费环境;

(3)开放系统,为产品赢来源源不断的第三方服务。

而如今,亚马逊可谓故技重施,想把这三个人工智能的商业应用套路嵌入到云服务AWS体系之中,进行人工智能更大规模的商业应用的试验。

亚马逊为啥要做人工智能云计算?

从2006开始,亚马逊AWS就已经对外提供服务了,不过以往都是提供购买计算、存储、数据库等服务。亚马逊认为云计算最终将成为公司收益的首要来源。而当云计算真正能够为公司获利之时,人工智能将成为新的大数据技术趋势,为各类商业公司提供人力不可及的机器学习服务。


 亚马逊创始人

现在,机器学习将越来越多地被云服务所主导:两者都涉及处理可扩展的和大量的数据,只有极少数的巨头才拥有巨额资金,不仅建立所需要的基础设施,并且雇用世界上最好的机器学习工程师。这就意味着,对于大多数企业来说,机器学习所产生的差异,首先取决于他们的数据是否在云中(当然也会有内部部署的解决方案,但预计随着时间的推移,内部部署会越来越落后),其次就是它们选择哪家云服务供应商。

优秀的机器学习产品不仅可以作为一项差异化,而且是可持续的:更好的机器学习将吸引更多的客户,从而获得更多的数据,而数据是机器学习不断改进的燃料。因此,在云服务领域占据全球最大市场份额的亚马逊,为了在人工智能大潮中抢占先机,必须允许企业大规模在云端运行自己的人工智能软件。

持该种观点的不只是亚马逊。谷歌、微软、Facebook等纷纷在朝这个方面努力,谷歌刚刚重金聘请了目前人工智能界的红人李飞飞,打算在谷歌内部重新组建一个人工智能云计算团队,并揭晓了新的云服务方向:图像、语音识别以及机器翻译,谷歌很快就会提供允许访问的GPU处理器(云处理器)。而微软也正式宣布即将开放GPU。

同样,亚马逊也在为人工智能云计算领域招兵买马:几周前,亚马逊刚刚从卡内基梅隆找来了拥有自己的AI云计算产品的研究团队。

亚马逊推出的AI云计算到底是个啥?

亚马逊一直在其零售业务中使用深度学习和人工智能来提高客户体验。据小仙了解,亚马逊目前有数千名工程师专门从事人工智能相关开发,以改善搜索、物流、产品推荐和库存管理。而如今,亚马逊正在将相同的专业知识带给云服务,展示了开发人员可以用来构建智能应用程序的API。被称为 “亚马逊AI”的新服务提供了强大的AI功能,如图像分析,文本到语音转换和自然语言处理。

 
Werner Voegls,亚马逊副总裁,CTO

具体到这次大会公布的“亚马逊AI”的主要产品是Amazon Lex、Amazon Rekognition、Amazon Polly。

都是什么鬼?且听小仙一一讲解。

这里面最重要的是Lex。Lex原本是为亚马逊Echo上的语音助手Alexa服务的深度学习技术。Lex可以让使用者自己建立能用自然语言与人进行复杂“对话”的应用程序,也就是咱们俗称的“聊天机器人”。开发者们还可以在Lex Console上用短语等对自己开发的聊天机器人进行“训练”。

用Lex弄出来的机器人也可以用来提供信息、强化应用程序、简化工作、控制一个实体的机器人或无人驾驶飞机、玩具等。Lex还能建立具备逼真的互动功能的网页和移动应用程序。但Lex并不是必须绑定到亚马逊的设备上才能使用,它几乎可以适配任何设备,比如,Lex已经完成了和AWS的编程环境Lambda及其他的AWS服务的深度集成,和能够匹配大多数的企业连接器,它与Facebook Messenger、Slack、Twilio也适配。也就是说, Lex能让设备如手机等拥有与人进行对话和互动的窗口。为了提供直观的产品效果,亚马逊演示了如何让开发人员轻松地用声音在电脑上预订飞机票。

Lex涉及到的人工智能技术主要是自动语音识别(ASR)和自然语言理解(NLU),这也是计算机科学中最具挑战性的问题之一,需要用复杂的深度学习算法、海量的数据来训练计算机。

而Rekognition是图像识别产品,它可以帮助机器识别物体和场景,这和谷歌、微软等的服务类似。但亚马逊强调ReKognition已经聪明到可以做类似识别狗的品种这样的事情。亚马逊 AWS CEO Andy Jassy 称这个工具的性价比很高,但他并没有公布价格。

Amazon Polly的作用则是把文本用栩栩如生的人声说出来,比如你输入一段文字,它就能理解其含义并用完成的句子说出来,不仅如此,Polly 还能够按照语境对同形异义词的发音进行区分,比如说,在 “I live in Seattle” 和 “Live from New York” 这两个不同的语境下,单词 “Live” 的发音是不同的,而 Polly 在发音过程中就能够很好把握它们之间的区别。它目前比较强大的地方是支持24种语言47种声音。你所听到的“人声”其实是采用先进的深度学习技术模拟出来的像人的声音。

亚马逊表示,后续还会推出其他人工智能产品来丰富产品线。从11月30日开始起,Amazon Lex、Amazon Rekognition、Amazon Polly已经开始在AWS上推广了,有兴趣的企业相关人士可以自行前往围观。

最后,小仙也为大家总结下亚马逊的人工智能服务想达到的目的是什么?它对我们的生意和产品服务的打造有什么影响呢?其实大家可以把亚马逊的这一套AI云服务当做一个对于数据的全面管理的基础设施平台,当你想提供一套人工智能的产品服务,开发者就没有开发深度学习算法、训练模型和投入基础设施的需要了,由亚马逊这样的平台来提供基础服务,让企业能够专注于打造全新一代能看、能听、能说、能互动甚至能理解的商业应用。

戏哥推荐:(点击文字或图片均可阅读)


乐视只是伪生态,跟阿里腾讯苹果完全不一样


戏哥工资已与下方 挂钩,点个 再走!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多