分享

阿里科学家狂喊30多杯咖啡,机器听音下单,咖啡师中途放弃

 天下小粮仓 2018-05-24

“我要吃热干面”

“这里是咖啡馆,饿了莫叫妈,上云就上阿里云”

“好,那我要五个巧克力、两个香草拿铁,巧克力加奶油。”

“两个中杯焦糖拿铁,一个热的一个冷的。”

“算了巧克力不要了。”

“再要六个小杯少冰摩卡,三杯加焦糖三杯加香草。”

“再加一个大的冷的拿铁,去冰半糖加脱脂奶,打包。”

鄢志杰最快以每秒5个字的语速向一台机器点单。机器对每一次对话都作出了精准相应,而站在一旁的资深咖啡师选择了中途放弃,“太快了,记不下来”。

阿里科学家狂喊30多杯咖啡,机器听音下单,咖啡师中途放弃

阿里科学家狂喊30多杯咖啡,机器听音下单,咖啡师中途放弃

“今天我们将机器对人类口语的理解能力带到了新的高度,这比上海地铁语音售票的技术还要高一个台阶”,鄢志杰说,这种交互方式完全打破了"语音唤醒+语音指令"传统命令式交互方式,首创的流式多意图口语理解引擎,极大地提升了对人类随意、自然的口语表达的理解力,能够做到免唤醒的自然的人机交流式的语音交互。上述点单环节包含了修改、删除、加单等多轮对话,在整个交流过程中,顾客不需要说”hi,点单机“之类呆板的唤醒词,可直接下单,更符合人与人的自然对话。

据鄢志杰介绍,这些模块并非简单级联,而是深度融合而形成了多模态语音交互方案,包括是公共场所强噪声环境下的信号处理和语音识别、视频识别与面部识别、场景感知等多模态融合的感知智能,同时更融合了流式对话、多轮多意图口语理解、业务知识图谱自适应等认知智能。“不止是语音识别,关键还能修正前面的指令,得有智能。”据了解,上述人工智能点餐系统已经全面开放了技术,会在全国铺开推广,武汉的落地应该很快。

此外,阿里云这项解决方案除了可以做收银员之外,还能在地铁卖票。目前,上海地铁已经部署了这一技术。

乘客直接说出目的地,售票机便可选择合适的站点和路线。这对于初到上海的乘客尤其帮助巨大,面对十几条线路三百多个站点谁都会懵。测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。

目前已经落地的场景还有车内语音助手、电话智能客服、可免遥控器操作的远场语音电视、可精准区分多人对话的智能麦克风等。

49秒!阿里云AI狂点30多杯咖啡

文/记者 张珺 章胜 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多