ASR:automated speech recognition 自动语音识别 NLU:natural-language understanding 自然语言理解 第一章 导语 1.为什么使用VUI? 1)速度 2)解放双手 3)直觉性,每个人都知道如何说话 4)同理心,语音中包含了语气、音量、语调和语速 2.不适合使用VUI的场景 1)公共场所 2)不适应对计算机说话,并不是每个人都习惯对计算机大声说话 3)一些人更喜欢打字 4)隐私 Chatbot 聊天机器人 第二章 语音用户界面基本设计原则 1.移动VUI设计的挑战之一:确定是否需要一个视觉化的呈现,协同设计非常重要 2.多轮对话:人类很少进行单轮对话。不要强迫用户展开新一轮对话,而是去尝试了解用户的意图并允许用户继续交谈,以及有必要为用户近期所说的话保留历史记录 3.示例对话: 1)为每一个场景写一些最优路径的示例对话 2)再写一些异常情况,比如系统没有听到或理解用户的话 3)大声读出你写的内容 4.流程图 列出所有分支,分组 5.确认的策略 “确认”的数量多少 如果是银行转账,确认环节至关重要,如果是休闲娱乐类,出错可能不是一件大事儿 方法一:三级置信度 用户:再买一些纸巾。 VUI:(置信度大于80%,使用隐性确认)好的,已经为您订购了更多纸巾 VUI:(置信度为45%—79%,使用显性确认)我想您是希望订购更多纸巾,是吗? VUI:(置信度小于45%)对不起,我没有听清您讲的话,您想买什么? 方法二:隐性确认 “旧金山的天气是…” “好的,我已经为您与娱乐明早十点的会面” “猎豹是最快的陆地动物” 方法三:非语言式确认 方法四:通用确认 VUI:昨晚睡得怎么样? 用户:不太好 VUI:听到这个消息我感到很难过 方法五:视觉确认 |
|