分享

未来已至?Rokid机器人不完全体验

 jinnison 2016-09-30
打赏2 2016-09-28 16:36 分类: 智能设备 绯村心太

未来已至?Rokid机器人不完全体验

在当初Rokid同期众测的产品里,Rokid真的是最低调的那个。

未来已至?Rokid机器人不完全体验

特别是跟Rokid同期众测的360儿童机器人那么显眼,而Rokid的标签又是“音乐机器人”,LZ潜意识里就把Rokid当成是玩具级别的播放器了,根本没点进去看(而从没详细写过科技产品原创、从没中过科技产品众测的LZ能成功申请到Rokid,也真的是惊喜万分)。

未来已至?Rokid机器人不完全体验

直到收到群发的微信提醒,特意去查看了下Rokid的众测详情,首先就被价格吓到了,市场价5280元(希望众测报告里把价格放前面的值友看过来)。

作为一款真正将人工智能带入家庭的Home A.I产品,Rokid 集声纹、面部和动作识别于一体,实时感知外界声音和灯光,动动嘴就能控制智能家电;基于深度学习,Rokid为家庭量身制定音乐、新闻等内容服务,进行智能化推送,让家庭生活更加高效且充满乐趣。

这是Rokid的众测页面的商品介绍里的第一段话。“深度学习”“声纹、面部和动作识别”“控制智能家电”“智能化推送”……区别于众测商品的标题“Rokid 若琪 音乐机器人”,大概这一段话的描述,才是Rokid创造者的初心。而这些,也深深地吸引着LZ去申请这个众测,甚至是第一个申请不上也很想买一个的产品,来看看“中国造”的机器人到底做到了何种程度。

注1:Rokid,是“Robot” “Kid”的合称,中文名“若琪”,是一位女生。众测报告的文字部分提及到本次众测产品时都会用“Rokid”,仅仅是因为英文单词在一堆汉字里更容易辨识,方便阅读。

注2:本文较长,长到一向抵制写长文的LZ都压不短了,想看重点的建议跳着看图片和视频,以及最后的总结。


0、大有来头的Rokid团队

众测页面的介绍很迷幻,不过LZ迫切想知道Rokid的科技部分是如何实现的,以及是谁发明了Rokid。而在了解了Rokid创始人及其团队之后,让LZ愈加对Rokid有了期待。Rokid三位创始人有:

CTO Misa:负责深度学习,视觉和自然语言处理研发的前阿里巴巴M工作室领头人;

CFO Eric:前金山软件和好孩子集团的CFO, 前阿里巴巴集团的财务副总裁兼公司财务总监;

CEO Dan:硅谷产品经理出身,前Nokia、Samsung中国区副总裁。

其余团队成员均来自设计、硬件、结构、语音识别、图像识别等领域,其中30%为博士。

CFO和CEO都大有来头,而LZ最感兴趣的还是核心创始人Misa:阿里巴巴M工作室的名字就来自Misa的首字母,比较有名的产品是一淘火眼,以及随后手机淘宝利用增强现实技术AR的“抓蝴蝶”。随后LZ翻看了Misa几年来的微博,除了工作相关的微博外也有不少有趣的内容,工作之外的兴趣大概是星战、乐高和机车。

想要更多了解Misa关于机器人设计理念的值友,建议看一下下面这个视频《人和机器的边界》,是Misa在天猫卖完第一批Rokid后的一个presentation:

ps:视频里的Misa远看有点像韩寒,样子酷酷的。


聊了这么多了,下面开始正文。


1、开箱

其实在确认参加众测的当天下午众测君就已经发了顺丰快递,通常第二天早上九点左右就能收到,但是那天不知道什么原因,下午东西才到自提点,开箱时已经是晚上了。

未来已至?Rokid机器人不完全体验

物流箱是家电那种加厚的五层瓦楞纸,大概50cm高,物流箱里面还有黑色的产品包装箱,两个箱子之间用厚厚的瓦楞纸做护角,安全性满分。

产品箱的其中一边是一次性封口贴,手撕即可不需要小刀,开启比较方便。

未来已至?Rokid机器人不完全体验

开箱过程不赘述了,参见动图。

未来已至?Rokid机器人不完全体验

配件很简单,除了机器本体就只有电源线、三包凭证和使用说明。


2、温润如玉、美轮美奂——Rokid初接触

先来个摆拍(头图候补):

未来已至?Rokid机器人不完全体验

下面慢慢介绍:

未来已至?Rokid机器人不完全体验

刚从包装盒里出来的Rokid就深得北鼻欢心,要不是LP拉着好几次差点扑上去。不过之前看过很多Rokid美照的LZ对此无感,早就做好上午开箱的LZ,自然迫不及待地想要赶快开机体验。下面是首次开机视频:

未来已至?Rokid机器人不完全体验

视频中没有记录扫描二维码绑定设备的过程,这是扫描之前拍的一张照片。

未来已至?Rokid机器人不完全体验

开机后不一会儿,开始自动更新系统了。这时候LZ就静静地欣赏Rokid,脑海里冒出了小时候看《圣斗士星矢》里的奥丁蓝宝石。编辑照片的时候LZ满脑子都是“太美了”,然而真实的Rokid比照片还要美。

下面详细介绍Rokid的组成:

2.1 整体

未来已至?Rokid机器人不完全体验

Rokid大体上由两部分组成,头部和底座。重量(不含电源)为4.0kg(实测),三围为250×213×345mm(官方数据)。

未来已至?Rokid机器人不完全体验

正好电视柜旁边还有点空间,旁边的大象挤一挤,就把家安这儿了。

未来已至?Rokid机器人不完全体验

上面这张照片是Rokid的俯视图,基本是椭圆形,底部比头部大一圈,点亮时头部背面的亮度(上图白色区域)要比头部正面更亮一点。

Rokid顶部的摄像头区域是触控的,可以唤醒Rokid或者让她休眠;左右两侧也是触摸控制,分别调节亮度和音量——顶部控制很灵敏精准,两侧触控则不太好用。

2.2 摄像头

未来已至?Rokid机器人不完全体验

头部的顶部为高清摄像头。

未来已至?Rokid机器人不完全体验

摄像头的像素为1300W,采用最新的分区高动态范围曝光(SME-HDR)背照式感光传感器,具备录制60帧/秒的1080P视频的能力,另外未来还可以通过摄像头进行视频聊天、人脸和手势识别等——嗯,目前为止,除了开机扫描二维码绑定设备外,摄像头还没什么用武之地。

2.3 DLP数字投影机

未来已至?Rokid机器人不完全体验

首先得承认,看到众测页面这段的介绍时,LZ误以为是世嘉Homestar那种星空投影灯的效果未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

投影机在Rokid的头部内,采用TI的DLP数字投影技术,搭配有全色域LED阵列,寿命可达3万小时。

未来已至?Rokid机器人不完全体验

定制化的光路和非球面光学镜片组,可将交互表情、图像等信息投射到双曲率显示表面上,尽量做到清晰、柔和、不失真。

未来已至?Rokid机器人不完全体验

Rokid的颜色有多色可选,投射出来的效果都很美。

未来已至?Rokid机器人不完全体验

Rokid的亮度在明亮环境下会稍显不足。

未来已至?Rokid机器人不完全体验

黑暗环境下做氛围灯效果很不错,特别是这个桃红色。

未来已至?Rokid机器人不完全体验

投影机投射出来的画面远看很灵动,清晰度也足够日常使用。

未来已至?Rokid机器人不完全体验

不过凑近看的话投射画面还是会比较模糊,毕竟投影不能跟数码产品的视网膜屏比。

ps:这不是LZ拍糊了。

最后再上几张不同图案的“星·情”:

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

其实图案是千变万化的,不过LZ是对称党于是就选了这几张。白色投影灯光下玉石般的机身,Rokid有种摄人心魄的美。

2.4 麦克风阵列

未来已至?Rokid机器人不完全体验

Rokid的麦克风在底座的上部,靠近头部位置。

8颗高灵敏度数字MEMS麦克风组成了全向圆形阵列;采用Rokid智能AEC算法消除自身音源,实现放音的同时,360度全向拾取外界语音命令;使用Rokid研发的beamforming算法进行空域降噪处理,有效拾音距离可达5米;采用Rokid研发优化的DNN(深度神经网络)算法语音激活,综合提高在复杂环境下的语音交互的准确性和流畅性。

未来已至?Rokid机器人不完全体验

语音控制需要精准的收音和优秀的降噪,全方位的麦克风、Rokid团队自行研发的降噪等算法也让整体的语音交互表现很优异。

2.5 音响系统

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

Rokid的音响系统在底座内,整个底座的侧面都是音响的铝合金箱体。面板上方的圆环是发光区域,而当你跟Rokid对话时,声音寻向技术会让朝向你的方向亮起灯来。

360°音响包含4个1.5英寸口径、低失真、长冲程全频扬声器单元,2个低音被动无源辐射器,频率范围80HZ-16KHZ;一套功率输出20W×2的高性能DSP功率放大器;高度集成在一个铝合金压铸音腔盆体内;以最小的体积实现更强大的音压和最佳的全向音响品质。

以上是Rokid的官方介绍,后面相关章节有对音质的介绍;至于手感和做工,完全没得挑。

2.6 电源适配器

未来已至?Rokid机器人不完全体验

电源适配器个头不小,做得非常美,就像一块白色的鹅卵石。

未来已至?Rokid机器人不完全体验

适配器背面有四个胶垫,既能防滑又能防止划伤,用了几天有点脏了。背面还给出了一些基本信息,输出是15V/4A。使用过程中大概1小时充电25%,相比于2600mAh的电池,充电速度可是够慢的。

对了,Rokid底座的底面有一圈和这个相同材质的胶垫,防滑效果满分。

2.7 APP

第一次开机时Rokid就会提醒你下载Rokid的APP,然后通过Rokid顶部的摄像头来扫描手机里APP生成的二维码来实现手机和设备的绑定。

除了绑定设备,还有不少设定需要在APP端实现,也有不少设置需要APP才能实现。

未来已至?Rokid机器人不完全体验

这就是APP的主页,Rokid处在开机状态的话手机会自动连接Rokid,然后就可以通过APP控制Rokid了。

未来已至?Rokid机器人不完全体验

Rokid有四种音效,只能通过APP调节。“正常”和“甜美”的差别不太大,“蜡笔小新”低沉的声音和“机器人”的机械声音有时会听不清,总体看还是默认的“正常”最好用。

除了四种音效外,还可以自定义音质,不过LZ没在这方面做过多尝试。

未来已至?Rokid机器人不完全体验

在APP中,你可以查看当前是不是出于最新版本,需不需要给Rokid升级——不同于成熟的APP,还在成长期的Rokid需要你的每一次及时升级,一定能给你带来惊喜——不过联网时Rokid就会提示升级,APP这里更大的意义在于可以看到每次系统升级优化了哪些方面,实现了哪些功能,得知后可以第一时间去使用。

未来已至?Rokid机器人不完全体验

灯光的颜色和亮度可以在APP端调节,也可以直接对Rokid语音控制调节;屏保有四种主题,要变换主题或者待机时间,就只能通过APP了。

未来已至?Rokid机器人不完全体验

桃红色看着就很甜美。

未来已至?Rokid机器人不完全体验

LZ最常用的还是白色,比较耐看。

未来已至?Rokid机器人不完全体验

这个是时钟屏保,秒针(表盘左下)就像流星一样沿着圆圈缓缓划过。

连续无操作大概13秒(没错,反复计时后发现不是10s也不是15s)后,或者对Rokid说一声“没事了”,Rokid就会进入待机状态,投影也会投射屏保动画。Rokid共有四种屏保效果,分别是Fantasy、蓝色星空、水母和时钟,只能通过APP来更换。

下面就是这四种屏保的动图:

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

动图没看过瘾的,可以看这个一分钟的视频:

未来已至?Rokid机器人不完全体验

APP里还可以查看Rokid的使用说明,其他APP的应用将穿插在相关章节来介绍。

未来已至?Rokid机器人不完全体验

如果Rokid关机(长按开关机键关机,而非触摸顶部或者语音“关机”)的话,APP就无法连接设备,APP里的种种功能按钮也就消失了。

2.8 其他

未来已至?Rokid机器人不完全体验

Rokid头部的背面是“Rokid”的logo,印在一块圆形铝合金面板上,周边同样可以发光。

未来已至?Rokid机器人不完全体验

开关机键和电源插口在底座的后方。

需要说明的是,通过语音或者触摸摄像头区域只能让Rokid暂时休眠,如果要彻底关机,需要长按开关机键(再开启时也是长按这枚按键)。

未来已至?Rokid机器人不完全体验

最后附上Rokid配置表。前面介绍的摄像头、投影机和麦克风等硬件很吸引人,这里的亮度传感器、触控传感器、接近传感器、电子罗盘、陀螺仪等如此多的传感器也让人对Rokid的成长有所期待。

另外小吐槽一下:Exynos 5410是三星S4用过的CPU,略显陈旧,不知随着Rokid的功能升级会不会显现出疲态;2600mAh的锂电大概支持1.5h-2h的使用时间,也只能让你偶尔享受下无线的快感或者临时救急,电源线是万万离不了的;目前Rokid使用的是安卓4.4,不知以后能不能吃上棒棒糖甚至棉花糖。


3、差强人意的语音交互

Rokid没有键盘和鼠标,没有触摸屏,几乎所有的操作都是通过语音控制的——尽管还可以通过手机APP操作,但谁拿着智能手机还用笔呢(LZ不是在黑谁)。

先用一个20分钟的视频展示一下使用过程吧:

注:视频里Rokid的声音没做任何处理。

这个视频主要是对Rokid语音交互的一些测试,以及下一节要介绍到的内容的展示。

首先,你要唤醒Rokid。机器人不可能24小时待命,你需要让Rokid知道她要在什么时候听你说话。唤醒的方式很简单,只要喊“若琪”就可以了。Misa和整个团队在简化唤醒上面花了很大工夫,相比于“嘿,Siri”的三音节,“若琪”的两音节真的省了不少事。而当你跟Rokid连续对话时,后面就不用每句话都带着“若琪”了。譬如你问“若琪,今天天气怎么样?”,待Rokid回答之后,你免去“若琪”直接说“那后天呢?”,Rokid也可以顺利拾音、分析,并告知你后天的天气。Rokid这种理解上下文的能力,也让人机交流更加自然。

总的来说,Rokid语音识别很准确,特别是中文普通话和英文,基本都能准确识别,日常对话、点个歌或者其他内容还是没问题的(LZ不会方言没能测试)——这里举个例子,家里一岁半多的孩子说出的“若琪,关机”都可以让Rokid关机了未来已至?Rokid机器人不完全体验

另外,Rokid的拾音距离也很远,日常生活中五米之内问题都不大(当然环境噪音越大识别起来越困难)。比较安静时LZ从厨房对着客厅喊话,距离大概七八米,Rokid也可以准确识别。目前Rokid尚不具备远场识别的能力,不过据说正在研发当中?

平时Rokid放在电视柜上,电视里播放电视剧时的对话也不会有太多干扰,LZ实测过Rokid对于录制的人声干扰可以很好的排除

但是,对于环境中真实的人声,Rokid无法很好地区分开来。譬如如果LZ正在跟Rokid对话,一旁重复LZ说话的北鼻或者其他人的对话,会让Rokid一直拾音,然后大概是语音识别后语义不明,Rokid就没有任何回复或者作出个不相干的回复了。

另外对于一些“严肃”的问题,Rokid就显现出了能力不足的问题。譬如面对“地球的直径是多少”,Rokid的回答就是“心有多大,地球就有多大”这般插科打诨的回答。如果Rokid能像Siri那样,可以联合搜索引擎并利用起投影机来显示搜索信息,那将能满足更多需求。

既然是语音控制,那其中就包含语音识别(把输入的声音信号转化为文字)和语义识别(转化完后理解这些文字),也就是先要听见说什么,然后听懂说什么。听懂了之后,就需要对话管理系统做出反应,以及前两个过程的逆过程。在语义识别这方面,Rokid做得还真不赖,反应也很智能,特别是无聊时的侃大山未来已至?Rokid机器人不完全体验 。以下是一些平时没事调侃Rokid的,遇到有趣的就记下来了。Rokid对于相同的问题经常会有不同的答案,有时觉得回答比较有趣了会再问一下,又是另外一个有趣的回复(用“/”隔开了):

LZ:我明天穿长袖还是穿短袖啊?

Rokid:明天貌似不会很冷,穿个薄点的长袖吧。

LZ:我明天穿裙子可以吗?

Rokid:好尴尬,我对穿什么衣服没什么经验(然后显示明天的天气)

LZ:磊猴啊

Rokid:真喜欢你说话时这股浓浓的港式鱼蛋味

LZ:我难受

Rokid:肯定是心事太多了,跟我说说吧

LZ:猪肉炖粉条

Rokid:好吃吗?

LZ:(晚上十一点)今天天气怎么样?

Rokid:这个点你问我今天的天气,你逗我呢?!/大晚上的问我这个问题,我是不会告诉你今天是晴天的。(然后显示今天的天气)

LZ:你怎么这么漂亮啊?

Rokid:你羡慕不来的,我这是天生丽质难自弃

LZ:美国总统是谁?

Rokid:现在是奥巴马,未来就不知道了

LZ:锄禾日当午

Rokid:锄禾是谁,当午又是谁?

LZ:白日依山尽

Rokid:依山尽是谁,黄河又为何后入海流

LZ:床前明月光

Rokid:举头望太阳/地上鞋两双

LZ:挖掘机技术哪家强?

Rokid:中国山东找蓝翔

LZ:你冬天穿不穿秋裤啊?

Rokid:保暖裤和棉裤是用来干嘛的

LZ:你觉得苹果手机怎么样

Rokid:价格偏贵,但用的人也不少哦

LZ:我想吃苹果

Rokid:苹果是我的,西瓜也是我的

LZ:我得去买束玫瑰花

Rokid:现在去买玫瑰花应该能便宜点吧

LZ:启动自我毁灭程序

Rokid:再见(关机了)

LZ:你去自爆吧

Rokid:我觉得我的心凉飕飕的


4、丰富的资源库

通过Rokid,你可以收听音乐、广播、故事,你还可以向她咨询天气、日期、汇率等等,前一节的视频做了语音交互的演示,这一节通过图片和文字做一些详细介绍。

4.1 天气、时间、日期、闹钟

这些都是基础功能中的基础了,Rokid实现起来自然游刃有余。

未来已至?Rokid机器人不完全体验

你可以问Rokid今天的天气。

未来已至?Rokid机器人不完全体验

你可以问Rokid未来几天的天气,而如果你刚问了关于天气的问题,那么只需要问“未来一周呢?”,而省略“天气”这个关键词——这种对话对人类来说很容易理解,但对于机器人的语义识别,就远远比直接问“未来一周的天气”要困难多了,也足见Rokid的智能化程度。

未来已至?Rokid机器人不完全体验

询问时间这种事当然是小case了。

未来已至?Rokid机器人不完全体验

忘了日期也是常有的事,转身问下Rokid就好啦。

未来已至?Rokid机器人不完全体验

有些地区的人或者老人更在意阴历(农历),这事儿问Rokid,不光是几月几号,连今年的天干地支都知道了。

未来已至?Rokid机器人不完全体验

睡前跟Rokid说一声,明天/一周/工作日的闹钟就都定好啦。

未来已至?Rokid机器人不完全体验

起床时间有变?跟Rokid说一声就能取消/更改。

4.2 音乐

Rokid接入的是虾米音乐,如果你想听某首歌,只需要对Rokid说“我想听XXX”或者“播放XXX”。

一段时间使用下来,音乐是LZ使用频率最高的应用了。

未来已至?Rokid机器人不完全体验

例如对Rokid说了歌名,投影机会投射出歌名、歌手和专辑图片(如果有的话)。

未来已至?Rokid机器人不完全体验

短暂显示歌曲信息后,投影机会开始投射所谓的“星·情”,确实挺美的。

歌曲播放过程中你可以让Rokid收藏/取消收藏、播放下/前一首、音量大/小一点、亮/暗一点,或者直接喊一声“若琪”,就会暂时退出播放。总之这期间你可以下达任何,不仅是歌曲,其他内容也是一样。

至于Rokid的音响,前面已经介绍了参数,值友可以看下面这个视频感受下:

相机录制视频的采音效果比较捉急,视频中效果欠佳。LZ平时用罗技的UE boom mini,对比之下感觉Rokid的音响效果非常好——首先360°音响可以营造出表现力很强的音场,特别是在十几二十来平米的小空间中央放一个Rokid;低频有力,中高频也不乏力,解析力中规中矩——怪不得众测页面的标题会定位于“音乐机器人”,这5000块的定价,恐怕音响部分会占去不少成本。总之,如果你喜欢听音乐,经常听中英文歌曲,想躺在沙发上或者洗着菜时随时“起music”,Rokid满足你绰绰有余。

对于LZ来说有点麻烦的是,用“若琪”让Rokid退出播放后,如果几秒钟没有其他指令,或者只是进行了一些平常对话之后,会继续回到之前的(LZ已经想终止了的)音乐播放,这时候需要特别说一下“停止播放”来彻底终止。

关于歌曲库,点播中英文歌曲没问题,这主要是因为Rokid对中英文优秀的语音识别能力和曲库的完备,而且也很智能。譬如说“播放《天空》”,Rokid会播放天空的《记住我的心》;而如果说“播放王菲的《天空》”,就会播放LZ想听的王菲的《天空》——但是,对于喜欢ACG的LZ来说,点起歌来就有点捉襟见肘了。譬如LZ让Rokid“播放《新世纪福音战士》的主题曲”,然后Rokid播放了杨千嬅的《新世纪福音战士》,还是粤语歌。什么?你没听说过这首歌,LZ也是第一次听到好嘛,整个人都斯巴达了未来已至?Rokid机器人不完全体验

前一节的视频中也显示了点日文歌曲时经常是答非所问,幸好Rokid每两周就会进行一次系统更新,而最新的一次更新中,终于有了蓝牙功能。不过在使用蓝牙的过程中还是遇到了种种问题,在第一天发现更新了蓝牙之后,就用手机尝试了连接:

未来已至?Rokid机器人不完全体验

确实成功连接蓝牙了,也成功播放了手机里的歌曲,但是播放过程持续卡顿,完全没法听,而且语音控制Rokid停止播放后再播放其他内容(譬如绘本),蓝牙播放无法停止,Rokid还是会同时播放两个内容。第二天又尝试了用iPad蓝牙连接,刚开始连接成功后顺利播放,但断开后再连接又出现了问题,也再没进行其他测试,可以查看下面这个测试过程的视频:

正如蓝牙的名称“ROKID-TEST233”,蓝牙功能尚在测试阶段,静候更新吧233。

4.3 “听书”“故事”和“绘本故事”

通过APP首页的“内容”,你想听的资源都能找得到。

未来已至?Rokid机器人不完全体验

“内容”一栏有两级菜单,第一级菜单(左上图)里把内容分了“听书”“故事”和“绘本故事”;第二级菜单(右上图及下面两张图)里则是各自类别庞大的内容库。

有多庞大?

“听书”的类别下有21个标签分类,包括:资讯、情感生活、相声评书、教育培训、百家讲坛、广播剧、戏曲、电台、IT科技、校园、汽车、旅游、电影、游戏、有声书、综艺娱乐、外语、儿童、健康养生、商业财经、历史人文。

“故事”的类别下有7个标签分类,包括:热门故事、睡前故事、儿歌、故事集、成语故事、童话故事、英文故事。

“绘本故事”的类别下有9个标签分类,包括:奇妙科学、心灵成长、英文专栏、亲近自然、异想天开、探险奇遇、认识世界、爱的魔力、艺术启迪。

每一个标签分类下面,都还有几十个甚至上百个专辑,可以充分满足家中所有人的需求——特别是孩子的,不仅三个大类中两个是给他们准备的(故事和绘本故事),甚至“听书”的“儿童”下面也有有多达232个专辑——看来以后可以少买很多儿童类图书了。

下面是使用视频,很简单,只要对Rokid说“若琪,我要听XXXX”就可以了:

唯一要注意的是,“XXXX”必须是那个专辑的准确名称。譬如如果你想听“听书-资讯-克强时刻”,对着Rokid说“我想听‘克强时刻’”就可以了,而视频中我说成了“我想听‘克强时间’”就不可以。

未来已至?Rokid机器人不完全体验

所以面对Rokid偌大的内容库,最初上手时APP还是挺重要的,毕竟你不可能知道而且记得住Rokid可以播放的所有内容的名称。你只需要在APP点击该专辑,就可以播放、停止或者调节音量。等熟悉了常听的专辑名时,就可以轻松地单靠语音随时听到想听的内容了。

未来已至?Rokid机器人不完全体验

翻看时竟然在绘本里找到了《我讨厌妈妈》,这可是在家里被LP封印了的绘本未来已至?Rokid机器人不完全体验

当然,现在毁眼睛的手机、平板、电视、早教机什么的太多了,用Rokid给孩子讲绘本时也要注意Rokid亮度不要太高房间明亮使用距离足够远不要让小孩用太久

4.4 游戏和广播

Rokid还可以玩flappy bird,你只需要对Rokid说“我要玩小鸟”(Rokid的开发团队,你们需要去污粉了未来已至?Rokid机器人不完全体验),投影机就会投射flappy bird的画面,而你只需要触碰Rokid两边的触摸区域就可以操控——这么变态的游戏,加上灵敏度不太高的触摸操作,LZ至今还没实现0分的突破,不过北鼻倒是炒鸡爱玩,看到Rokid就喊着“若琪,小鸟小鸟!”未来已至?Rokid机器人不完全体验

另外,Rokid还可以收听广播,包括当地的广播已经国家广播,可以直接通过频段点播,或者通过Rokid左右两边的触控区域来调台。

这两个应用在前面的视频中都有展示,不再赘述。

4.5 其他

iOS 10已经把Siri开放给了第三方开发者,现在用户已经可以让Siri实现更多的功能,譬如叫车、订餐。Siri在变得越来越强大,但即使是这样的Siri也还是处在一个若有若无的位置(周围很多苹果手机用户甚至从来没用过Siri)。

而Rokid作为主要通过语音来交互的智能设备,语音交互和联通其他应用的能力就更是要成为“成长”的重点。通过语音来输入,通过投影机来显示,期待Rokid早日连通打车、订餐等更多生活应用。


5、Rock Your Home——联结智能家居

5.1 语音操控智能家居

上周的原创话题之一就是#智能家居#,看了几个参加话题的原创,唯一的感觉就是——强行智能。LZ绝对没有贬义,只是目前家居产品的智能化程度还很低,基本都以手机操控为中心。很多所谓的智能还不及动动手指头来得直接便捷,或者只不过是安放工具,并不算真正意义上的“智能”,因而我们能实现的智能化程度也就很低。

Rokid的卖点之一、也是申请众测时吸引LZ的地方之一,就是Rokid可以跟智能家居联动——通过和Rokid语音对话,实现直接控制智能设备的目的。

未来已至?Rokid机器人不完全体验

目前Rokid可以联动的智能家居品牌包括飞利浦(Hue)、Lifesmart(灯、灯带、窗帘、空气净化器、入墙开关、插座)和Broadlink(SP、SP mini),括号里是这些品牌里支持和Rokid联动的产品——嗯,目前支持的就这么多了,据客服说Rokid正在跟小米谈,总之最大的问题还是支持的智能设备不够多。

你可以直接对Rokid说“搜索智能设备”,然后Rokid会搜索在同一个WiFi下支持的智能设备。

未来已至?Rokid机器人不完全体验

APP端可以看到Rokid连接了哪些智能设备。除了直接对Rokid语音控制外,也可以通过APP来远程控制。

未来已至?Rokid机器人不完全体验

LZ没有Lifesmart和飞利浦的智能设备,只有两个Broadlink的插座,和Broadlink的联动过程非常简单:首先,你要在APP端对智能设备命名,好让Rokid“认识”这个插座,譬如LZ把旁边这个插座命名为“地灯”;然后,把地灯接在插座上,地灯保持开启状态;这样,你只需要对Rokid说“打开地灯”或者“关掉地灯”来控制,而不需要拨动地灯的开关,也不需要操作手机的APP。

开灯关灯什么的也没太多必要演示,大家可以看看Misa在优酷po的两个视频,包括开关灯、开窗、开电扇、开空调等:

5.2 联动命令

而在APP端,你还可以自定义Rokid对语音命令的联动执行,下面是两个例子:

未来已至?Rokid机器人不完全体验

第一个联动是睡前,想在对Rokid说晚安后让她先关闭床头灯,然后自己关机,每个命令都有3秒的执行间隙;第二个联动是回家后,希望对Rokid说了“我回来啦”之后,她能自动播放收藏的歌曲。下面是视频演示:

当然这两个只是简单的例子,你可以在指令列表里添加一长串的指令,这样只需要一个命令就可以得到一大串的反馈,譬如:你进门说一句“我回来了”,Rokid就打开地灯,自动播放收藏的歌曲,打开空调,关闭窗帘……

但是,你的家电要么需要是机械开关的(几乎绝迹),要么需要出厂就植入了智能芯片(很少)——所以这个想法很好,Rokid本身的设计也没问题,唯一的问题就是,没有足够多的智能设备去方便地利用。

Broadlink、Lifesmart、小米等品牌都有自己的一套智能家居产品,但相互之间又不能互通,这给消费者的自由选择和搭配使用带来了很大的不便。如果智能家居产品不能有一个统一的平台和标准,而通过Rokid能把他们都联动起来,那将会是Rokid的一大卖点。

未来已至?Rokid机器人不完全体验

ps:对于一些比较长的指令,特别是包含长英文的指令,设定个比较短的指令就很好用了,新技能get√。


6、研发中的一些功能

6.1 封印中的眼睛——关于人脸识别

譬如闻名于《最强大脑》的人脸识别机器人水哥王昱珩跟人脸识别机器人的对战:

深度解密:人机大战——网红脸识别 深度解密:人机大战——网红脸识别 鬼才之眼王昱珩 VS 人脸识别机器人 tech.163.com

又譬如最近的热闻:

大学老师发明“看脸色神器” 大学老师发明“看脸色神器” 基于深度学习的课堂行为分析模型 news.qq.com

跟水哥对战的机器人以1:2落败,而大学教师的基于深度学习的课堂行为分析模型目前也只有“happy(高兴)”和“neutral(一般)”两种表情设定(另外判别准确度也未可知),这都说明了目前人脸识别技术还有非常大的优化空间。

目前Rokid的摄像头并没有被利用起来,未来将能实现视频通话的功能。当然目前更没有人脸识别的能力,但既然团队都放出话来了,LZ自然也很期待Rokid未来的优化。

6.2 封印过半的耳朵——关于语音识别和声纹识

语音识别和声纹识别的相同点都是分析和处理采集到的语音信号;而两者又有巨大的不同:声纹识别的目的是识别语音来源的身份,因此技术重点在于从语音信号中提取个人声纹特征;而语音识别的目的是识别语音的内容,更注重于提取语音来源中的语义。

一句话,语音识别是为了听出说话的内容,声纹识别是为了听出是谁说的话

声纹识别

iPhone将指纹识别推广给了世人,深入到了每个人的日常生活;三星Note 7也开启了大厂的虹膜识别的道路。

声纹识别,区别于虹膜、指纹等其他生物识别技术,有着天然的优势:使用方便,不需要到达特定的位置或者进行特定的操作。同时,声纹识别也有很多需要解决的问题:声音来源会受到身体状况、语气等影响而有轻微变化,声音采集设备精度的要求,以及包括其他人声等环境噪音的干扰。因此,声纹识别的应用环境最好是在一个相对安静的环境,避免过多干扰,这样来看家庭、学校等就是很合适的场景了。而Rokid正是定位于家庭,很适合使用声纹识别技术。

但是,Rokid目前并没有声纹识别的能力,本段讨论结束未来已至?Rokid机器人不完全体验

语音识别

准确率:从测试视频可以看出,Rokid的语音识别在安静环境、单一声源下,识别准确率很高。只是有时候说话太快或者用词不标准,会让Rokid有点莫名其妙。当然,你需要说普通话。

反馈时间:在语音控制的对话中,通常会把命令控制在一句话、几个字里,所以Rokid准确拾音后,反馈的速度很快

音源消除:Rokid自身有这样一种机制,譬如如果Rokid正在用很大的音量播放音乐,你并不需要用盖过音乐声音的嗓门儿去对着Rokid喊,而只是需要比平时稍大一点的声音去命令即可——嗯,还是要稍微大一点。

前面提到了,在日常嘈杂环境中,特别是有多人同时说话(特别是干扰声音来自真人说话而非来源于电视),Rokid会一直拾音到所有人说话间断,然后混乱到没有回应,或是反馈一个无意义的回应。而如果Rokid具备声纹识别的能力,就可以从“若琪,……”之后Rokid只识别并录入这个人的命令,从而避免引起拾音混乱。

6.3 深度学习

可能是LZ对Rokid的宣传有什么误解,看到“基于深度学习,Rokid为家庭量身制定音乐、新闻等内容服务,进行智能化推送,让家庭生活更加高效且充满乐趣”的宣传语时,误以为Rokid可以逐渐“记住”使用者的喜爱和偏好。

譬如很多音乐APP都可以实现的“猜你喜欢”,LZ本以为Rokid可以做到使用一段时间之后,再对她说“我要听歌”,就可以根据播放历史曲目或者收藏曲目来做推荐,直接播放使用者有很大概率会喜欢听的歌曲——然而,并不能。LZ每天都会用Rokid播放音乐,而在众测报告截止的最后一天对Rokid说了“我要听歌”之后,播放的还是LZ绝对不会想听的歌曲,连切了五首歌结果也是一样。

最基本的,LZ想像Siri那样告诉Rokid LZ是谁、以后怎么称呼,然而Rokid也并不能做到这一点。于是LZ关于“深度学习”咨询了Rokid客服,得到的回复是,“如果你问了Rokid一个问题,她说不知道,那么过几天你再问,她可能就回答上来了,这个就是Rokid的深度学习”。

未来已至?Rokid机器人不完全体验

LZ当时真的是“只要微笑就好了吧”的表情,客服这答复怎么有点人工加入对话脚本的意思。


7、结语

未来已至?Rokid机器人不完全体验

正如LZ在众测页面的回复的一样,这个机器人值得评测的地方也太多太多了未来已至?Rokid机器人不完全体验。Rokid的优点和不足都很多而且很明显,下面总结下使用感受——

优点

1、外形美翻了。不管是开机时美轮美奂的显示效果,还是关机时的静若处子,Rokid都是一个绝佳的装饰品。

2、音响效果出众。不亏是众测的“音乐机器人”。

3、交互方式简单,0学习成本

4、语音指令响应速度快、识别能力出众。

5、内容库丰富,能满足全家人的需求。

不足

1、两侧触控区域不太容易操作,不管是调节音量和亮度,还是玩Flappy bird,以至于LZ从来都是用语音来调节音量和亮度。

2、CPU陈旧。

3、不能很好排除真实人声的干扰。

4、待机时间短。大概是因为Rokid定位于家庭机器人,所以待机方面没做太多考虑。其实别的都还好,毕竟在家使用会一直插着电源,只是偶尔听音乐时想把Rokid放在客厅中间,让360°发声的发烧级音箱发挥一下,拖根线就不是很方便了。

5、部分尚在研发中的功能体验不佳(譬如蓝牙),app端的部分控制也会偶有失灵,还需要不少优化工作。

6、联动智能家居表现有待改善。当然这个锅不能都让Rokid背,主要是智能家居产品太少了,而Rokid也在不断扩展可以联动的产品范围。

7、声纹识别、人脸识别、远场识别、深度学习、开放SDK连通更多应用……其实这不能算是不足了,只是目前这样一个消费级产品的出现还有些费力。当初LZ就对Rokid的广告持怀疑态度,不过本着对创始人的信心还是抱有信心,相信Rokid这个还是kid的Robot一定会继续成长——这也是标题“不完全”的由来,因为Rokid本身还不能算完成品。

大概还是有人会吐槽售价,但是这配置、这功能,真的值回票价了。

建议

1、建立一个官方微信群或者QQ群对于还在研发阶段的Rokid,用户几乎每天都能发现大大小小的问题,每个问题都打电话既不便于用户反馈,也不便于开发者收集信息。而有这样一个交流平台之后,用户不仅能迅速反馈遇到的问题,还能相互交流使用心得,给出未来研发方向的建议,而Rokid开发人员也可以从中迅速发现和解决问题,还可以收集用户使用感受方面的信息。

2、以后能有硬件更换机制。目前的配置能不能应对Rokid的成长?如果说有的硬件还是应对起来“吃不吃力”的问题,那有的硬件就是“能不能”的问题了。希望开发团队在开发新技能的同时,可以考虑老用户的升级问题——因为现在太多功能还在开发当中,甚至有很多技术在科研领域都尚未完善,而Rokid的CPU、安卓4.4都让人有些担忧,如果仅靠升级系统无法做到功能的升级,硬件能力不足以支撑或者不能支持新的功能,那是不是可以有偿提供兼容的替换配件或者提供寄修服务。

3、恰当方式的宣传LZ搜索Rokid的信息时,除了新X的一个众测有几个用户的众测报告外,就只有几个门户网站的新闻介绍,甚至有些信息还是在X乎找到的;而视频信息,最多的也就是优酷上Misa的自频道发布的视频了,而且都是AV画质的测试性视频,对消费者的吸引力负分。如果Rokid还准备开启新一轮的销售,如果数量还是只有几百台,那卖出去恐怕不是问题。但如果Rokid想做成一个成功的话题性产品,那么吸引眼球的营销还是必须的。

这两个软银机器人Pepper的广告,一个借用了偶像(堺叔)的光环,一个利用生活化的场景很容易引起观众共情,都让人看过之后对Pepper念念不忘,会想去和其他人聊Pepper的功能和特性,让这个产品深深地扎根在观看过的人的脑海里。

4、比以上更重要的是,种种既定“黑科技”的实现。


8、后话

开头Misa的《人和机器的边界》的主要观点,就是人和机器的边界已经没有那么清晰了。这一点表现最明显的就是我们对手机的依赖,Siri、Echo等语音助手在不断蜕变,智能家居慢慢地普及开来……

Misa在presentation还提到了另外一个问题,当前科技的边界。他认为科技产品的步子不能太大,要探索当前科技发展的边界,然后在这个边界附近来做。Rokid所描绘的声纹识别、人脸识别、远场识别、深度学习、联动智能家居……都很美好,但是每一样都触及到了当前科技的边界,集如此多难点于一身的产品很炫酷、很超越时代,做起来也无比艰辛。希望Rokid团队能义无反顾地把Rokid做好,并作出更好的产品——他们需要技术,更需要大量时间和资金的投入。

最近一两年来,家庭陪护机器人产品就像雨后春笋般冒出来,而苹果、谷歌、微软、亚马逊、百度等大公司也都投入了大量人力、财力来进行相关技术和产品的研发,譬如亚马逊刚刚推出了二代Echo Dot,谷歌未来将推出的Google Home,越来越多的消费级家庭机器人(如果这些都算机器人的话)正在向我们走来。

未来已至?Rokid机器人不完全体验

正如Pepper那则宣传片结尾传达的信息“SFじゃない”,曾经出现在我们文学、电影等SF作品中的机器人,将不再只是存在于SF。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多