在上一篇文章“当我们讨论智能家居时,不要忘记机器人”中,我提到了拟人化的人工智能可能成为智能家庭的中心设备。那么问题来了,人机交互只能依靠语音命令吗?那机器与环境的交互呢? 在2013年秋季英特尔信息技术峰会(Intel Developer Forum,IDF)。英特尔带来了很多给予英特尔芯片的产品,其中非常引入瞩目的,就是这个原型来自瓦力的机器人,她的名字就是瓦力(Walle)。瓦力最重要的功能是:一、跟人打招呼;二、跟人握手;三、英特尔在机器人腹部放了一个屏幕,让人们可以看到机器人是如何“看到”或者说感知世界的。 看看“瓦力”那萌萌的大眼睛!这简直就是皮克斯送给人类最好的礼物。但很抱歉,从技术的角度来说,这两炯炯有神的眼球只是装饰品。机器人胸口的微软 Kinect 1才是所谓的“眼睛”和“耳朵”。机器人通过Kinect来获取图像和深度信息,以此完成从识别人到打招呼、握手的环节。因为Kinect也配备了高清麦克风,所以顺带把“听”也解决了。加之Kinect本身具备一定的运算能力,也起到了部分大脑的作用。 明白了吧?瓦力是通过深度摄像头,来获取真实世界的信息,并将其转化成虚拟世界所需要的数据,然后加以处理的。目前有个时髦词汇来形容这一整个过程,叫“机器感知”,或许马上这词就会跟“云”一样连老大妈都能说了。总之,你可以这么理解,深度摄像头就是下一代“电脑”比如机器人最重要的器官,这个器官将承担新一代人机交互的重任——从人与手机,到人与机器人。 我上一篇文章介绍了蛛型机器人吧,那小家伙身上也背着一个摄像头是来自华硕的 Xtion 。跟 Kinect 1可说是同父异母的关系,其核心技术都来自于一个父亲的DNA—— Primesense ,一家长期致力于将深度摄像头民用的公司。Primesense不是深度摄像头的始祖,但这场新人机交互革命,却是这么打响第一枪的,在 Primesense 的背后,是无数的巨头在为其举着火把。简单来说, Primesense解决了很多数学算法问题,帮助他们能够设计出来足以快速处理深度信息的芯片,这些芯片被授权给硬件厂商生产,这就是深度摄像头的核心组件。通俗的比喻,就是图像图形界的英特尔。 Primesense 成立于2005年,在2006年对外宣布完成了3D感应芯片的研发,在当年的 E3 大展上与微软建立了联系,并催化出代号为 Project Natal 的神秘项目。等到 2009 年 E3 大展时,微软发布了获得PrimeSense 芯片授权的 Kinect 1。于此同时获得 Primesense 授权的也包括华硕,这就是 的由来。不过传说微软因收购 Primesense 的失败,在 Kinect 2时放弃了Primesense 。最终在2013年11月25日,苹果最终3.6亿完成了对 Primesense 的收购。 看到了吗?从微软、英特尔再到华硕,最终是苹果,在计算机业界里数的来的巨头,都跟这家年纪尚轻的公司产生了联系。最早爆料苹果要收购 Primesense 的以色列媒体 Calcalist 是如此描述苹果的意图:苹果通过对 PrimeSense 的收购,从而在室内娱乐领域获得了关键性的技术。 在此之后,无数媒体都在预测苹果将在客厅这个战场上与微软、索尼掰掰手腕,从新一代AppleTV再到iTV。不过收购至今将满1年,苹果看起来在这方面没有任何消息,多少是让人有点失望的。不过细想下也符合苹果的作风:秘密开发然后一鸣惊人。 你要认为业界会因 Primesense 的销声匿迹就平淡,那你就错了。其实从 Primesense 被收购开始,才正式拉开了新人机交互战争的序幕,曾经在触屏或键鼠时代的不少巨头,都在此后快速入场布局。因为 PrimeSense 被苹果收购,其对外授权的技术将会在 2015 年终止,所以那些使用了 PrimeSense 技术的厂商们不得不寻找替代方案。很多人是看到了赚钱的新方式,比如很多国内的新兴公司,比如小米。有些则是看到了颠覆的点,希望能够扳回在手机时代的败局,比如英特尔。还有些则是害怕被颠覆,比如苹果。 来自中国的公司,有些名字你也许还不熟悉,不过他们或许是下一个世代的巨星。接下来,我将分国内和国外两个部分,来解析巨头们或者准巨头们的布局: 国内创业公司:
国外的计算机视觉首先要谈的肯定是大名鼎鼎的微软Kinect,但是他们深度摄像头的核心技术还是来自于授权, Kinect 1 是来自Primesense, Kinect 2来自 Canesta 。微软长期以来的目标,是将深度摄像头应用在游戏场景下。不过有两件事,让笔者可以肯定微软会开始对 Kinect 进行小型化,并应用在新的场景里。 首先,随着机器人视觉的再次兴起,微软在此前 IROS2014 chicago 上推出的开源机器人,工程图标注的是启用了 Kinect 的核心传感器;其次,回想下比尔-盖茨同学在2007年那次 D5峰会上第一次谈及3D感应器,实际上那个点他们已经和Primesense 取得了合作,所以盖茨会说他们已经有货了。那次 D5 峰会上盖茨所谈及的愿景是无处不在的摄像头,希望人们走到哪里,都有一个操作系统;无论是走到哪都能通过 Kinect 操作的设备,还是走到哪都能跟到哪的机器人,确实符合这样的想法。Windows 10的目标又是要做物联网的枢纽从而无处不在,那么 Kinect 或者其他名字但实现更强大功能的“器官”也会需要部署到无处不在吧。 可以这么总结,微软摆脱 Primesense 后做出的 Kinect 2相比Kinect 1是飞跃性的革新产品,在一定时间内,微软在这个领域会保持其技术优势。除了微软之外,在这一领域的大公司和国外的创业公司还有:
如果有机会,笔者应该将 Primesense 、 Pebbles Interfaces 和 softkinectic 这样来自以色列的亲身父亲做个详细的介绍。不过在这里省略也是有意为之,因为实际上这些公司的研发是非常消耗金钱,这就是为何 Primesense 在发展的风生水起的时候,却在2012年将公司员工从190人砍至50人的原因。失去微软支援的他们,实际上是失去了源源不断的财源,而哥斯拉级别的微软却有能力另立门户,直接用钱烧出一台 Kinect 2。 需要大量的金钱去完成研发,这就是深度摄像头在上游的现实。这也是为何只有微软、苹果、谷歌才能称得上真正的玩家,而 Leap Motion 这样的厂商往往后继无力。 Pebbles Interfaces 则是直接来到中国完成的融资,站在他们身后的是小米这样的新巨头为其输送炮弹。 也许超级巨头的入场,预示着下一代人机交互的到来,但新巨头的集体布局,也预示着这个行业在硬件端门槛之高。那么捉摸着在这个领域创业的人们,他们可以做什么呢? 做智能家居、家庭机器人的,可以向以上公司采购设备,对交互要求不高的可以选用国内公司的方案。以前做互联网做APP的公司,不如跟笔者一样,老老实实做应用。不过在新人机交互下的应用,对于每个应用场景的理解将上升几个层级的要求,甚至开发者们还要读懂更多平台传输来的数据。 因为在这个即将无处不在传感器的时代,我们将在真实世界里廉价的捕捉到大量数据,读懂这些数据,才能从虚拟世界获得更多的帮助。 海盗们,准备好迎接这场革命了吗? 本文作者黎明明,运动行联合创始人,看台 FM 主播。长期接触智能硬件和体感领域产品。邮箱:limingming@bifenpai.com 微信:paulaugust |
|
来自: schumann66 > 《智能硬件》