【编者按】本文作者黄通兵,七鑫易维CEO。对机器视觉和人工智能领域技术有深入研究。来,一起看看青年才俊背后的关于“读懂眼神意识”的那些技术。 近日整个科技圈都被云视链霸了屏,又是一个青年才俊创业的励志故事,22岁就拥有哈佛大学高材生、创业公司CEO、6亿估值、福布斯创业榜单最年轻创业者等诸多光环,而透过这些光环我们该看一看云视链是否真的有看起来那么cool。 看看媒体是怎么说的吧: 抛开用户在观看视频过程中是否愿意那么多的互动(广告)不说,今天主要探讨一下,一听就觉得吊炸天的通过捕捉眼球信息来实现观众情绪和思维在视频中的实时反馈互动。 作为眼球追踪行业的从业者,我的分析可能让很多刚刚有点兴奋的读者失望了,从报道中所提到的云视链的技术来看,通过普通家用摄像头捕捉人眼注视点可是没那么容易实现的! 1、技术现状目前在世界范围内眼球追踪技术的实现主要是通过眼电图法、巩膜接触镜法、眼图录像法、角膜反射法。
眼电图法在40年前就已经广泛应用,至今仍有部分领域使用此法测量。
以上两种方法普及性太差,对于普通用户来说根本无法实现。
根据云视频的宣传,其所提到的能够读懂人“眼神意识”的视频技术,就是基于此项技术,也就是眼图录像法。 手机是像化妆品还是像QQ?然而虹膜识别+瞳孔运动识别虽然可以捕捉人眼的动作,但是却无法检测到人眼的注视点,这才是最大的硬伤! 首先,虹膜识别和瞳孔识别都是基于一个平面的,要测量注视点就必须保证头部是固定的,让眼睛同头部和注视点的相对位置一致才可以。人眼作为人体最精细的器官之一,注视点转移仅需要一个微小的动作,而人类仅仅因为呼吸而造成的头部动作就足以让测量误差造成定位偏移。 然后我们再退一万步讲,即使的头部是固定的,对于虹膜的识别也没那么容易,欧洲人的人眼特征较为明显,识别相对容易,但也不是一个家用普通摄像头就可以判断眼球特征的,而亚洲人瞳孔多为深褐色,人眼特征较弱,普通摄像头几乎无法捕捉。
那么,云视链的视频与观众眼神关注点的实时反馈也是根本无法实现的吗?其实并非如此。 刚也已经提到,云视链以虹膜识别+瞳孔运动识别为出发点的,就是这个起点让他们走错了路。不知道有没有细心的读者注意到,其实眼球追踪技术的实现还有一种方法我没有说?那就是角膜反射法。接下来就介绍一下这种可以通过普通摄像头即可捕捉人眼注视点的方法,搬好板凳,买好瓜子。
眼球的特殊构造会形成一到多个浦肯野像,基于这种方法的眼球追踪一般定位第一浦肯野像,通过定标步骤,可以测量出在垂直平面现实定标点表面上人眼的注视点。 (编者注:浦肯野像,是光源,例如近红外光源,在人眼球光学结构中形成的一系列虚像。浦肯野现象,亦称浦肯野效应。指在不同的适应状态下对有色光的视觉灵敏度不同的现象。在明适应时对红色和橙色看起来较亮,而在暗适应时则对蓝色光看起来较亮。) 来张示意图看看: 为了从头部运动中区分眼球动作,需要眼球上的两个参考点。这种瞳孔中心与角膜反射之间的位置差异之随眼球转动而变化,同轻微的头部运动相对恒定,不管瞳孔在眼眶中如何转动,浦肯野像同眼球相对固定。目前我在七鑫易维了解到的眼球追踪算法,已经做到了头部的正常动作不影响注视点的判断,并且采用红外弱光进行弥补了亚洲人人眼特征不明显的问题,可以很精准地捕捉到人眼的注视点。可以说,这样的技术已经不是问题。 根据大脑——眼睛一致性假设,人们所看的一般是其大脑中正在处理的内容,这是人类视觉系统的工作方式。基于这个假设,采用眼动跟踪技术来研究人类心理已有近百年的历史。在人机交互过程中,注视等同于注意力。 所以说云视链的“读眼神”完全可以实现,但是路径要正确。 以“眼神推荐系统”为例。 首先,根据角膜反射技术及相关算法,完全可以捕获到用户的注视点。接下来,可以对用户的注视目标进行模式识别(例如,识别出他注视的形状是一个红色的女士手提包)。进而可以根据用户的浏览记录提取一些框架信息,比如,用户看的都是红色、细带的手提包,并且注视点经常停留在包的发行时间上,可以推断这个用户目前就是想买一个红色的细带手提包,而且很关注它是不是新上市的潮流产品;可以通过分析瞳孔直径的变化,推断用户的情绪。 |
|
来自: 昵称71360118 > 《待分类》