分享

为计算机注入情感的科学家

 大科技杂志社 2023-04-14 发布于海南

在很多科幻电影中,我们会看到这样的故事——某一天,机器人不再是冷冰冰的人形机器,而是像人类一样拥有自己的情感,它们理解了人们的喜怒哀乐,成为了人们的恋人、挚友和生活伴侣。或许,电影中的美好场景距离现实并不遥远。拉娜·卡鲁比——一位致力于为计算机注入情感的埃及裔女科学家,让这一切有了可能。

  孤独中想出新课题

  1978年,卡鲁比出生在埃及开罗,她的父母都是从事科技产业的技术人员,在家庭的熏陶下,卡鲁比在很小的时候就感受到了科技的魅力。2000年,刚刚毕业于开罗美国大学的卡鲁比已经是一名年轻的计算机科学家了,她结了婚,有了稳定的工作,过上了多数埃及女性所向往的幸福生活。

拉娜·卡鲁比——一位致力于为计算机注入情感的埃及裔女科学家

  然而,自身的职业追求以及对科技的热爱促使卡鲁比渴望继续深造,在接到了英国剑桥大学的博士录取通知书后,卡鲁比做了一件对于任何穆斯林新婚妻子来说都极不寻常的事情:她离开了自己的丈夫,独自收拾行李搬到了英国。在离家数千里之外的剑桥大学,卡鲁比投身于计算机科学研究,她渐渐意识到,自己与笔记本电脑相处的时间要远远多于自己与其他人相处的时间。不过,尽管卡鲁比和笔记本电脑如此亲密,笔记本电脑却对她的感受毫无所知——它根本不知道卡鲁比是否快乐,是否感受到压力或者是否对人生感到困惑,这使得本已思念家庭的卡鲁比觉得更加孤独。

  于是,这位女科学家想到,如今人类的计算机已经具有很多认知智能,但却忽略了情感智能,那么计算机即使再“聪明”,也很难更贴心地为人服务。反过来,如果计算机技术可以识别人的情绪,并根据人的感受做出相应的反应——就像一位情商很高的朋友所做的那样,那么这种技术又将如何改变世界呢?

  计算机如何识别情感?

  带着这样的新课题,卡鲁比来到了美国麻省理工学院任职,她组建自己的团队,开始深入研究能让计算机识别情感的技术。

  在卡鲁比看来,人与人大部分的情绪交流都是通过语言和文字之外的各种暗示来传达的,比如面部表情、语调和肢体动作。但是,人们使用的智能手机、计算机等智能设备,往往不会识别这些信号。所以,卡鲁比将这些情绪信号的识别问题作为研究的突破口,她首先想到了计算机的面部表情的识别。

  人脸的面部表情是人们交流情绪的最强大的渠道,无论兴奋、倦怠、同情,还是惊讶、享受、愤怒,这些丰富的情绪都可以通过面部肌肉的运动来表现。然而,教会计算机读懂这些面部情绪是很难的,因为面部肌肉运动的速度非常快、非常微妙。举一个简单的例子,微笑、假笑和苦笑,它们的面部动作看起来有些相似——唇角都要上扬,但表达的情绪完全不同。微笑是积极的,假笑和苦笑往往是消极的,能够表达虚伪、无奈、讽刺等多种情绪。

  如何让计算机能够分辨那些细致入微的面部表情和情绪呢?卡鲁比设想的技术应该分为三步。

  第一步,计算机通过分析,将人的面部肌肉运动细化为各种动作单元,并将这些动作单元进行数字化编码。比如,唇角上扬定为一个动作单元并编码,它是笑的主要构成,眉间皱纹定为一个动作单元并编码,它是一个非常强的负面情绪指示器——当你将眉毛拧到一起的时候就出现这些纹理和皱纹。

  第二步,由于不同的面部动作单元可以组合成不同的面部表情,在完成了对动作单元编码的基础上,计算机进而可以对人脸不同的面部表情进行数字化编码。只要编码足够细致,计算机就可以区分微笑、假笑和苦笑了。

  最后一步,计算机需要将数字化编码的表情与人的语调以及各种微妙情绪对应起来——这需要计算机利用视觉、语音识别和深度学习等技术,对人们的表情、语音表达进行分析和归类。

  广阔的应用前景

  2009年,卡鲁比在麻省理工学院团队的基础上创立了一家名为“Affectiva”的公司,努力将心中的技术商业化。

  卡鲁比设想的技术都建立在占有了充足信息的基础之上。为此,“Affectiva”从全世界80多个国家的600多万部视频中收集了数据,同时,也得到了视频中的人们所分享的自己的情感。这帮助“Affectiva”建立了世界上最大的情感数据库。如今,这个数据库已经拥有500多亿个情感数据点,它每天都在增长。通过海量的数据和深度学习,计算机就可以通过人们的面部表情和语调来量化和识别人们的情感,其准确性也在稳定地提升。

  通过不断收集信息和改进算法,“Affectiva”已经推出了不少产品。一款命名为“Affdex”的应用程序就是“Affectiva”的旗舰产品,它可以帮助自闭症儿童缓解心理症状,因为自闭症儿童大都存在语言障碍,不善于表达自己的感受,但“Affdex”可以通过扫描自闭症儿童的表情来解读他们的情绪,这可以方便医生对他们进行心理疏导。

  在广告领域,“Affdex”也有不少用途。在制作广告片的时候,制作者往往都会头疼一个问题:该在什么时候插入商标logo、该在什么时候跳出产品图片才能让观众对这个品牌、这个产品有更深的印象?“Affdex”可以帮助广告制作者解决这一令人头疼的问题。制作者只需要在广告片完成后,邀请一部分人来试看这个广告片,并在试看过程中使用“Affdex”测试观看者的情绪变化,找到他们情绪波动最大的段落,这就是插入商标logo的最佳时机。

  在卡鲁比看来,对计算机情绪识别技术而言,还有非常广阔的应用前景值得探索。比如,在日益普及的远程网络教育中,教学软件往往很难判断学生是否开始存在听不懂或有疑惑的状况,但如果打造一个可以感知学生情绪的智能学习系统,那么,当学生感到疑惑时,系统会放慢教学速度,甚至当学生感到疲倦时,系统会开个小玩笑或者换一种幽默的方式对知识进行解释,这就会使教学效果大大改善。

  又比如日常的居家旅行,你的汽车如果感应到你累了,它会提示你缓行,减少交通事故,或者你的冰箱知道你有心理压力,它会自动锁住,防止你暴饮暴食……总之,卡鲁比相信,如果让人工智能拥有了情感,那么人们的生活会变得越来越好。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多