加州大学洛杉矶分校博士后王可泽：可解释性AI在视频分析中的研究和应用

精诚至_金石开 2020-07-10

展开全文

「机器学习前沿讲座」，是智东西公开课针对机器学习领域推出的一档讲座，聚焦于机器学习前沿领域研究成果与进展。我们将持续邀请研究者、专家与资深开发者，为大家带来直播讲解。

继「CV前沿讲座」之后，智东西公开课全新推出「机器学习前沿讲座」，聚焦机器学习前沿领域研究成果与进展，包括（深度）强化学习、迁移学习、无监督学习、半监督学习、GNN/GCN、可解释性AI等前沿领域，我们将持续邀请研究者、专家和资深开发者，为大家带来更多的直播讲解。直播由主讲环节和Q&A环节组成，共计90分钟。

机器学习领域，输入数据和输出答案之间不可观察的空间通常被称为“黑箱”，也就是大家所关注的可解释性AI问题。在本次「机器学习前沿讲座」第1讲的讲座中，智东西公开课邀请到美国加州大学洛杉矶分校博士后王可泽，为大家带来主题为《可解释性AI在视频分析中的研究和应用》的讲座。

相比于现有的机器学习范式，即人单方面地给定机器需要学习的视觉概念，输入海量标注数据，进而让计算机进行归纳学习。通过人机双向问答的过程，人和计算机可以逐渐统一对事物的认识，基于人机问答的交流沟通和信息传递方式，在问答过程中分别为用户（人）和机器设计不同的视觉概念解析图模型。

视觉解析图是将常见的不同层级主观和客观的视觉概念（“实体”、“属性”、“关系”、“事件”等）连接成一个图状结构，用以表示用户或计算机所见的输入图像的理解和表述。该模型使得人机可以通过自然地语言问答以实现视觉概念和常识的传递和学习。同时，基于图模型，机器在问答过程中不断地对用户进行情感建模，并对用户意图进行预判，实现“组合抽象”、“因果推理”以及在“学习中学习”等能力。这就使得用户能够在对查询需求十分模糊的情况下，快速地检索到所需要的视觉内容，从而有效地填补了用户与机器之间的意图鸿沟。

7月13日上午10点，智东西公开课「机器学习前沿讲座」第1讲将直播开讲，王博士将从可解释性AI在视频分析中的研究出发，解析情感分析理论模型（ToM）的原理和基于图模型的用户情感建模及在视觉问答任务中的应用。感兴趣的朋友不要错过。

王可泽，美国加州大学洛杉矶分校博士后，导师为朱松纯，主要研究方向计算机视觉、机器学习、可解释人工智能。王博士针对当前海量复杂、多源异质、动态增加和无标注的海量图像视频数据，以减少对训练样本依赖和挖掘海量无标签的图像数据为目标，以融合视觉领域知识和语义信息的深度表达学习为主线，从监督学习演化到自主学习机制，以视觉高层语义理解为主要应用场景，展开了一系列的研究，提出了联合知识与数据驱动的学习范式，具有广泛的应用前景。他的研究成果发表了两篇TPAMI和数篇TNNLS、IJCV、TIP、TMM、TCSVT等顶级SCI期刊和10余篇顶级国际会议上，其中被引用次数总计超过800次。