SIGGRAPH 2023 | 全新参数化人脸模型HACK助力3D角色生成，忠实再现逼真颈部运动

天承办公室 2023-08-11 发布于江苏

展开全文

机器之心专栏

机器之心编辑部

在当前的生成式人工智能浪潮中，3D 生成一直是备受瞩目的话题。而要生成高质量、符合工业界标准的几何模型，一直是 3D 生成任务的重要难点。但对于 3D 里最为重要的品类之一 —— 人物头部几何的生成，却早就不再受困于这个问题。

由于人类面部拓扑的相似性，通过 PCA(主成分分析)等手段参数化建立人脸模型的手段已经被证明是一种非常有效的解决方案，可以高质量、快速、符合工业界标准地生成人物头部的几何模型。诸如 3DMM(3D Morphable Model)、FLAME(Face, LAndmark, MOrphology, and Expression model)等参数化人脸模型已经广泛应用于数字娱乐、虚拟现实、医学和安防等领域。

然而，当前开源的参数化人脸模型仍然面临着问题。首先，由于数据集以欧美面孔为主，缺少亚洲人数据，覆盖度不全，无法完全表现所有人种特征。其次，在拓扑结构和表情变形体(BlendShape)方面过于简化，达不到工业标准，无法精细还原各种结构(如面部肌肉、胸锁乳突肌等)，也无法实现个性化(Personalized)控制运动。最后，在注重脸部的同时，缺少对颈部肌肉和喉结运动的建模，颈部旋转的表现也过于极简化，导致缺乏运动真实度。

由上海科技大学与影眸科技、华中科技大学联合提出的全新参数化人脸模型 HACK 解决了这些问题。HACK 是一个新的开源参数模型，用于构建数字人的头部和颈部区域。该模型旨在解耦颈部和喉部运动、面部表情和外观变化，实现对头部的全方位控制，特别是对于颈部区域的控制更加个性化和解剖学一致，实现了比现有头颈模型更准确和表现力更强的结果。HACK 已经被应用于影眸科技的 3D AIGC 数字角色生成平台 ChatAvatar 中，通过文本 / 图像直接生成并导出能够用于 Unity/UE/Maya 等主流 CG 软件中的模型文件。

这项工作已经被计算机图形领域国际顶级期刊 Transactions on Graphics 接收，并将在国际计算机图形顶级会议 SIGGRAPH 2023 上展示。值得一提的是，HACK 还入选了 ACM ToG 当期的扉页与 SIGGRAPH 2023 Technical Paper 预告片。

项目链接：https://sites.google.com/view/hack-model
论文链接：https:///abs/2305.04469
GitHub：https://github.com/ZoneLikeWonderland/HACK-Model/

数据采集

该研究使用一种便携式实时 3D 超声成像系统，使用超声断层扫描技术捕捉颈椎相对于演员静止姿态的解剖正确位置。对于颈椎的扫描图像，射科医生被要求用 3D 标志标记颈椎的七个椎骨，然后根据头骨和颈部的外部形状提取解剖学上匹配的 3D 旋转信息。

此外，该研究建立了 PlenOptic Stage，捕捉各种外貌特征的静态扫描、FACS 表情和 PBR 纹理、头部和颈部的动态表现以及细致的喉部运动法线(Normal)序列。

通过对这些原始数据进行处理，该研究得到了一个全面的数据集，包括：1）颈椎关节和相应的面部网格，来自超声扫描；2）大规模静息 mesh(不包括喉部几何形状)，由 PlenOptic Stage 和 ICT-FaceKit 获得；3）喉部几何形状；4）从静态扫描中制作表情的 mesh；5）动态 mesh 序列；6）外观纹理；7）说话的图像和计算的法线。然后该研究在这些数据上训练了整个 HACK 模型。