搜索

分享

QQ空间 QQ好友新浪微博微信

英伟达新研究：不用动捕，直接通过视频就能捕获3D人体动作

weinfb 2021-09-26

展开全文

不靠昂贵的动捕，直接通过视频也能提取3D人体模型然后进行生成训练：

文章图片1

文章图片2

英伟达这项最新研究不仅省钱，效果也不错——

其合成的样本完全可以用在以往只在动捕数据集上训练的运动合成模型，且在合成动作的多样性上还能更胜一筹。

成果已被ICCV 2021接收。

文章图片3

四个步骤从视频获得人体模型

下图概述了英伟达提出的这个从视频中获得动作样本的框架。

文章图片4

包含4步：

1、首先输入一个视频，使用单目姿势预估模型（pose estimator）生成由每帧图像组成的视频序列。

2、然后利用反向动力学，用每帧的3D关键点形成SMPL模型动作。

SMPL是一种参数化人体模型，也就是一种3D人体建模方法。

3、再使用他们提出的基于物理合理性的修正方法来优化上述动作；

4、使用上述步骤处理所有视频，就可以使用获得的动作代替动捕来训练动作生成模型了。

概括起来就是用输入视频生成动作序列，然后建模成3D人体，再进行优化，最后就可以像使用标准动作捕捉数据集一样使用它们来训练你的动作生成模型。

下面是他们用该方法生成的一个样本合集：

文章图片5

具体效果如何？

研究人员对比了该方法与一些动捕模型，比如最新的PhysCap等。

PhysCap，一款基于AI算法的单目3D实时动捕方案。

结果发现，他们的方法在平均关节位置(MPJPE）的误差低于PhysCap。

文章图片6

其中的基于物理的修正方法更是将样本的脚切线速度误差降低40%以上，高度误差降低80%。

文章图片7

那用这些样本来训练生成模型的效果如何呢？

他们使用3个不同的训练数据集训练相同的DLow模型。

DLow（GT）是使用实际动捕数据进行训练的人体运动模型。
DLow（PE-dyn）是他们提出的方法，使用物理校正后的姿势训练。
DLow（PE-kin）也是他们的方法，没有优化过动作。

结果是DLow（PE-dyn）模型的多样性最好，超越了动捕数据集下的训练。

但在最终位移误差(FDE)和平均位移误差(ADE)上略逊一筹。

文章图片8

最后，作者表示，希望这个方法继续改进成熟以后，能够非常强大地利用身边的在线视频资源为大规模、逼真和多样的运动合成铺平道路。

作者信息

Xie Kevin，多伦多大学计算机专业硕士在读，也是英伟达AI Lab的实习生。

文章图片9

王亭午，多伦多大学机器学习小组博士生，清华本科毕业，研究兴趣为强化学习和机器人技术，重点集中在迁移学习、模仿学习。

文章图片10

Umar Iqbal，英伟达高级研究科学家，德国波恩大学计算机博士毕业。

文章图片11

后面还有其他3位来自多伦多大学和英伟达的作者，就不一一介绍了。

论文地址：
https:///abs/2109.09913

参考链接：

https://nv-tlabs./physics-pose-estimation-project-page/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： weinfb > 《影视行业》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

weinfb

关注对话

TA的最新馆藏

李煜偷看妻妹午睡，写下一首肉麻词，最后10字让人脸红到脖子
神秘算命村，全村600多人靠天书占卜挣钱，记者被算的目瞪口呆
央视文案天花板，炸裂的开场白犹如天籁之音，这诗词太上头了
董宇辉嵩阳书院访谈百家讲坛读《史记》主讲人王立群完整版
40岁以上开始练的回春术，一个月后有惊喜！你练过几个？
标准「健身气功·八段锦」教学方法｜通经络，养气血，一学就会！

喜欢该文的人也喜欢更多

热门阅读换一换