搜索

分享

QQ空间 QQ好友新浪微博微信

【原】阿里巴巴提出Auto-Context R-CNN算法，刷出Faster RCNN目标检测新高度

我爱计算机视觉 2020-12-23

展开全文

基于区域的CNN（R-CNN），在目标检测领域具有统治地位，在兴趣区域（RoI）上的操作比如RoIPooling和RoIAlign扮演了重要角色，但是它们只利用了兴趣区域内的信息，而兴趣区域附近的上下文信息显然是对目标检测有帮助的。在auto-context和multi-class object layout 工作的启发下，提出了一个通用的上下文挖掘的RoI操作——RoICtxMining，它可以很方便的集成进R-CNNs系列算法的框架，并可以端到端训练。
RoICtxMining是在RoIPooling or RoIAlign上的简单有效的双层扩展，以object-RoI为中心，在周围八个上下文邻域创建3*3层叠来挖掘上下文信息，在这8个上下文邻域中，挖掘出最具鉴别力的context-RoI和与其对应的RoIPooling/RoIAlign特征，将这些特征与object-RoI的特征串联起来，用于最终的预测。
提出的自动上下文R-CNN(Auto-Context R-CNN)对遮挡和小目标同样鲁棒，而且在没有添加对抗训练的情况下能够增强抵御对抗样本攻击的能力。

RoICtxMining操作示意图：

在Faster R-CNN框架下改进的Auto-Context R-CNN网络架构：

Auto-Context R-CNN目标检测示例，可以看到一些小目标和被遮挡的目标都被检测出来了：

PASCAL VOC 2007数据集上的检测结果：

PASCAL VOC 2012数据集上的检测结果：

COCO Val数据集上的检测结果：

在KITTI pedestrian 与 cyclist数据集上的检测结果：

从以上结果看出，所提出的RoICtxMining方法对Faster R-CNN目标检测的改进异常显著。
接来下，作者又研究了所提出模型对样本攻击的鲁棒性。
对抗攻击样本的结果：

不同的上下文建模方法面对攻击的检测结果：

期待作者能早日放出代码！

欢迎访问www.52cv.net，获取更多计算机视觉与机器学习技术信息。

长按关注本公众号：

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：我爱计算机视觉 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

我爱计算机视觉

关注对话

TA的最新馆藏

综述 | 基于 Transformer 网络的多模态学习
超200+篇文献！一文知晓"伪装场景理解"领域近况
当AIGC遇见灌篮高手，一秒钟让动漫/艺术人物在虚拟世界中重现
全景鱼眼相机+俯视+深度学习：封闭场景视频监控的好选择
SAM 模型真的是强悍到可以“分割一切”了吗？
我在Github上建了一个项目快1.2K stars了，你应该也需要！

喜欢该文的人也喜欢更多

热门阅读换一换