![]() 论文短视频 | 结合强化学习自适应候选框挑选的SAR目标检测方法 背景介绍 ![]() ![]() 团队工作 近年来,西安电子科技大学雷达信号处理国家重点实验室的杜兰教授团队对SAR图像目标检测与识别相关方法开展了深入研究。 ![]() 在SAR目标检测方面,针对大场景SAR图像中目标数量较多,分布情况较为复杂且易受杂波影响的特点,提出一种结合强化学习的SAR目标检测方法,提出方法通过使用强化学习自适应确定搜索区域实现了对初始候选框的自适应挑选,提升了对背景杂波的鉴别能力并减少传统强化学习应用于检测问题的计算量。所提方法自适应确定搜索区域的能力包括两方面的自适应,一是通过综合利用图像的特征信息和上下文信息自适应确定搜索区域的位置坐标;二是通过搜索区域尺寸约束自适应调整下一次搜索区域的范围尺寸。所提方法能够有效减少SAR目标检测的虚警数量,提升传统深度学习目标检测方法的检测性能。 该工作拟发表在《雷达学报》2022年第5期“《雷达学报》创刊10周年纪念专刊1”论文“结合强化学习自适应候选框挑选的SAR目标检测方法”(杜兰,王梓霖,郭昱辰,杜宇昂,严俊坤)。 论文介绍 文章提出的SAR目标检测方法整体流程如下所示: ![]() 从总体结构上来说,提出方法基于传统Faster R-CNN方法,在RPN与RoI池化层之间加入深度强化学习网络搜索可能含有目标的区域。特征提取网络提取SAR图像特征,并通过RPN在特征图上生成初始候选框。对于大量的初始候选框,本文使用深度强化学习网络进行区域搜索实现对初始候选框进行挑选,将可能含有目标的候选框送入RoI池化层进行整合。整合后的候选框将被送入检测器,获取最终的检测目标框。 其中上文所述深度强化学习网络采用循环神经网络实现,此网络可以在特征图上找到一个可能含有目标的区域,并将该区域内的候选框送入后续检测器获得该区域内的检测结果,然后综合检测结果再找到另一个可能含有目标的区域,继续将该区域内的候选框送入后续检测,如此迭代,最终完成候选框的自适应挑选和检测。深度强化学习网络在迭代过程中捕捉到图像的上下文信息并确定可能含有目标的搜索区域的位置坐标。并且,本方法在强化学习中对产生的搜索区域尺寸添加约束,使得搜索区域尺寸可以根据之前迭代过程中的搜索区域以及目标检测结果进行自适应调整。从表1可以看出本文方法与传统检测方法相比的性能优势。图5展示了本文方法在大场景SAR图像上的检测结果。 ![]() ![]() ![]() 结合表1的检测结果及RoI分布可以分析,Faster R-CNN方法由于采用NMS法对RPN在整张特征图上产生的大量初始候选框进行处理,会导致SAR图像的边缘和难鉴别的背景杂波位置生成大量RoI,从而造成检测结果中出现较多虚警。而所提方法则依靠强化学习策略及深度强化学习网络积累的上下文信息来确定含有目标的搜索区域,并且只在搜索区域内生成RoI,能够让RoI尽可能集中在目标周围,有效减少图片边缘及复杂背景杂波导致的虚警,从而获得较好的检测效果。 作者简介 杜 兰,西安电子科技大学电子工程学院教授,主要研究方向为雷达目标识别、雷达信号处理、机器学习。 王梓霖,西安电子科技大学在读硕士研究生,研究方向为SAR图像目标检测、机器学习。 郭昱辰,西安电子科技大学前沿交叉研究院讲师,主要研究方向为智能雷达目标检测和识别。 杜宇昂,西安电子科技大学在读博士研究生,主要研究方向为SAR图像解译、机器学习与人工智能。 |
|