yolo广泛应用在各种目标检测落地领域中,不仅是人脸,自动驾驶,也可以进行动物界目标检测。其应用之广泛,不会让你学了没处用。从yolo上手掌握同类目标检测算法是比较快速的。 学算法先读paper,下面是YOLO v1到YOLO X的论文解读(就是划侧重点,同时附带代码➕数据集➕论文原文➕精读直播【附带资料在文末】)。 YOLO v12015年Redmon等提出了基于回归的目标检测算法YOLO(You Only Look Once),其直接使用一个卷积神经网络来实现整个检测过程,创造性的将候选区和对象识别两个阶段合二为一,采用了预定义的候选区(并不是Faster R-CNN所采用的Anchor),将图片划分为 对于每个网格,YOLO都会预测出B个边界框,而每个边界框YOLO都会预测出5个值,其中4个代表边界框的位置,还有一个代表框的置信值。 YOLO的网络结构示意图如图10所示,其中,卷积层用来提取特征,全连接层用来进行分类和预测.网络结构是受 最终,整个网络包括24个卷积层和2个全连接层,其中卷积层的前20层是修改后的GoogLeNet。网络经过最后一个FC层得到一个 YOLO优点:
YOLOv2
YOLOv2网络通过在每一个卷积层后添加批量归一化层(batch normalization),同时不再使用dropout。 YOLOv2引入了 网络中去除了全连接层,网络仅由卷积层和池化层构成,保留一定空间结构信息。结果mAP由69.5%下降到69.2%,下降了0.3%,召回率由81%提升到88%,提升7%。尽管mAP略微下降,但召回率的上升意味着模型有更大的提升空间。同时利用K-means聚类,解决了 YOLO9000YOLO9000是基于YOLO的改进版本,YOLO的不足是: a)利用全连接层的数据对边框进行预测会丢空间信息,导致定位不准,并且设定一个网格只检测两个边界框,合理性不足; b)相对于 网格分辨率也从YOLO的 对于神经网络,每层的分布都有变化,通过对上一层的输出进行均衡规范数据分布,就可以起到加速训练的效果。并且通过规范化输入,降低激活函数在输入区间上达到饱和的概率,来规避梯度消失现象。 YOLO9000采用的网络是 YOLOv3YOLOv3借鉴了 相应改进使YOLOv3与SSD相当的精确度下达到50fps的检测速度,并在COCO测试数据上mAP的最佳效果达到33.0%,与RetinaNet的结果相近,速度快了3倍,但整体模型变得更加复杂,速度和精度相互制衡。 YOLOv3改进之处:
YOLO v3也是yolo经典的一代,有为一位朋友就魔改YOLO v3发了篇小论文。 8月4号5号晚我们请来了深度之眼张老师来给大家做为期两天的直播,带大家深入了解YOLOX技术——从yolo V3的基本概念讲到YOLOX的核心技术知识点分解! 扫描二维码0.1元购买直播课 添加小享进入学习群 👆购课后进群领👇 YOLO V1到YOLO X 👇论文➕代码➕数据集👇 YOLOv4YOLO v4的创新主要有四点:
仅对比Yolov3和Yolov4,在COCO数据集上,同样的 YOLO v5与YOLO v4相比,YOLO v5的主要改进如下:
YOLO X近两年来目标检测领域的各个角度的优秀进展与
本文部分内容引用自江大白和极市平台公众号,侵删。 |
|