为什么YOLO在目标检测领域如此流行?( 二 )


Y = [pc,bx,by,bh,bw,c1,c2]
这在模型的训练阶段尤为重要 。
为了更好地理解,让我们更仔细地观察右下角的球员 。
交并比 IoU ( over Union)
通常情况下,一张图像中的单个物体可能有多个网格框作为预测结果,但并非所有网格框都是相关的 。IOU(介于0和1之间的值)的目标是舍弃这些无关的网格框,只保留相关的网格框 。其逻辑如下:
下面是将网格选择过程应用于左下角物体的示例 。我们可以观察到,该物体最初有两个网格框候选,最终只选择了“Grid 2” 。
非极大值抑制(Non- )
设置IOU的阈值并不总是足够的,因为一个物体可能有多个框与阈值的IOU值相同,如果保留所有这些框,可能会包含噪声 。这就是我们可以使用NMS来仅保留具有最高检测概率分数的框的原因 。

为什么YOLO在目标检测领域如此流行?

文章插图
YOLO的应用场景
YOLO目标检测在我们日常生活中有不同的应用 。在这一部分中,我们将涵盖以下领域的一些应用:医疗保健、农业、安全监控和自动驾驶汽车 。
1- 应用于工业领域
目标检测已经被引入到许多实际的工业领域,如医疗保健和农业 。让我们通过具体的例子来了解每一个领域 。
医疗
在医疗领域,特别是在手术中,由于患者之间的生物多样性,实时定位器官可能具有挑战性 。in CT使用来帮助在计算机断层扫描(CT)中定位二维和三维肾脏 。
农业
人工智能和机器人在现代农业中扮演着重要角色 。收割机器人是基于视觉的机器人,用于代替手工采摘水果和蔬菜 。在这个领域中最好的模型之一使用了YOLO 。在《基于修改后的框架的番茄检测》中,作者描述了他们如何使用YOLO来识别不同类型的水果和蔬菜,以实现高效收获 。
安全监控
在安全监控领域,虽然物体检测技术被广泛应用,但这并不是唯一的应用 。在 COVID-19 疫情期间,被用来估计人们之间的社交距离违规情况 。你可以从《基于深度学习的 COVID-19 社交距离监测框架》进一步了解这个话题 。
YOLO, , , , , YOLOR, YOLOX, , , 比较
自从2015年YOLO首次发布以来,它已经通过不同版本不断发展 。在本节中,我们将了解每个版本之间的区别 。
YOLO/,起点
YOLO的第一个版本由于快速高效地识别物体的能力而成为目标检测的改变者 。
然而,像许多其他解决方案一样,YOLO的第一个版本也有其自身的局限性:

是在2016年创建的,旨在使YOLO模型更好、更快、更强 。
改进包括但不限于使用-19作为新的架构、批量归一化、更高的输入分辨率、具有锚点的卷积层、维度聚类和细粒度特征 。
1-批量归一化,添加批量归一化层将性能提高
1- 批量归一化(批标准化)
添加批量归一化层可以提高2%的mAP性能 。这种批量归一化包括正则化效果,防止过拟合 。
2- 更高的输入分辨率
直接使用更高分辨率的448×448输入,而不是224×224,这使得模型调整其滤波器以在更高分辨率的图像上表现更好 。在数据上训练10个时期后,这种方法将准确性提高了4%的mAP 。
3- 使用锚框的卷积层
简化了问题,用锚框替换完全连接层,而不是像那样预测物体边界框的精确坐标 。这种方法略微降低了准确性,但将模型召回率提高了7%,为改进提供了更大的空间 。
4- 维度聚类
上述提到的锚框是由使用k = 5的k-means维度聚类自动发现的,而不是手动选择 。这种新颖的方法在模型的召回率和精度之间提供了良好的折衷 。
为了更好地理解k-means维度聚类,请查看我们的中使用-learn的K-Means聚类和R中的K-Means聚类教程 。它们深入探讨了使用和R进行k-means聚类的概念 。