物体定位误差
将GT中的对象随机偏移一些像素 , 误差严重程度由位移像素长度控制 。
边界近似误差
利用的简化公式来删除多边形顶点 , 同时保持简化多边形尽可能接近原始图像 , 误差严重程度由函数的容错参数控制 。
内部掩码错误
向GT中添加随机性形状的孔 , 虽然这种误差类型并不常见 , 但是本文将其包含进来 , 用以评估内部掩膜误差的影响 。
实现细节
数据集:作者从LVIS V0.5验证集中随机抽取实例掩码 , 因为该数据集拥有高质量的注释 。
实现过程:通过改变误差类型和误差的严重程度 , 记录每种类型的平均值和标准差 , 此外 , 还通过划分不同的区域 , 来比较对不同大小物体的指标评价 。
其中d设置为图像对角线的2% 。
现有方法分析 Mask IoU 理论分析
尺度不变性(自己取的):即对于一个固定的Mask IoU值 , 分割对象面积越大 , 则其错误像素越多 , 二者之间的变化关系成正比 , 其比例即为Mask IoU的值 。
惩罚差异性(自己取的):然而 , 当缩放一个对象时 , 内部像素数量呈二次增长 , 边界像素仅为线性增长 , 二者不同的增长率导致Mask IoU容忍更大的对象边界上的更多错误分类 。
实证分析
尺度不变性基于一个假设 , 即GT标注中的边界误差也随着对象的大小而增长 。
然而已有研究表明 , 不论物体大小 , 被不同标注器标记的同一个对象的两个轮廓之间的像素距离很少超过图像对角线的1% 。(就叫它标注相似性吧)
本文通过研究LVIS提供的双标注图像来证实这一点 , 如下:
其中冰箱的面积是机翼面积的100倍 , 但在相同分辨率的区域内 , 注释之间的差异在视觉上十分相似 。
两者的两个轮廓的Mask IoU分别为0.97,0.81 , 而它们的 IoU则更为接近 , 分别为0.87 , 0.81 。说明Mask IoU对小尺寸图片的“惩罚”更大 。
实验:通过严重程度相同的膨胀/腐蚀来模拟尺度误差 , 其显著降低了小物体的Mask IoU , 而Mask IoU随物体大小的增加而增加 , 见下图:
总结IoU
IoU是不对称的 , 交换GT和Pred将会得到不同的值 。下图显示了其更倾向于比GT更大的pred:
可以看到:
简单的证明:
蓝色部分为- (伪预测) , 红色方框为GT轮廓 , 可以看到 , 当- 完全包含了GT时 , 其值不会再改变
同理 , 当伪预测完全被GT所包含 , 分子为0 , 最终值为0 。
F-
F-完全忽略了小的轮廓误差 , 但是表现效果很差 , 会在很短的严重程度中快速下降到0:
总结
综上可知 , F-和 IoU都不能代替Mask IoU , 而Mask IoU也有着不能忽视的缺陷 , 因此 , 本文提出 IoU 。
IoU 公式
一个简化的IoU公式
I o U = G d ∩ P d G d ∪ P d IoU = \frac{G_d\cap P_d}{G_d\cup P_d} IoU=Gd?∪Pd?Gd?∩Pd??
该公式直接使用 G d 、 P d G_d、P_d Gd?、Pd?,丢失了边缘的尖锐部分的信息
IoU公式如下:
B o u d a r y ? I o U ( G , P ) = ∣ ( G d ∩ G ) ∩ ( P d ∩ P ) ∣ ∣ ( G d ∩ G ) ∪ ( P d ∩ P ) ∣ -IoU(G,P)=\frac{|(G_d\cap G)\cap(P_d\cap P)|}{|(G_d\cap G)\cup(P_d\cap P)|} ?IoU(G,P)=∣(Gd?∩G)∪(Pd?∩P)∣∣(Gd?∩G)∩(Pd?∩P)∣?
其中参数d控制了测量的灵敏性 , 当d足够大时 , IoU就相当于Mask IoU;若使用较小的d , IoU则会忽略内部像素 , 使其对边界像素更加敏感 。
- 热传导方程与图像平滑和增强
- CT扫描医学图像配准数据集
- ECC OpenCV 项目开发实战--对图像进行对齐
- RK3588 ArmSoM-W3开发板 之 USB摄像头图像预览
- 图像降噪综述
- 车辆图像识别分类 深度学习训练自己的数据集
- Few-shot Learning 小样本学习在图像领域的研究现状
- Segmentation 图像分割
- 免费在线 GIF 制作器和图像编辑器
- 提升城市环境管理效率,视频图像渣土车识别助力渣土治理