one-stage和two-stage目标检测算法( 二 )


one-stage和two-stage目标检测算法

文章插图
1.5 MR-CNN
2015 年巴黎科技大学提出 MR-CNN 算法,结合样本区域本身的特征,利用样本区域周围采样的特征和图像分割的特征来提高识别率,可将检测问题分解为分类和定位问题 。
one-stage和two-stage目标检测算法

文章插图
分类问题由 Multi- CNN Model 和-Aware CNN Model 组成 。前者的候选框由得到,对于每一个样本区域,取 10 个区域分别提取特征后拼接,这样可以强制网络捕捉物体的不同方面,同时可以增强网络对于定位不准确的敏感性,其中max即 ROI max ;后者使用 FCN 进行目标分割,将最后一层的map 和前者产生的map 拼接,作为最后的map 。
为了精确定位,采用三种样本边框修正方法,分别为 Bbox 、以及box。Bbox :在 Multi- CNN Model 中整幅图经过网路的最后一层卷积层后,接一个 Bboxlayer,与 RPN 不同,此处的layer 是两层 FC 以及一层layer,为了防止得到的框过于贴近物体而导致无法很好的框定物体,将候选框扩大为原来的 1.3 倍再做 。:初始的框是得到的框,然后用已有的分类模型对框做出估值,低于给定阈值的框被筛掉,剩下的框用 Bbox的方法调整大小,并迭代筛选 。box :首先对经过处理后的框应用 NMS, IOU = 0.3,得到检测结果,然后对于每一个框,用每一个和其同一类的而且 IOU >0.5 的框加权坐标,得到最后的目标样本框 。
1.6
2016 年清华大学提出算法,其利用网络多个层级提取的特征,且从较前层获取的精细特征可以减少对于小物体检测的缺陷 。将提取到的不同层级map 通过最大池化降维或逆卷积扩增操作使得所有map 尺寸一致,并利用 LRN 正则化堆叠,形成 Hypermaps,其具有多层次抽象、合适分辨率以及计算时效性的优点 。接着通过结构进行预测和定位,仅保留置信度最高的 N 个样本框进行判断 。
one-stage和two-stage目标检测算法

文章插图
1.7 CRAFT
one-stage和two-stage目标检测算法

文章插图
R-CNN 系列算法的第一阶段是生成目标,第二阶段是对目标进行分类,2016 年中科院自动化所提出的 CRAFT 算法分别对R-CNN 中的这两个阶段进行了一定的改进 。对于生成目标阶段,在 RPN 的后面加了一个二值的 Fast R-CNN 分类器来对 RPN 生成的进行进一步的筛选,留下一些高质量的 ;对于第二阶段的目标分类,在原来的分类器后又级联了 N 个类别(不包含背景类)的二值分类器以进行更精细的目标检测 。
1.8 R-FCN
one-stage和two-stage目标检测算法

文章插图
随着全卷积网络的出现,2016 年微软研究院的Dai 等提出 R-FCN 算法 。相较于R-CNN 算法只能计算 ROI层之前的卷积网络特征参数,R-FCN 算法提出一种位置敏感分布的卷积网络代替 ROI层之后的全连接网络,解决了R-CNN 由于 ROI层后面的结构需要对每一个样本区域跑一次而耗时比较大的问题,使得特征共享在整个网络内得以实现,解决物体分类要求有平移不变性和物体检测要求有平移变化的矛盾,但是没有考虑到的全局信息和语义信息 。
1.9 MS-CNN
针对R-CNN 算法的遗留问题,2016 年加州大学圣地亚哥分校的 Z Cai提出了 MS-CNN 算法,通过利用R-CNN 算法结构的多个不同层级输出的特征结果来检测目标,将不同层级的检测器互补形成多尺度的强检测器,应用浅层特征检测小尺寸目标,应用深层特征检测大尺寸目标 。并且利用去卷积层代替图像上采样来增加图像分辨率,减少内存占用,提高运行速度 。