2 文献阅读记录— PointNet++论文学习

正文
不能捕获由度量空间点所产生的局部结构,限制了其识别细粒度模式的能力和对复杂场景的推广能力 。
本文引入了一个分层神经网络,它将点网递归地应用于输入点集的嵌套划分 。通过利用度量空间距离,本文网络能够随着上下文尺度的增加而学习局部特征 。
1
[20]是直接处理点集的开创性工作 。的基本思想是学习每个点的空间编码(aof each point),然后将所有单独的点特征聚合( allpoint )为全局点云签名 。根据其设计,不会捕获度量上的局部结构 。
利用局部结构对于卷积架构的成功很重要;CNN 可以将在规则网格( grid)上定义的数据作为输入,并且能够沿着多分辨率层次结构(along a multi- )以越来越大的比例逐步捕获特征 。较低水平的神经元具有较小的感受野(),而在较高水平它们具有较大的感受野 。
因此引入++,以分层的方式处理在度量空间中采样的一组点 。首先根据基础空间的距离度量将点集划分为重叠的局部区域 。与CNN相似,我们从小邻域中提取捕捉精细几何结构的局部特征;这样的局部特征被进一步分组为更大的单元并被处理以产生更高级别的特征 。重复这个过程,直到获得整个点集的特征 。
++ 的设计必须解决两个问题:如何生成点集的划分,以及如何通过局部特征学习器(a local)抽象点集或局部特征 。这两个问题是相关的,因为点集的分区必须产生跨分区的公共结构,就像在卷积设置中一样,以便可以共享局部特征学习器的权重 。
以作为局部特征学习器,将局部点或特征集抽象为更高级别的表示 。在此视图中,++ 递归地对输入集的嵌套分区应用将 。(嵌套分区??)
如何生成点集的重叠划分 。每个分区定义为欧氏空间中的一个邻域球,其参数包括质心位置和尺度 。通过最远点采样(FPS)算法在输入点集中选取中心点,以均匀覆盖整个集合 。确定局部邻域球的适当尺度也是一个问题 。并且如果领域太小可能包含的点太少,无法捕捉局部特征 。
++在多个尺度上利用邻域来实现鲁棒性和细节捕获 。在训练过程中借助随机丢失,网络学习自适应地对不同尺度下检测到的模式进行加权,并根据输入数据组合多尺度特征 。
23
我们首先回顾了(第3.1节),然后介绍了一个具有层次结构的的基本扩展(第3.2节) 。最后,我们提出了++,它能够在非均匀采样的点集中稳健地学习特征(第3.3节) 。
3.1of[20]: ASet回顾
缺乏在不同尺度上捕获局部上下文的能力 。
3.2Point Set分层点集特征学习
新体系结构构建了一个分层的点分组,并沿着分层逐步抽象越来越大的局部区域 。
我们的层次结构由许多集合抽象级别组成(图2) 。在每一个层次上,一组点被处理和抽象,以产生一个具有较少元素的新集合 。集合抽象层由三个关键层组成:采样层、分组层和层 。采样层从输入点中选取一组点,定义了局部区域的质心 。然后,分组层通过寻找中心点周围的“邻近”点来构造局部区域集 。层使用一个小将局部区域模式编码为特征向量 。
一个集合抽象级别(a setlevel)将 N × (d + C) 矩阵作为输入,该矩阵来自具有 d-dim 坐标和 C-dim 点特征的 N 个点 。它输出一个 N’× (d + C’) 矩阵,该矩阵由 N’个具有 d-dim 坐标和总结局部上下文的新 C’-dim 特征向量的子采样点组成 。
layer(采样层)
给定输入点{x1,x2,...,xn},我们使用迭代最远点采样(FPS)来选择点的子集{xi1,xi2,...,xim},其中xij是集合{xi1,xi2,...,xij?1}与其其余点的最远的点(以公制距离) 。与随机采样相比,在相同数量的质心下,它对整个点集的覆盖更好 。与扫描与数据分布无关的向量空间的CNN相比,我们的采样策略以数据相关的方式生成感受野 。