机器人三维视觉技术及其在智能制造中的应用( 二 )


图2 线结构光法测量原理图
结构光法具有原理简单、易于实现和测量精确高等优点,但由于结构光法需要对光照进行严格控制,对于反射特性较敏感的场景目标表面,如表面对结构光存在完成吸收、镜面反射以及透射等情况时,结构光法将难以获取物体表面精确的3D信息,严重时会导致结构光法测量系统无法正常工作,从而难以应用于复杂场景的感知 。
2.3 激光扫描法
激光扫描法根据其激光测距原理的不同,可以分为激光三角法(Laser )、飞行时间法(Time-of-)和相位调制法()三种类型[8,9],其中前两种方法的测距原理如图3所示 。根据上述的激光测距原理,通过增加相应的2D或3D扫描装置,使得激光光束能够扫描到整个被测物体表面,则可以获得物体表面的3D点云数据 。蔡云飞等人[10]针对非结构化场景的负障碍感知问题,提出了一种基于双多线激光雷达的感知方法,该方法将雷达点云映射到多尺度栅格,通过统计栅格的点云密度与相对高度等特征,以提取负障碍几何特征,并将栅格统计特征与负障碍几何特征进行多特征关联获得关键特征点对,利用特征点聚类识别负障碍 。
图3 激光扫描法测量原理
激光扫描法具有能直接获取测量点精确三维坐标,对阴影和光照变化不敏感,测量过程几乎不受被测表面纹理特征影响,以及扫描测量视场范围大等优点,但由于激光扫描法从形状相似或距离较近的目标所获取的点云数据相似度高,对此情况下的扫描目标难以进行有效识别,实现该类目标的精度感知,从而一定程度上限制了基于激光扫描法的场景感知方法的应用范围 。
3 机器人三维视觉热点研究问题
本节对机器人三维视觉中语义分割、三维特征提取、三维目标识别与定位、三维环境感知等热点研究问题进行阐述 。
3.1 语义分割
语义分割是根据图像、深度图像或三维点云等类型数据中每一个点(像素点或三维点)所表达的语义内容对其进行语义类别分类的技术 。其中,以二维图像为数据源的语义分割称为图像语义分割[11,12] 。本文主要讨论基于三维点云数据的语义分割,包括基于聚类、模型参数拟合或区域生长等传统的三维点云语义分割方法,以及基于深度学习的三维点云语义分割方法 。
(1)传统的三维点云语义分割
等人[13]通过在局部范围内选取用于平面参数估计的随机点,来简化得分函数()的计算,以提高(s)方法的点云平面检测效率,但是对于大规模三维点云数据,其计算效率仍很低 。王帅等人[14]提出了一种基于混合流形谱聚类的自适应点云分割方法,该方法将点云分割的几何特征在谱空间进行降维嵌入,利用N-cut方法得到描述点云分割特征的多维向量,在此基础上,结合类间、类内划分算法实现点云自适应分割 。传统的三维点云语义分割结果需要进行相应的语义标注才能够得到最终的语义分割结果,从而影响了语义分割的效率 。
(2)基于深度学习的三维点云语义分割
等人[15]于2017年提出了,其直接采用原始点云作为深度神经网络的输入,为目标分类、部分分割和场景语义分析提供了一个统一的体系结构,但其未考虑点云局部特征提取,减弱了其识别细粒度模式能力和对复杂场景泛化能力 。为此,该团队随后提出了一种分层网络++[16],通过对点云进行采样和区域划分,在各个小区域内利用网络进行迭代特征提取,以融合点云的局部和全局特征,通过全连接层预测点云中各点的语义标签 。彭秀平等人[17]提出了一种散乱点云语义分割深度残差-特征金字塔网络框架,以提高基于深度学习的散乱点云语义分割的精度和可靠性 。