随着现代计算机技术的飞速进步,计算机图形、图像处理、辅助设计多媒体技术越来越广泛深入地应用于广告、游戏、工业、医学,影视业等各个领域。人们经常需要能迅速地获得物体表面的三维信息,将其转变成计算机能直接处理的数据,基于计算机视觉的三维重建技术具有不可替代的重要作用。三维重建是通过分析计算三维空间中物体的不同性质,例如颜色、纹理、反射等信息,通过计算机视觉技术将物体的形状颜色恢复出来,并在计算机中以约定好的方式进行模拟渲染的过程。它是一项广泛应用的技术,其对现实世界的感知、建模与交互,涉及了计算机视觉、数字图像处理、数字几何处理等。
WIMI微美全息(NASDAQ:WIMI)基于计算机视觉、人工智能等技术,正在开展基于多视图三维重建算法的研究。基于多视图的三维重建算法是通过计算不同视角拍摄物体图像的三维空间位置来重新恢复物体深度的,利用几何约束和特征匹配关系从图像中找到对应的特征匹配关系从而恢复出物体和相机之间的空间坐标关系,之后进行稠密重建确定各个面片的位置和朝向。它融合了多幅图像中的信息,在三维物体测量和重建高度真实感的三维模型方面具有巨大的优势,基于多视图的三维重建技术越来越多的应用出现的各个领域,例如增强现实、历史建筑模型建模等方面,其在诸多领域中具有极其广阔的应用前景。
WIMI研究的基于多视图的三维重建算法应用主要包括以下流程:
特征点提取与匹配:
特征点提取与匹配是在重建过程中一个非常重要的模块,图像特征点对应指的是图像间稀疏的像素坐标对应关系,它是在用来描述图像一部分区域内容的一种描述符,由多维的二进制向量或者实数向量构成,它一般是通过提取该部分区域的梯度直方图来获得的。在计算机视觉中,特征点一般都是图像上梯度变化较大的点或者是图像中物体的边缘,通过图像中特征点的匹配,能够对物体进行识别或对场景的位置进行定位。
特征点提取的质量和位置的准确性显得尤为重要,特征点提取位置的准确性会影响到对应位置重建生成模型的质量。特征点的质量主要体现在匹配的准确性,能够与不同的特征点具备区分度,对于同一位置的特征能够轻易的匹配上,在不同的特征之间存在明显的差异,无法完成匹配。此外还需要有在各种情况下的不变性,例如旋转不变性、尺度不变性、光度不变性等,并且具备对图像噪声、模糊、图像压缩等因素的抗干扰能力。
特征提取匹配是基于多视图三维重建技术中的第一步,在这个过程中图片像素点之间的匹配关系得以建立,基于这一步骤,后续的运动恢复结构算法才得以进行。
运动恢复结构:
运动恢复结构这一过程主要是提取三维重建中基本的几何信息,即从二维图像序列中获取所见物体的三维位置以及相机的位姿,相机的焦距可由图片中的附带信息获得或者自行标定。根据对极几何理论通过特征匹配关系可以从中计算出两个相机的相对位置关系和它们朝向的变化,然后对图片匹配的特征点进行三角化,求解三维空间点深度。
多视角立体视觉:
在运动恢复结构这一步后,得到所有相机的位姿和通过图像匹配恢复出的物体部分三维坐标,即稀疏点云,多视角立体视觉利用运动恢复结构提取出的信息以及未能充分利用的二维图片中的信息由稀疏点云生成稠密点云,使三维模型信息更加完整。
随着计算机技术的发展,三维重建技术有了很大的进步,它通常被用于很多领域。WIMI基于多视图的三维重建算法在导航、虚拟现实、增强现实、测绘、医疗等领域中都有着重要的应用价值。