(Source:https://blog./image-registration-sift-deep-learning-3c794d794b7a) 图像配准方法概述 图像配准广泛用于遥感,医学图像,计算机视觉等。通常,它的应用根据图像获取方式主要分为四组:
由于配准图像的多样性和各种类型的退化,不能设计出适合所有配准任务的通用方法。每种方法不仅要考虑图像之间假定的几何变形类型,还要考虑辐射变形和噪声损坏,所需配准的准确率和应用数据特征。 尽管如此,配准方法主要包含以下四步(图1):
图1:图像配准四个步骤:上-特征检测。中-通过不变的描述符来特征匹配。左下-利用建立的相关性估计转换模型。右下-用合适的插值技术进行图像冲采样和转换。 每个配准步骤的实现都有自己典型的问题。首先,必须决定哪种特征适合给定的任务。特征应该是有鉴别性的目标,并且在图像上广泛存在以及容易检测。通常,特征的物理可解释性是需要的。参考图像和感测图像上的特征必须有足够相同的元素,甚至在图像没有准确地覆盖同样的场景或者有物体阻挡又或者其它的改变的情况下。检测方法应该有好的定位准确性,并且应该对假定的图像退化不敏感。理想情况下,算法能在场景所有投影情况下检测到同样的特征,不管特定的图像变形。 在特征匹配步骤,由不正确的特征检测或者图像退化造成的问题可能就出现了。由于不同的图像条件或者传感器的不同光谱敏感性,物理上的相关特征可能是不相似的。特征描述和相似性衡量的选择必须考虑到这些因素。对于假定的退化特征描述符应该是不变的。同时,它们必须有足够的可鉴别性来区分不同特征以及足够的稳定性,为了不被轻微的特征变化和噪音所影响。在不变量空间的匹配算法应该是鲁棒和高效的。在其它图像上没有相关对应的单一特征应该不影响性能。 根据图像获取步骤和期望的图像退化先验知识来选择映射函数的类型。如果没有一个先验信息,模型应该足够灵活和通用来处理所有可能出现的退化。特征检测方法的准确性,特征相关性估计的可靠性,以及可接受的近似误差也需要考虑。此外,必须决定图像中哪种差异通过配准来移除。如果目标是变化检测,则不希望移除正在搜索的差异。这个问题是非常重要的并且很难。 最终,合适的重采样技术的选择要取决于要求的插值准确性和计算复杂度来折中。在大多数情况下最近邻或双线性插值就够了;然而,一些应用要求更准确的方法。 从传统方法到深度学习
自21世纪初以来,图像配准主要使用基于特征的方法。这些方法有三个步骤:关键点检测和特征描述,特征匹配,图像变换。简单的说,我们选择两个图像中的感兴趣点,将参考图像(reference image)与感测图像(sensed image)中的等价感兴趣点进行关联,然后变换感测图像使两个图像对齐。 Feature-based methods for an image couple associated by a homography transformation 关键点检测和特征描述 关键点就是感兴趣点,它表示图像中重要或独特的内容(边角,边缘等)。每个关键点由描述符表示,关键点基本特征的特征向量。描述符应该对图像变换(定位,缩放,亮度等)具有鲁棒性。许多算法使用关键点检测和特征描述:
这些算法都可以在OpenCV中轻松使用。在下面的例子中使用了AKAZE的OpenCV实现。其他算法的代码大致相同,只需要修改算法的名称。 ?
Image Keypoints 更多关于特征检测与描述请参见:OpenCV tutorial 特征匹配 一旦在一对图像中识别出关键点,我们就需要将两个图像中对应的关键点进行关联或“匹配”。其中一种方法是 然后我们设定比率来保持正确率。实际上,为了使匹配更可靠,匹配的关键点需要比最近的错误匹配更靠近。 ?
Matched Keypoints OpenCV中关于特征匹配方法的实现 图像变换 在匹配至少四对关键点之后,我们就可以将一个图像转换为另一个图像,称为图像变换^12(image warping)。空间中相同平面的两个图像通过单应性变换^13(Homographies)进行关联。Homographies是具有8个自由参数的几何变换,由3x3矩阵表示图像的整体变换(与局部变换相反)。因此,为了获得变换后的感测图像,需要计算Homographies矩阵。 为了得到最佳的变换,我们需要使用RANSAC算法检测异常值并去除。它内置在OpenCV的findHomography方法中。同时也存在RANSAC算法的替代方案,例如LMEDS:Least-Median鲁棒方法。 ?
Sensed image after warping 深度学习方法 目前大多数关于图像配准的研究涉及深度学习。在过去的几年中,深度学习使计算机视觉任务具有先进的性能,如图像分类,物体检测和分割。 特征提取 深度学习用于图像配准的第一种方式是用于特征提取。卷积神经网络设法获得越来越复杂的图像特征并进行学习。2014年以来,研究人员将这些网络应用于特征提取的步骤,而不是使用SIFT或类似算法。
Homography学习 研究人员利用神经网络直接学习几何变换对齐两幅图像,而不仅仅局限于特征提取。 监督学习 在2016年,DeTone等人发表了 Deep Image Homography Estimation,提出了HomographyNe回归网络,这是一种VGG风格模型,可以学习两幅相关图像的单应性。该算法具有以端到端的方式同时学习单应性和CNN模型参数的优势,不需要前两个阶段的过程! Regression HomographyNet 网络产生八个数值作为输出。以监督的方式进行训练,并计算输出和真实单应性之间的欧几里德损失。 Supervised Deep Homography Estimation 与其他有监督方法一样,该单应性估计方法需要有标记数据。虽然很容易获得真实图像的单应性,但在实际数据上要昂贵得多。 无监督学习 基于这个想法,Nguyen等人提出了一种无监督的深度图像单应性估计方法。他们保留了相同结构的CNN,但是使用适合无监督方法的损失函数:不需要人工标签的光度损失(photometric loss)函数。相反,它计算参考图像和感测变换图像之间的相似性。 他们的方法引入了两种新的网络结构:张量直接线性变换和空间变换层。我们可以简单地使用CNN模型输出的单应性参数获得变换后的感测图像,然后我们使用它们来计算光度损失。 Unsupervised Deep Homography Estimation 作者声称,与传统的基于特征的方法相比,这种无监督方法具有相当或更高的准确率和鲁棒性,并且具有更快的执行速度。此外,与有监督方法相比,它具有更好的适应性和性能。 其他方法 强化学习 强化学习方法作为医学应用的常用方法正在得到越来越多的关注。与预定义的优化算法相反,在这种方法中,我们使用训练好的代理进行配准。 A visualization of the registration pipeline for reinforcement learning’s technics
复杂的转换在当前图像配准研究中占较大比例的是医学影像。通常,由于患者的局部变形(因呼吸,解剖学变化等),两个医学图像之间的变换不能简单地通过单应矩阵描述,这需要更复杂的变换模型,例如由位移矢量场表示微分同胚(diffeomorphisms)。 Example of deformation grid and displacement vector field on cardiac MRI images 研究人员开始尝试使用神经网络来估计这些具有许多参数的大变形模型。
Schematics of the DIRNet with two input images from the MNIST data
参考文献: [1] Image registration methods: a survey (2003) [2] Image Registration: From SIFT to Deep Learning |
|