视觉系统流程从功能来看,2D视觉系统需要能够采集客观场景的图像,对图像进行加工(预处理),改善图像质量,再将其中对应感兴趣物体的图像目标提取出来,并通过对目标的分析获取客观物体的有用信息。2D视觉系统流程如图1所示。 图像技术层次为完成视觉系统的功能,需要利用一系列技术。计算机视觉技术经过多年发展已有很大进展,种类很多。对于这些技术,已有一些分类方法,但目前看来还不太稳定和一致。例如,研究者均将计算机视觉技术分成3层,但结果并不统一。有的将其分为低层视觉、中层视觉、3D视觉,有的将其分为早期视觉(其中又分为两部分:仅一幅图像、多幅图像)、中层视觉、高层视觉(其中又分为两部分:几何方法、概率和推论方法)。 相对来说,图像技术的分类方法在近20多年来一直比较一致。该方法将各种图像技术都集合在图像工程学科(一门系统研究各种图像理论、技术和应用的交叉学科)之下。图像工程可分为图像处理、图像分析和图像理解三个层次,如图2所示,每个层次各有特点。 图2 图像工程层次示意 图像处理(IP)着重强调在图像之间进行的变换。虽然人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要指对图像进行各种加工以改善图像的视觉效果,并为自动识别打基础,或对图像进行压缩编码以减少所需的存储空间或传输时间,从而满足给定传输通路的需求。 图像分析(IA)主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。这里数据可以是对目标特征进行测量的结果,也可以是基于测量的符号表示,它们描述了图像中目标的特点和性质。 图像理解(IU)的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的联系,并得出对图像内容的理解及对原来客观场景的解释。如果说图像分析主要以观察者为中心研究客观世界(主要研究可直接观察到的事物),那么图像理解在一定程度上以客观世界为中心,并借助知识、经验等来把握和解释整个客观世界(包括不能直接观察到的事物)。 综上所述,图像处理、图像分析和图像理解在抽象程度和数据量上各有特点,操作对象和语义层次各不相同,其相互联系可参考图1-10。图像处理是比较低层的操作,它主要在图像的像素层次上进行处理,处理的数据量非常大;图像分析则进入了中层,通过图像分割和特征提取,把原来对图像中像素的描述转换成比较简洁的对图像中目标的描述;图像理解是高层操作,操作对象基本上是从描述中抽象出来的符号,其处理过程和方法与人类的思维推理有许多相似之处。另外,由图1-10可知,随着抽象性的提高,数据量是逐渐减少的。具体说来,原始图像数据在经过一系列的处理过程后,逐步转化得更有组织并被更抽象地表达。在这个过程中,语义被不断引入,操作对象发生变化,数据量得到压缩。另外,高层操作对低层操作有指导作用,能提高低层操作的效能。 图像技术分类在图像工程的三个层次中,每个层次又包括若干个技术类别(共16个类别),如表所示。
《2D计算机视觉:原理、算法及应用》![]() 结构框架和主要内容本书选取了一些相关技术进行介绍。图像处理技术基本对应早期视觉或低层视觉,图像分析技术主要与中层视觉相关。 本书的结构框架和主要内容如图3所示。从客观场景出发到最后提取出物体信息,共分为4个模块(实线框):图像采集、图像处理(或图像预处理)、目标提取、目标分析,分别包含不同的技术(虚线框),括号中的数字对应本书的章次。附录A介绍的二值数学形态学作为一种工具可以应用于不同模块的不同技术(如箭头所示);附录B介绍的视觉恒常性主要与图像处理模块相关(如箭头所示)。 图3 本书的结构框架和主要内容 各章概况本书共有13章和2个附录。
先修基础从学习图像处理和分析技术的角度来说,以下三个方面的基础知识是比较重要的。 (1)数学知识。值得指出的是线性代数,因为图像可表示为点阵,需要借助矩阵来表达和解释各种加工运算过程;另外,统计和概率的知识也很有用。 (2)计算机科学知识。值得指出的是计算机软硬件技术,因为对图像的加工需要使用计算机,一般通过编程利用一定的算法在给定的平台上完成。 (3)电子学知识。值得指出的有两个,一个是信号处理,因为图像可看作1D信号的扩展,图像处理是信号处理的扩展;另一个是电路原理,因为最终要实现对图像的快速加工,常常需要使用一定的电子设备和器件(包括特殊的硬件)。 本书是以计算机视觉入门图书的定位来编写的,主要目标是介绍2D计算机视觉(对应图像处理和分析)的基本原理、典型方法和应用技术,一方面,可使读者能据此解决实际应用中的具体问题;另一方面,可为读者进一步学习和研究3D计算机视觉(更接近图像理解)打下基础。 |
|
来自: 新用户0118F7lQ > 《文件夹1》