高光谱成像仪作为一种新型的无损检测技术,不仅可以获得样本的光谱信息,还可以获得被测物体的图像信息,因此具有空间可识别性、超多波段、高的光谱分辨率、光谱范围广和图谱合一等众多优点。本文对高光谱成像仪高光谱图像数据的现实及处理分析方法做了介绍。
高光谱成像与以往常规的光学成像不同,高光谱图像数据也不同于常规二维结构的图像数据。高光谱图像数据是一个三维的数据立方体,该数据立方体不仅含有常规图像数据的二维空间维信息,还同时拥有数十、成百、上千连续波段的光谱维信息。为了更形象直观的认识高光谱数据立方体,也为了更清晰的表达高光谱图像数据立方体的细节特点及其总体特征,我们将高光谱图像数据立方体构成简化为下图坐标系中所示。
先简单定义构成高光谱数据立方体的三个坐标维度:X,空间方向维;Y,空间方向维;Z,光谱波段维。为了方便解析,我们只看立方体的表面。该高光谱数据立方体的六个表面可以分成两类:一类是空间维X与另一空间方向维Y所构成的二维空间平面,如平面OXY,这类平面的图像与常规的图像结构相同,表达目标的空间分布信息,可以是一个黑白灰度图像,也可以是红绿蓝三波段合成的彩色图像;另一类则是空间方向维与光谱波段维Z 所决定的平面,如平面OXZ和平面OYZ,这类平面图像与常规图像不同,它反映的不再是目标普通特征中的二维空间分布,而是目标在某一条直线上的光谱信息分布。
高光谱图像数据立方体这种独特的三维结构为高光谱成像技术应用的普及做出了极大的贡献,同时这对数据处理技术的要求也越来越高。一方面,通过这种独特的数据表达方式,人们可以从目标图像的对应像元中提取出对应目标物的光谱曲线,这也使得高光谱数据所含有的信息量远远大于常规光学图像数据,这种海量信息内涵的高光谱数据记录了目标物的更多样更细致的理化特性,对目标物的识别提供了更巨大的潜力。另一方面,以海量信息和特殊的数据结构为基础的高光谱数据立方体,在数据处理、信息提取分析和分类等方面向人们提出了更为严峻的挑战,也要求人们从光谱维去理解和揭示地物在空间维度上表现出来的物理特性及其变化。因此,在常规以几何距离和高度为表征的二维和三维空间图像的处理与分析方法的基础上,引入光谱维的处理和分析技术就成为未来技术发展的必然。
高光谱数据(又称成像光谱数据)包含了目标表面的空间分布、辐射强度和光谱三重信息,是一种三维数据,故又称为光谱图像立方体。空间维的每一个单元称为像素或像元,对应空间位置;辐射强度则反映了探测器接收到光的强弱;光谱维的每一个单元称为波段,对应波长范围。
从高光谱图像的每一个像元中可以得到一个连续的光谱曲线,通过采用基,于光谱数据库的光谱匹配技术,可以识别出地物。同时大多数地物都具有典型的光谱波形特征,尤其是光谱吸收特征,这些特征与地物成分是密切相关的,因此对光谱吸收特征参数(波长位置、深度和宽度)的提取将成为高光谱信息挖掘的一个主要方面。
高光谱图像的特点主要有以下几个方面:
1.纹理丰富复杂,空间相关性低于普通图像。例如高光谱图像的分辨率为几米时,其相应的地面目标可能只占几个像素,像素值的连续性较差,相关性较低。
2.图像信息具有多维性。人们可以得到任何波段上的图像,获得地物大小、形状和相对位置等空间信息,也可以在图像上的任何空间位置上得到一个像元的光谱特性。
3.光谱分辨率高,波段连续。常见的多光谱图像仅包含几个或十几个波段,波段宽度一般为几十到几百纳米,且谱段常常是不连续的。而高光谱图像的光谱往往由几十到几百个窄的连续波段组成,波段宽度一般在十纳米以下,且光谱曲线都是连续的。
4.相邻波段的图像之间相关性强。由于波段多,狭窄且连续,使得高光谱数据量巨大、相关性大,尤其在相邻的波段间,具有很大的数据冗余。
为了消除光散射、光程畸变和随机噪声对光谱造成的影响,在光谱数据建模前,一般使用光谱预处理技术对光谱进行预处理。平滑、求导、归一化、多元散射校正、傅里叶变换和小波变换是常见的光谱预处理方法。不同的预处理方法具有不同的作用,例如平滑可以用来降低光谱中的随机噪声;对光谱求一阶或二阶导数可以用于移除峰谷重叠和基线漂移,同时也可以根据导数的波峰和波谷选取特征波长;归一化和多元散射校正用于降低由于样本表面形状差异而带来的光散射现象;傅里叶变换和小波变换则可以把数据转换至复数域进行相关的处理。通常情况下,需要根据光谱的数据特点和具体应用选择合理的预处理方法。
光谱数据蕴含着样本的特征信息,不同特征的样本的光谱曲线差异很大。往往需要利用多元分析的方法对样本的特征进行定性或定量的分析。基于多元分类的定性分析一般用于样本缺陷的识别与提取以及安全性的定性判定。基于多元回归的定量分析一般用于样本内部品质和影响安全性的物质含量的定量分析。
高光谱图像在每一个响应波长处都有一个单色图像,庞大的图像数据大大增加了高光谱图像的采集和处理时间,同时数据存在较大的冗余,且并不是每一个波长处的单色图像都适合于检测。为了实现对样本的快速在线检测,必须挑选适合进行特定品质检测的有效图像。有效图像一般为位于特征波长处的单色图像,其选择方法等同于特征波长的选择,既可以依据原始光谱和预处理光谱曲线的波峰波谷位置进行选取,也可以通过多元分析方法进行选取。
图像处理和分析是实现样本自动检测的关键步骤。图像处理是图像分析和品质检测的前提和基础。图像处理操作的对象是图像,输出的结果则是便于品质分析的特征向量。图像处理包括图像预处理、图像分割和特征提取三个方面。