首页 > 范文大全 > 正文

数字图像处理和模式识别在林业中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇数字图像处理和模式识别在林业中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:该文介绍了数字图像处理模式识别林业中的应用领域及其重要意义,详细阐述了利用数字图像处理及模式识别技术的原理和方法,并在此基础上研究了林地分类系统的算法和模型,构造了林地分类系统的检索库。通过该文的研究,初步探索了数字图像处理与模式识别在林地分类系统中的应用途径和方法,为以后进一步的实现基于数字图像的林地分类系统的打下了基础。

关键词:数字图像处理;模式识别;林地分类系统;雷达遥感

中图分类号:TN919 文献标识码:A 文章编号:1009-3044(2011)09-2133-03

1 数字图像处理和模式识别概述

数字图像是指由被称作象素的小块区域组成的二维矩阵。对于单色即灰度图像而言,每个象素的亮度用一个数值来表示,通常数值范围在0到255之间,即可用一个字节来表示,0表示黑、255表示白,而其它表示灰度[1]。如图1所示:

数字图像是对二维连续光函数进行等距离矩形网格采样,再对幅度进行等间隔量化得到的二维数据矩阵。采样是测量每个象素值而量化是将该值数字化的过程。

数字图像在本质上是二维信号,因此信号处理(以一维信号为对象展开的课程)中的基本技术(如FFT)可以用在数字图像处理中。但是,由于数字图像只是一种非常特殊的二维信号,反映场景的视觉属性,只是二维连续信号的非常稀疏的采样,希望从单个或少量采样中获得有意义的描述或特征,无法照搬一维信号处理的方法,需要专门的技术。实际上数字图像处理更多地依赖于具体应用问题,是一系列的特殊技术的汇集,缺乏贯穿始终的严格的理论体系。

数字图像处理是一个多学科交叉的领域,涉及光学、电子学、数学、摄影技术、计算机技术等众多学科,是一个高度综合的技术学科。

1.1 数字图像处理和模式识别在林业中的应用领域

模式识别诞生于20世纪20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在20世纪60年代迅速发展成为一门学科。它所研究的理论和方法在很多科学和技术领域中得到了广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。在林业中的应用,这将发展成为一个越来越重要的项目。例如:

1)编制森林分布图

森林资源调查,特别是森林经理调查要制定林业局林场的具体经营利用方案,需要绘制以林分或小班为单元的林相图。在未使用遥感资料的时期,地面测量工作占森林资源调查工作量的70%以上。使用了遥感资料,减少了大部分的地面测量工作量,为清查资源提供了正确可靠的图面资料,以便于求算森林面积。现在,在我国的森林资源调查工作中,已广泛使用航测方法编制地形图。但由于林区变化比较快,需要利用新的航空像片或者是调绘旧的航空像片进行修测补绘,而后编制森林分布图。国外林业集约经营的国家(如:德国、日本、瑞典等)开始用正射像片图代替线划图作为林业局、林场的基本图。我国测绘等部门已开始生产影像地图,这将大大地挖掘遥感信息的潜力,提高林业图件的质量,进一步满足林业生产的需要。

2)林地分类

不论是哪一类森林资源调查,也不论是哪一种调查方法都需要区划或大或小的内部相对同质的单元。这种单元在森林资源清查中根据林分类型、树种、龄级、郁闭度等因子进行划分;在土地利用中则根据地貌、土地利用类型等因子来划分。航空像片上都能够反映地物细部,所以按照林业区划所要求的因子比较精确地勾绘出轮廓(如森林小班),而后转绘成图。

3)森林蓄积量的判读

森林蓄积量判读除利用航空像片森林蓄积量判读样片、航空像片材积表、航空像片蓄积量表进行判读外,还可以利用航空像片小班判读蓄积与实测蓄积回归、数量化林分蓄积多元回归估测法以及卫星图像、航空像片、地面调查相结合的多阶抽样,以得到控制总体的蓄积量。

4)野外调查工作的位置图

航空像片所提供的地面信息可以作为布设目测调查点,抽样实测样点现地定位的图面依据。此外,在林业调查工作中,航空像片作为行动的向导,控制野外作业的联络图,以便用最短的行动路线和较少的作业时间,完成较多的工作量。同时,航空像片也是外业调绘工作的草图,实现小班轮廓的现地验证落实,提供内业成图的基础[2]。

1.2 数字图像处理和模式识别在林业中的重要意义

数字图像处理和模式识别在林业的应用是运用最新技术解决了林业树种分类,为进一步的发展林业提供了基础保证。

遥感技术改变了传统的林业模式,通过卫星等拍摄图片,传送到计算机专业人员那里进行分析,从而节约了社会资源,具有深远的经济意义、实用性和方便性。

从中国林业发展看,数字图像处理和模式识别是中国林业的发展方向,林业及计算机的运用的条件和技术已具备,其发展是可行的、迫切的,将为林业科技创新和六大林业重点工程提供可靠的数据分析和信息支撑平台,具体体现在以下五个方面:

1)国家越来越重视计算机在林业中的应用。

2)新时期的中国林业发展亟需运用现代化的计算机遥感技术。

3)数字图像处理和模式识别是林业计算机的重要组成部分,是林业科技信息产业发展的必然。

4)林业计算机运用是林业科技支撑体系建设的重要组成部分。科技创新很大程度上取决于数字图像处理和模式识别在林业中的贡献。

5)植被是地理环境中的重要组成部分,是反映地理环境的最好标志,且植被对于土壤是不可缺少的间接解译标志,植被还是其它许多专题遥感解译的重要参考,通过植物信息所反映的差异,还可进一步分析水、土资源,研究自然历史演变痕迹,推断地质构造背景、找矿等。

可见林地类型的识别在整个遥感图像解译中有着重要的地位[3]。

2 林地分类系统的实现

2.1 林地分类系统算法和模型

植被覆盖在土地的最表层,是遥感图像反映的最直接的信息。由于植物内部的叶绿素、水分、结构等有着特殊的光谱效应,因而在遥感图像的影像上以各种色调、色彩、形状、大小、结构来反映它的内容和特点,尤为直观,较易识别[5]。

林地分类系统和算法及模型是比较多的,在本文中将重点介绍贝叶斯决策。

基于最小错误率的贝叶斯决策:

在模式分类问题中,人们往往希望尽量减少分类的错误,从这样的要求出发,利用概率论中的贝叶斯公式,就能得出使错误率为最小的分类规则,称这为基于最小错误率的贝叶斯决策。

现举一个林地的识别例子来说明解决问题的过程。假设要识别的林地已作过预处理,抽取出d个表示林地基本特性的特征,成为一个d维空间的向量x,识别的目的是要将x分类为林地或者非林地。用决策论的术语来讲就是将x归类于两种可能的自然状态之一,如果用ω表示状态,则:

ω=ω1表示正常;ω=ω2表示异常;

类别的状态是一个随机变量,而某种状态出现的概率是可以估计的。例如,根据林地检查的大量统计资料可以对某一地区林地和非林地的比例做出估计,这就相当于在识别前已知正常状态出现的概率P(ω1)和异常状态出现的概率P(ω2)。这种由先验知识在识别前就得到的概率P(ω1)和P(ω2)成为状态的先验概率。在两类识别问题中显然有P(ω1)+P(ω2)=1。如果不做林地特征的仔细观测,只依靠先验概率P(ω1)和P(ω2)做决策,那么合理的决策就应该为:若P(ω1)>P(ω2),则做出ω=ω1、的决策;反之,则做出ω=ω2的决策。显然这是不合理的,因为在这个例子中,由于P(ω1)>P(ω2),如果仅仅按照先验概率来决策,就会把所有的林地类型都归于林地类别中。

这里,为简单起见,我们假定特征向量是一维的(即只用一个特征),d=1。在自然状态下观察的类别条件概率分布应为已知,如图2所示。

P(x|ω1)是正常状态下细胞特征观察x的类条件概率密度:

P(x|ω2)是异常状态下细胞特征观察x的类条件概率密度。

设P(ωi|x)为后验概率,则有贝叶斯公式:

可见,贝叶斯公式实际上是通过观察x(记被识别林地特征的测量)把状态的先验概率转化为状态的后验概率P(ωi|x),见图3。

这样,基于最小错误概率的的贝叶斯决策规则为:

IfP(ω1|x)> P(ω2|x)x∈ω1

IfP(ω1|x)< P(ω2|x)x∈ω2

上面的规则有4种不同的表达形式:

1)如果P(ωi|x)=maxP(ωj),则xωi;

2)如果p(x|ωi)P(ωi)=maxp(x|ωj),则x∈ωi,则x∈ωi;

3)

4)对上式l(x)取自然对数的负值,可写为:

以上4种不同形式的实质是一样的,用最后一个在计算机时可能会方便一点。

2.2 信息提取及特征分析

2.2.1 特征选取

如果要建立一个识别不同种类对象的系统,首先必须确定应测量对象的哪些特性以产生描述参数。被测量的这些特殊的属性称为对象的特征,而所得的参数什组成了每个对象的特征向量。适当的选择特征是很重要的,因为在识别对象是它是惟一的依据。

几乎没有解析方法能够指导特征的选取。很多情况下凭直觉的引导可以列出一些可能有用的特征表,然后用特征排序方法计算不同特征的相对效率。利用其结果对表进行删减,从而选出若干最好的特征。

良好的特征应具有4个特点:

1)可区别性:对于属于不同类别的对象来说,它们的特征值应具有明显的差异。举例来说,针叶林也阔叶林中叶面是一个好特征,因为针叶林与阔叶林的叶面有显著区别。

2)可靠性:对同类的对象,特征值应比较相近。例如,对树龄不同的阔叶林来说,颜色是一个很好的特征。换句话说,小树与参天大树颜色差别很大,尽管它们都属于阔叶林类。

3)独立性:所用的各特征之间应彼此不相关。树种的直径和重量属于高度相关的特征,因为重量大致与直径的三次方成正比。问题在于这两个特征基本上反映的是相同的属性,即树种的直径大小。虽然相关性很高的特征可以组合起来(例如取均值)以减少噪声干扰,它们一般不应该作为单独的特征使用。

4)数量少:模式识别系统的复杂度随系统的维数(特征的个数)迅速增长。尤为重要的是用来训练分类器和测试结果的样本数量随特征的数量呈指数关系增长。在某些情况下,甚至无法取得足够的样本训练分类器。总之,增加带噪声的特征或与现存特征相关性高的特征实际上会使分类器的分类能力下降,特别是在训练集大小有限的情况下。

实际应用征提取过程往往包括:先测试一组直觉上合理的特征,然后将其减少成数目合适的最佳集。通常,符合上述要求的理想的特征是很少甚至没有的。

参考文献:

[1] 张宏林,蔡锐.Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003.

[2] 马忠良,宋朝枢,张清华.中国森林的变迁[M].北京:中国林业出版社,1996:10.

[3] 吴中伦.中国森林[M].北京:中国林业出版社,1997.

[4] 李芝喜.林业遥感[M].森林经理教研室林业遥感组,1982.

[5] 李芝喜.林业遥感[M].哈尔滨:东北林业大学出版社,1990.

[6] 阮秋琦.数字图像处理学[M].北京:电子工业出版社,1998.