首页 > 范文大全 > 正文

基于IPM的复杂环境下道路识别及车辆导航研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于IPM的复杂环境下道路识别及车辆导航研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:在智能车辆自主导航中,对于复杂多变道路的识别和定向,在机器视觉辅助的前提下,往往需要借助许多其他复杂的传感器进行综合定位,增加了车辆的制造成本。造成这一现状的一个重要原因,是由于透视原理所引起的视觉畸变使得我们很难对当前的路面情形作出判断。提出了一种基于色差分割的阈值算法,在此基础上使用ipm(逆透视映射)算法,将相机拍摄到的世界坐标系下的三维景物转换成其在二维平面上的投影图,以此来修复由于透射原理所造成的视觉畸变。

关键词:阈值选择 色差分割 逆透视映射 车道识别

汽车自主导航技术已成为科学研究的热点。摄像机作为一种高性价比的被动光学传感器具有广泛的应用前景。摄像机通过实时图像采集能够获取丰富的路面信息,在有合适的光照的前提下,这种信息的获取不受环境其他因素的约束,具有普适性,但由于透视原理所造成的视觉上的畸变使得我们难以从摄像机中提取到有效的信息。为了有效地将图片信息利用起来,我们首先要考虑的是消除这种误差。透视原理所带来的视觉畸变在数学上可以定性地解释为三维景象的不规则投影所造成的。为了消除这种畸变,我们从数学上将透射过程进行逆变换,将三维景象进行俯视投影。这一逆变换过程称之为逆透视映射(Inverse Perspective Mapping,IPM)[1]。

由于摄像机采集到的信息较为丰富,车道只是图像信息中的一部分,在实际环境中,如高速公路上,两旁的护栏、树木、道路边沿的白线、中间的行车标识,由于阳光产生的影子等都会被摄像机采集到。因此我们有必要对所采集到的图像进行分割,以此来区分车道、背景和道路标识等。尽管对图像的分割会造成信息的缺失,但我们对这些不同的景物的关注度也是不一样的,如车辆的影子、两旁的树木,我们并不关注它们。因此我们希望在分割的过程中尽可能地将这些无用的信息过滤掉,这样才能得到一幅相对完整的车道俯视图。

对于车道俯视图的处理,曾有学者提出基于Hough变换定性的识别方法,但是所能提取到的信息较为简单,且没有考虑到光影等其他环境因素的影响,不具备鲁棒性,因此不足以对车辆的自主导航提出指导性的意见。

基于以上因素的综合考虑,本文提出一种全新的处理算法,不仅能对车道信息进行定量提取,同时也能对车辆本身的姿态进行估计,以此来实现车辆的自主导航。

1 车道分割

车辆在行驶的过程中,周围的环境复杂多变,用单一的阈值来对图像进行分割很难达到我们想要的效果。因此我们需要一种自适应的阈值分割方法,通过图像的实时变化来对图像进行分割。

有关自适应的阈值算法,日本学者大展津在1993年最先提出Otsu算法[2]。这种算法通过统计图像整体的灰度分布,基于类间距离最大的考虑,计算出统计意义上的最佳阈值。在此基础上,又由一些国内学者进行改进,提出了二维Otsu算法[5]。该算法通过统计图像整体的灰度分布以及灰度梯度的分布,计算出最佳的二维阈值。后经过许多学者的改进[6],该算法的性能大大提升,成为现今自适应阈值分割的主流算法。这种算法最大的改进之处在于加入了灰度梯度的考虑,使得图像中一些对比度较低的部分也能被区分出来。但是在道路的分割中,由于光影、积水或者道路本身的原因导致错误分割。为了消除这种错误,本文在基于Otsu算法的前提下,提出一种新的分割方式:色差分割。

该算法的核心思想是基于路面的颜色特征进行分割。我国的车道颜色多为黑色或者灰色,即使在较为明亮的强日光照射下,也只是淡淡的泛有黄色,在RGB空间内,整体与灰色非常接近。为了强调灰色这一颜色特征,我们在YUV空间对图像的像素进行统计。

我们计算出每个像素点的(Ui,Vi),并对(Ui,Vi)发生的概率进行统计,得到关于UV空间的二维统计直方图p(U,V)。

现在我们来确定最佳的阈值分布。当(蓝差,红差)为(t,s)的时候,这组阈值将会把UV平面分成四个区域,Z0,Z1,Z2,Z3。根据色差UV的定义可知,UV都是较小的量,因此Z3在整体空间所占比重可以忽略掉。我们只考虑将Z0,Z1进行区分(我们认为在高值区域Z2和Z1是相似的,因此我们选取区分Z0,Z1,而实际上选择区分Z0,Z2所得到的结果也是相似的)。

2 逆透视映射(IPM)

逆透视映射在计算时需要考虑相机本身的参数、姿态等许多因素,导致计算十分复杂,经过相关学者的一系列简化、优化,最终得到一组切实可行、形式简洁的计算公式[3,4,7]。在这里我们先对参数作如下规定:

(1)相机所处的高度为h。

(5)图像坐标系(相机拍摄到图片的坐标系)的原点为图像的左上角,XY轴的正方向如下图所标注。

(6)世界坐标系中的原点为相机位置在地面上的纵向投影。XY轴的正方向如图4和图5所标注。

(7)所拍摄到的图像分辨率为m×n,其中m为纵向分辨率,n为横向分辨率。

(8)图像坐标系中点的坐标为(u,v),其在世界坐标系中的坐标为(x,y)。

图4 相机架设侧视图

图5 相机架设俯视图

根据以上定义,我们可以得到如下变换:

考虑到从透视图变换中俯视图会产生一对多的映射,而这种映射方式会使得转换后得到的俯视图呈现出明显的块状区域,这对我们后续的识别工作会产生不利的影响。为了使图片能够尽可能真实地被还原,我们采用从俯视图逆映射回透视图。即先寻找俯视图中点的坐标,然后去寻找透视图中对应的坐标。根据(13)~(16)式,我们可以确定所有的俯视图中的点经过以上变换,对应到透视图中的坐标均是小数,对像素点的确定就需要用到线性插值。如图6和图7所示,我们采用对应点周围的4个点的像素的平均值来代替该点的真实像素值。

图6 弯道的逆投射变换

图7 直道的逆投射变换

在本文叙述中,由于已经对原图进行了阈值分割,此时的透视图已经是一幅二值图像。因此对于逆透视映射后的图我们也希望是一幅二值图像。因此对俯视图中点的像素值我们做如下规定:如果俯视图中的点在透视图中所对应位置的4邻域中白色点的个数不少于2个,那么该点的像素值为255(这里灰度级数为256),否则该点的像素值为0。

3 车道信息提取

实际行车过程中,车道的信息集中体现在直线、弯道两个方面。其中弯道又可细分为转弯的方向以及弯道的幅度(曲率半径)。本文主要针对弯道给出定量的提取弯道信息的方法。

3.1 车道边缘提取

根据以上处理得到的图像,我们可以发现尽管道路大体上与背景分割开来,但是图像并没有我们想象中的规整。首先,在道路的中央、两旁以及道路与背景的边缘处仍然存在着部分噪点。其次,道路的轮廓也没有呈现出规则的几何直线。我们试图通过其他图像处理的手段让图像变得更为规整,但是毫无疑问这将耗费大量的计算资源,而且对于边缘区域的修补将更加困难。为了避免高难度、烦琐的图像处理,本文通过投影的方法来解决这一问题。

这种方法的核心思想是通过积分(求和)来减少背景噪声对图像的影响。将图像上白色的像素点向X轴上投影,计算每一个X上投影点的个数White(X)。尽管由于噪点的存在使得边缘并不规整,但从整体的分布情形来看,道路边缘的形状在投影图中很好地得到了体现。

3.2 弯道信息提取

首先是弯道的转向。对经过逆透射变换后所得的图像的左半部分(右半部分亦可)中黑色的点在Y轴上进行投影,计算不同Y值处黑色点的个数Black(Y)。比较图像顶部和图像底部的Black(Y)值,可以很快得到弯道的转向(如图8~11所示)。

要计算曲线的曲率半径,我们要对弯道的边缘曲线进行建模。这里,我们认为弯道的边缘曲线是一段圆弧。那么弯道的幅度(曲率半径ρ)即为该段圆弧所对应圆的半径R。根据几何关系,我们很容易得到如下关系式:

其中L表示弧长,θ1和θ2分别表示弧的两端所对应切线与X轴的夹角。

由于我们实际得到的车道边缘线经过投影处理后转化为一串离散的点列,因此我们用这些点列所连成折线的长度来估算弧长L,即

实测结果与算法性能见表1。

表1

4 结束语

本文引入逆透射变换,通过该变换将世界坐标系与相机坐标系建立了联系,使得我们可以自由地选取实施变换的范围,省去了确定路面区间的步骤。在此基础之上引入了基于色差的二维Otsu算法以及投影降噪的方法,即使在光影条件较为复杂的环境中也能对车道进行分割和提取,并最终实现对车道参数的定量计算,并且具有一定的实时性。

参考文献

[1]Bertozzi MA, FasciloiBroggi. Stereo inverse perspective mapping: theory and applications[J].Image and Vision Computing, 1997,16(8):62-81.

[2]N.OTSU. A threshold selection method from gray-level histogram[J].IEEE Transactions on Systems, Man, and Cybernetics,1979,15:62-68.

[3]曹毓.逆透视映射公式的误差分析及准确度验证[J].光子学报,2011(12):1833-1838.

[4]何援军.透视和逆透视映射[J].计算机辅助设计与图形学报,2005(4):208-210.

[5]刘健庄,粟文青.灰度图像的二维Otsu自动阈值分割法[J].电子工程师,1993(1):60-63.

[6]吴一全.改进的二维Otsu法阈值分割快速迭代算法[J].电子测量与仪器学报,2011(3):218-224.

[7]徐友春.基于机器视觉的汽车主动安全技术的研究[M].北京:清华大学出版社,2003.