首页 > 文章中心 > 计算机视觉的优点

计算机视觉的优点

开篇:润墨网以专业的文秘视角,为您筛选了八篇计算机视觉的优点范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

计算机视觉的优点范文第1篇

关键词:计算机视觉;三维测量;结构光;时间编码;相位解包裹

基于计算机视觉的非接触三维测量技术,以图形、图像为基础来恢复三维形状,具有高速高效、高度自动化、成本低廉等优点。在要求自动、在线、快速的现代工业三维测量技术中,计算机视觉三维测量技术是最为重要的发展方向。

近年来,结构光三维测量技术有了了长足的进步,取得了较多的研究成果。按照光投射图案的不同,可以分为点、线和编码结构光法。其中,点、线结构光法存在测量效率低的缺点;而编码结构光法极大地提高了测量效率,是计算机视觉三维测量技术的发展方向,但其测量准确度和分辨力有所降低。

结构光编码法分为空间编码和时间编码,空间编码具有投射图案幅数少的优点,适用于动态测量,其缺点是解码困难,测量误差增大,存在分辨率较低。时间编码方法将多个不同的编码图案按时序投射,将对应的编码图像序列组合起来进行解码,具有采样密度高、测量准确度高的优点,成为最具实用性的计算机视觉三维测量方法,但其不适用于动态测量。本文将对时间编码技术的国内外研究现状和发展趋势进行总结分析。

1 系统结构

基于计算机视觉的结构光三维测量系统,包括投影单元、图像获取单元以及数据处理分析单元。具体测量过程为:a.计算机1产生编码图案(通常是正弦条纹图案)并控制投影仪依次将编码图案投射到被测物表面上;b.计算机2控制数码相机采集由于被测物表面调制而改变形状的编码图像;c.通过分析编码图案计算包裹相位;d.采用一种适当的相位解包裹方法得到连续相位分布,这种连续相位是与被测物表面的高度变化成正比的;e. 根据数码相机和投影仪之间的位置姿态参数通过标定方法获得被测物表面的三维信息。基于计算机视觉的结构光三维测量系统的工作流程如图1所示。

2 时间编码方法

2.1 数字码

2.1.1 二进制码

二进制码是较早采用的时间编码方法,投射m幅编码图案形成2m个编码值,可将被测空间划分为2m个区域。该方法要求测量过程中测量系统和被测物位置不能有相对变化。Posdamer和Altschuler首先利用2m个简单的二进制条纹进行编码,编码图案如图2所示。

为了提高二进制编码结构光法的抗干扰能力,Minou在原来基础上发展了分时平行条纹编码技术,利用二进制码和海明纠错码结合编码,该编码具有25条编码条纹,二进制编码长度和纠错码长度分别为5和9,主要应用于深度抗噪检测系统。为减小二进制编码结构光法三维测量系统的测量误差,Trobina提出了二进制编码结构光三维测量系统的误差模型,并论证了图像中条纹的准确定位是降低误差的关键,同时也提出了两种利用亚像素技术来准确定位黑白条纹边缘的检测方法。Valkenburg和Mclvor进一步研究了二进制码条纹准确定位的方法。每幅采集的强度图像被分成17 17像素的区域,并用一个二元三次多项式对每个区域进行插值,实验结果表明,该方法对提高条纹定位准确度有所帮助。为减小被测表面反射率不一致、曲率不一致、颜色不一致以及环境光对二进制编码结构光法三维测量系统的影响,Skocaj和Leonardis提出通过增加不同照度的投射图案来克服上述局限。

准确度有很大的影响,该方法只适用于表面颜色单一的物体的测量。

2.1.2 多值码

在二进制码的基础上,通过增加灰度级数量的方法进行编码可减少投射图案数量,提高编码效率。关于多值码较有代表性的研究是Horn和Kiryati提出的一种灰度多值编码方法,用Hillbert或Peano空间填充曲线来进行编码,在特定噪声条件下找到一组灰度级最少的编码方案。实验表明该方法在较少的投射图案数量下获得了较高的准确度。相对于格雷码,多值码具有类似于二进制码缺点,即解码时若码值误判存在于高位则带来较大的解码误差。

2.2 相移法

相移法是基于物体深度变化对入射光波相位调制的一种三维测量方法。相移法测量作为一种高精度测量技术,被广泛应用于许多科学研究和工程领域的精密测量中,其突出的优点是能够测量被测表面不规则的物体。相移法发展非常迅速,在三维测量中具有一定的优势。

Grevenkamp提出了一种简单的三步相移方法来进行三维测量,投射图案是三幅相移120°的正弦条纹。该方法的优点是采样密度高,分辨率高,测量精度高,由于该方法在相位计算阶段涉及到一个耗时的反正切函数,所以处理速度比较慢。Song Zhang, Shing-Tung Yau还开发出基于2+1相移方法的可以测量动态对象的实时、三维测量系统,该方法是基于三步正弦相移方法,为了减少由运动引起的错误,把第三幅图像换成相移为90°的图像。该方法的特点是处理速度快,准确度高。Jiahui Pan等提出一种彩色相移方法,三幅正弦条纹图案分别包含在RGB颜色通道中从而形成一幅彩色条纹图案。该方法能够在一幅编码图案中承载更多的信息量,与传统三步正弦相移相比具有编码图案数量少、测量效率高的优点,但其不适用于测量表面颜色丰富的被测物,而且颜色通道之间的颜色耦合问题也会导致测量结果出现较大误差,测量准确度较低。

上述条纹测量方法在实际测量过程中存在一个共性问题,那就是获取的条纹图像是非正弦的(当使用正弦相移法时)或者不是线性分布的(当使用梯形相移法或者三角形相移法时),条纹图像中存在谐波,这将导致不可忽略的测量误差。这主要是由投影仪的伽马非线性和CCD照相机的非线性引起的,目前该问题已经引起了许多国内外研究人员的重视。

计算机视觉的优点范文第2篇

关键词:计算机视觉技术;C# ;;作物无损检测;软件设计

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)15-3640-03

数字农业和农业物联网技术作为现代农业最前沿的发展领域之一,是当今世界发展农业信息化,实现农业可持续发展的关键和核心技术。数字农业要求快速、实时、准确和定位化的获取植物生长信息,而农业物联网技术要求植物信息可实时动态感知,显然,传统的实验室测量分析和信息获取方法已经不能满足数字农业和农业物联网技术的发展要求。因此,研究和开发植物生命信息快速无损检测技术和传感仪器等软硬件平台已经成为现代农业承待解决的关键问题[1]。

目前,国内在作物无损检测方面的研究仪器主要是依赖进口,而相应的软件也是伴随着仪器而购买。此类软件,一般价格昂贵,而且在自主研究平台中,因为无法取得源代码而无法使用或升级,从而出现研究瓶颈。在各类无损化检测技术中,随着计算机视觉技术越来越广泛的应用,对应的软件系统的开发迫在眉睫[2]。

正是基于这样的背景,我们通过对目前应用比较广泛的C#进行研究,利用C#强大的数据处理能力和良好的用户界面开发,并结合强大的图像处理能力,进行作物实时检测软件平台的自主设计与开发。

1 计算机视觉技术简介

计算机视觉也称机器视觉,是采用摄像机或者数码相机将被检测图像转化为数字信号,再采用先进的计算机软件技术对图像信号进行处理,从而得到所需要的各种目标图像特征值。并由此实现模式识别,坐标计算等功能。然后再根据其结果输出数据,发出指令,再配合执行机构完成好坏筛选,位置调整,数据统计等自动化流程。与人工视觉相比较,计算机视觉的最大的优点是快速、精确、可靠,以及数字化。

随着数字农业和农业物联网技术的发展,计算机视觉技术将越来越广泛的应用于农业生产中,而构成计算机视觉系统的软件系统是整个计算机视觉系统的灵魂。随着硬件技术的不断发展完善,计算机视觉系统其功能是否强大,可以说完全取决于软件系统的能力。

2 软件系统设计

2.1 C#与

C#是由微软公司开发的一种面向对象的新型编程语言,它是从C和C++ 中派生出来的,保留了C/C++原有的强大功能,并且继承了C/C++的灵活性。同时由于是MicroSoft公司的产品,它又同Visual Basic一样具有简单的语法结构和高效的开发能力,可以使程序员快速的编写出基于.NET平台的应用程序。

一个基于C#框架,专门为C#开发者和研究者设计和开发的,这个框架提供了丰富的类库资源,包括图像处理,神经网络,模糊系统,遗传算法,人工智能和机器人控制等领域。该框架架构合理,易于扩展,涉及多个较前沿的技术模块,为相关开发人员或科研人员的工作提供了极大的便利。本系统就是采用C#程序设计语言,通过调用该框架来实现作物无损检查系统的开发。

2.2 系统设计与实现

本软件系统是在数码相机拍摄的作物图像的基础上,采用图像处理方法进行特征提取与分析,从而实现作物的无损检测。主要分为图像输入,图像预处理,特征提取,特征分析几个模块。

1) 图像输入

将要分析处理的图像读取到系统中来,为后面图像处理作准备。C#提供了三个最重要的图像处理类,即Bitmap类、BitmapData类和Graphics类。三种图像处理的方法,即提取像素法、内存法和指针法。从执行效率和实现难度综合考虑,本系统的开发采用内存法。

2) 图像预处理

图像预处理主要包括图像的大小调整,形态矫正,平滑和去噪等,以降低环境对拍摄照片造成的不利影响。提供了多个类,可以对图像进行平滑去噪等操作,本系统中采用了中值滤波算方法,对应中的Median类。

3) 特征提取

特征提取分析,是整个系统的核心所在,需要选取合适的图像分割算法,对图像进行处理,提取目标区域,为特征分析作准备。在本系统中采用了阈值分割技术,因为这种算法相对来说比较直接并且易于实现。

采用阈值分割技术,首先,必需确定一个阈值作为图像分割的阈值,在本系统中,采用自适应阈值法,由用户在软件的操作过程中进行设定,并且可以根据需要进行调整。然后,根据这个阈值对图像进行分割,并将其转化为二值图,如图(b)所示。从图中我们可以看到二值图像中存在大量的小孔,这种太小的孔洞对我们进行图像分析没有实际意义,并且会干扰结果的正确性,因此我们需要采用腐蚀和膨胀的形态学方法来进行填充孔洞,结果如图(C)所示。最后,我们需要根据需要提取目标区,涉及到连通区域的提取问题。最后,输出结果。

4) 特征分析

对图像分割结果进行分析,用于指导生产实践。我们可以对通过图像处理得到的目标区域进行分析,比如可以根据叶片颜色的变化判断叶绿素含量,进而推算出作物的营养状况,根据色素区域的大小计算出叶面积,根据不同区域的形状、大小判断病虫害等。

3 实验结果及分析

软件运行后主界面如图3所示。

为验证本系统的有效性,我们通过设定不同的阈值进行图像分割,并跟photoshop cs4软件中魔棒的工具作对比,来提取图片中的目标区域。测试图片大小为800px×610px,取特征点坐标P(310,70),该点的RGB值为(29,92,0),获取目标区域的总像素和绿色分量平均值,数据如表1所示。

从上述表中我们可以看出,本软件在图像处理目标区域的提取方面,提取到的目标区域较photoshop 提取的小,绿色分量平均值较photoshop更接近特征点数值,由此看出用本软件做图像分割准确性更高。

4 结束语与展望

计算机视觉具有非破坏性、快速、高效、信息量大等特点,目前已在主要的农作物和经济作物的养分诊断,植物病虫害的快速检测及预警预报等方面有了广泛应用,取得了较好的效果。随着计算机视觉技术和图像处理技术的发展,计算机视觉技术将更多的应用于植物长势预测、产量估计等方面。

通过本次研究,开发了一个交互界面良好的色素分量检测系统,能对图像在RGB分量上实现阈值分割,并实现目标区域的获取分析。该文主要提倡一种软件开发的理念,所设计开发的软件的针对性较强,还存在着很多的局限和不足,要作为计算机视觉类的通用软件,系统的稳定性和功能都还有待进一步提升。

参考文献:

[1] 刘飞.基于光谱和多光谱成像技术的油菜生命信息快速无损检查机理和方法研究[D].浙江:浙江大学博士学位论文,2011.

[2] 朱哲燕,陈红.基于MATLAB的作物信息光谱分析平台的设计与开发[J].科技资讯,2012(16).

[3] 蒋丽华.基于计算机视觉技术的叶绿素含量检测系统[D].苏州:苏州大学硕士学位论文,2009.

[4] 赵春江.C#数字图像处理算法典型实例[M].北京:人民邮电出版社,2009.

[5] 何勇,刘飞,聂鹏程. 数字农业与农业物联网技术[J].农机论坛,2012(1).

[6] 张起丽.基于数学形态学的彩色图像处理研究[D].西安:西北大学硕士学位论文,2009

[7] 冀高.基于数字图像处理的棉花群体特征提取[D].北京:北京邮电大学硕士学位论文,2007.

计算机视觉的优点范文第3篇

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。

计算机视觉的优点范文第4篇

第3期谢珺,等:机器视觉在轮胎检测领域的应用研究

(1)算法的精确性提高伴随着计算量的成倍增加,处理时间就成为了实时检测的软肋;(2)硬件的分辨率提高了,图像的分辨率、精度也随之提高了,但是数据量计算量都因此成倍增加。因此,如何保证检测的实时性和准确性,是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术

2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论,其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论,以及Richard Hartley的《Multiple View Geometry in Computer Vision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法,主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既优化了图像的视觉效果,又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域,是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点,经过分析处理以后,转换成坐标数据,然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域,机器视觉技术的应用还仅仅停留在理论之上,还没有可实际应用的商品化的设备,更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。

2.2嵌入式技术嵌入式系统一般指非PC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的,适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点应用的,它通常都具有低功耗、体积小,集成度高等特点;(2)嵌入式系统和具体应用有机地结合在一起,它的升级换代也是和具体产品同步进行的,因此嵌入式系统产品一旦进入市场,就具有较长的生命周期;(3)由于空间和各种资源相对不足,嵌入式系统的硬件和软件都必须设计,量体裁衣、去除冗余,力争在同样的硅片面积上实现更高的性能,这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSP(数字信号处理器)来进行开发,具体型号为TI公司的TMS320。它具有很高的编译效率和执行速度,在信号处理方面具有优势,它的特点如下:(1)程序和数据具有独立的存储空间,有着各自独立的程序总线与数据总线,可以同时对数据和程序进行寻址,大大提高了数据处理能力;(2)由于广泛采用了流水线操作,减少了指令的执行时间,可以同时运行8条指令;(3)与一般计算机不同,乘法(除法)不由加法和移位实现,它具有硬件乘法器,乘法运算可以在一个指令周期内完成;(4)指令周期降到了1.67 ns。随着工作频率进一步提高,指令周期将进一步缩短;(5)拥有自己独特的专门为数字信号处理而设计的指令系统;(6)相比传统的处理芯片,它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成

3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题:(1)数据处理量非常庞大;(2)如何快读匹配图像;(3)如何快速实现缺陷分割并剔除伪缺陷;(4)如何选取缺陷特征,用以实现缺陷识别。以具体产品为例,相对其他轮胎产品,航空轮胎对质量检测的要求较为严格,只要航空轮胎的检测技术到位,其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例, 根据GB/T 9747-2008《航空轮胎试验方法》、GB/T 13652-2004 《航空轮胎表面质量》和GB 15323-1994 《航空轮胎内胎》等标准的要求,研究表面缺陷在线检测的图像处理方案;开发一套基于机器视觉的产品表面缺陷的在线检测设备,同时根据GB/T 13653-2004 《航空轮胎X射线检测方法》所述,配合X射线发射仪,利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷,如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标:(1)能检测出最小直径0.3 mm的轮胎内部缺陷(即横向纵向最小均为0.3 mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率要求大于90%;(2)对缺陷部位进行定量和定位分析:读出缺陷的尺寸(误差0.5 mm),测出缺陷距离轮胎表面的深度,决定缺陷在轮胎内部的位置;(3)在线检测设备的检测检测速度与X射线管旋转速度同步,X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。

3.2研究内容和技术路线

3.2.1确定机器视觉检测系统的基本框架在数据量大时,采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中,由于航空轮胎的圆周面比较大,数据量也就比较大,通常采用的机器视觉单摄像机方式,很难满足圆周面检测分辨率高、数据量大的要求,而多台摄像机能满足分辨率和数据量的要求,却又相应带来实时性差的问题。若采用多台摄像机的方式,就需要配备多套成像系统,一套成像系统造价在10万元左右,基于成本和计算数据量的考虑,本研究选用一对一方式,利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说,就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测,该结构主要由四部分组成:服务器(嵌入式系统)、客户端(图像处理子系统)、信号模块(PLC)、输出单元。系统框架如图1所示。每隔一定的时间(系统初步设定为5 s),服务器通过PLC控制步进电机驱动轮胎做圆周转动,每转过一个固定角度(系统定为120°),服务器就调动客户端完成此区域内相对独立的视觉检测任务,一次间隔只检测轮胎的三分之一(120/360),经过3个时间间隔,客户端即完成了整个轮胎360°的全面检测,然后利用拼接原理把各部分拼接起来,统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同,然后消除不同,统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互,本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口,服务器不仅要完成检测任务的调度,还要可以设定检测参数,接收和实时显示客户端上传的图像数据和处理结果(缺陷等),并将信息存入数据库中。此外,服务器还接收PLC传来的位置检测信号,用于与客户端的同步,并且根据检测结果中的位置信号,对执行机构发出动作信号,标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡,接收服务器设置的参数和任务调度,控制采集卡和摄像机完成图像实时采集,利用图像处理算法处理和分析图像数据,将最终得到的缺陷位置和分类信息上传给服务器,保存缺陷图像以备查。

3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中,根据图像数据的特点,本研究提出以下图像处理过程:缺陷分割、特征提取及缺陷分类。首先是缺陷分割:在表面缺陷检测的时候,利用图像处理算法,处理采集到的产品表面图像,将缺陷从复杂的背景图像中分离出来。接着是特征提取:提取缺陷后,对缺陷的各种标识性属性进行提取,主要是几何特征和灰度统计特征,以保证后续的缺陷分类和识别。几何特征指的是轮廓特征,比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类:本研究采用改进的BP算法[7]对网络进行训练,构建神经网络分类器来实现轮胎缺陷分类,为了提高检测系统对伪缺陷的适应性,本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法,为避免编程中出现内存泄露进而造成计算机内存资源流失的现象,决定采用对内存进行托管的C#语言进行编程。

3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点,它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题,包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性,采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。

4结论实际测量结果证明,应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势,设备简单、易用,克服了传统测量仪器的许多误差来源,具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分(如图3所示),与传统的测量方法相比,原先需要15 min的测量时间,现在只需要15~30 s就可完成,操作也更加简单便捷。该系统可检测出最小直径0.3 mm的轮胎内部缺陷(即横向纵向最小均为0.3 mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率为96%。

参考文献:

[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉:华中科技大学,2008.

[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision,1998,27(2):161-195.

[3]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.

计算机视觉的优点范文第5篇

关键词 运动目标检测 计算机视觉 摄像机

中图分类号:TP391.41 文献标识码:A

视频运动目标检测是指在视频或图像序列中,把运动着的,人们感兴趣的目标与背景和其它运动目标进行区分。它是后续高层次视频处理和应用理解的基础,也是智能视频监控技术自动化和实时应用的关键。

从摄像机是否运动来看,运动目标检测分为静止背景和运动背景下的运动目标检测。静止背景是指在整个运动场景中,摄像机或承载平台不发生任何运动,只有目标在监控范围内运动;而运动背景是指当目标运动的同时,由于摄像机或承载平台发生了运动,而导致目标与背景共同变化。本文主要从摄像机静止状态对现有的典型运动目标检测算法进行介绍,并做了对比分析。

1帧差法

在视频图像序列中,相邻的视频流图像具有连续性,如果背景中没有运动目标,则相邻帧间的变化会很小,相反则会引起较大的变化。帧间差分法就是利用这个特性对图像序列中的连续两帧或几帧图像做差分运算来对运动目标进行检测。帧差法假设运动目标为刚性,设第k帧的图像为fk(x,y),第k-1帧的图像为fk-1(x,y),则将相邻两帧图像做差分,差分后的图像为Dk(x,y)。公式如1-1。

(1-1)

设置一个阀值T和Dk(x,y)进行比较,就可以判断出图像中各个像素点是背景还是前景,见公式1-2。

(1-2)

帧间差分法的优点是实现简单,程序设计复杂度低;易对目标进行实时监控。但是它对光照变化敏感;对帧间的时间间隔有较强的依赖性;且该算法容易产生空洞现象,只能提取出目标的轮廓边界,而不是完整的图像,从而损失一些重要的信息。

2背景减法

背景减法的基本思想是:在摄像机静止的情况下,通过对视频序列进行分析,建立背景模型,然后将当前图像和背景模型做差分,最后和预设的阀值进行比较,得到前景目标。设B(x,y)为构建的背景图像帧,F(x,y,t)为图像序列,(x,y)为图像的位置坐标,t代表图像的帧数,则背景减法用公式表示为:

(1-3)

D(x,y,t)为背景减除后的每一帧图像,对减除后的图像设置一个阀值T,就可以得到一个二值化的结果图像:

(1-4)

背景减除法原理简单,检测的速度快,理论上能够将运动目标完整地检测出来,但是在现实中场景是非常复杂的,在外界不可预见的环境干扰和噪声下,如光照的突变,摄像机的抖动,背景图像中物体的波动,场景中物体的进出等使获得与图像序列相对应的背景模型和对背景进行更新成为了一大难点。

3光流法

在视频图像序列中,光流是指图像亮度模式的一种表现运动,是三维空间中的物体速度矢量在成像平面上的投影,它表示了物体在图像中位置的瞬时变化。基于光流场的运动目标检测法,其基本原理是:由投影关系,在运动的某个特定时刻,图像上的点与三维物体上的点一一对应,给图像中的每一个像素点赋予一个速度矢量,由此速度矢量特征,就可以对图像进行动态分析。当物体和图像背景存在相对运动时,运动物体所形成的速度矢量必然和邻域背景速度矢量不同,从而检测出运动目标的位置,这是因为当图像中没有运动物体时,光流矢量在整个图像区域是连续变化的。

光流法的优点是不需要预先知道场景的任何信息,但是在对复杂场景下进行运动物体检测时,但是在对复杂场景下进行运动物体检测时,光流法具有以下缺点:

(1)光流法要得到正确的结果仅适用于梯度不变的基本条件;

(2)光流容易受外界噪声的干扰,抗干扰能力差;

(3)计算复杂,不适于应用实时很强的场合;

(4)对于面积较大且内部均质的物体内部点难以用光流矢量来正确描述。

4总结

在静止摄像机下,常用运动目标检测算法各有优缺点,表1从不同方面对各种算法进行了特性比较。

表1:运动目标检测算法比较

在摄像机静止情况下的运动目标检测算法中,帧差法是最直观也是最快的检测运动目标的方法。它通过比较连续的两帧图像,在根据比较所得到的不同之处找出运动目标。然而,如果摄像机运动时,即便在拍摄的环境中没有任何物体在移动,所获得的图像在前后两帧间也会产生较大的差异。那么帧差法将不在适用。

运动目标的检测算法各有优缺点,要根据不同的现实环境选择最适合的算法,从而准确检测出运动目标。

参考文献

[1] McKenna S.,Jabri S.,Duric Z.Rosenfeld A.,Wechsler H.Tracking groups of people[J].Computer Vision and Image understandUnderstanding.2000,80(1):42-56.

[2] 郑江滨,张艳宁等.视频监视中运动目标的检测与跟踪算法[J].系统工程与电子技术,2002,24(10):34-37.

计算机视觉的优点范文第6篇

关键词 火焰;视频识别;OpenCV;自动报警

中图分类号X959 文献标识码A 文章编号 1674-6708(2012)79-0206-02

0 引言

火灾是人类不容忽视的最严重灾难之一。通常情况下,火灾探测技术如感烟探测器、感温探测器等主要是基于传感器检测技术设计的。但在大空间场所受其跨度大、空间高的特点影响,对火灾初期产生的热量和烟雾触发报警器造成很大难度。随着安防监控科技的不断发展,火灾的视频探测成为可能,并且该技术能有效克服传统探测技术在高大空间等场合灵敏度下降的缺点,具有响应快,探测及时,信息丰富直观的优点。

1 火灾视频探测技术

火灾视频识别即通过计算机硬件或数码感光元器件对火灾发生前期的火焰等视频进行图像采集和预处理,并由计算机终端通过模式识别的方法判断监控画面中是否存在火焰或者烟气等与火灾相关的事物。基于图像处理的火灾监控方法利用了火灾刚刚发生的短时间内火焰或烟气的图像在颜色、形状、位置、面积等随时间变化的特性,从含有背景噪音的图像序列中正确识别相关信息,达到火灾监测的目的。

图1 中描述了火灾视频识别系统的硬件组成,首先通过图像收录设备摄像机B对监控现场A进行图像采集,然后通过图像采集卡C获取视频图像信息并将其进行存储,将图像信息传输给计算机D,计算机系统主要通过计算机软件对图像信息进行处理、识别,判断图像信息是否属于火灾,如果属于火灾,报警器E则会进行报警提示。

2 VC++ 6.0和OpenCV 简介

VC++ 6.0即Visual C++ Microsoft公司开发的一种具有高度综合性能的软件开发工具。用它开发出的程序具有运行速度快、可移值能力强等优点,在对数字图象进行处理时经常是采用Visua C++进行编程。

开放源代码的计算机视觉类库OpenCV (Intel Open Source Computer Vision Library )由英特尔公司开发, 它是一套可免费获得的由一些C 函数和C ++类所组成的库, 用来实现一些常用的图像处理及计算机视觉算法。采用OpenCV实现火灾视频识别可以很好的体现OpenCV运行速度快、稳定、跨平台、接口灵活、交互性强、易于产品化等特点。针对火灾的图像处理的如图像分割、特征提取、图像滤波、图像识别等技术及其相应算法目前也较成熟。

3 基于OpenCV的火灾视频识别系统

如图2为基于OpenCV的火灾视频识别系统框图,分为火焰图像获取系统、图像识别系统、火灾报警联动系统。火焰图像获取系统主要通过摄像机的光敏器件CCD,将外界影像的光信号转变为数字图像信号。然后,进入主要由计算机软件组成的图像识别系统进行图像采集、预处理、特征提取及图像识别。图像预处理即过程采用中值滤波方法抑制或消除噪声而改善图像质量的平滑过程。

4 火灾火焰的图像特征分析

在火灾发生发展阶段,对火灾现场的视频识别主要是基于火焰图像的基本特性来实现的。火灾是一种失去控制的燃烧,初期火灾的火焰是从无到有是非固定的,不同发展阶段火焰的面积、形状、尖角、颜色、频闪等都存在一些视觉特征。

1)面积变化:早期火灾是着火后火灾不断发展的过程。在这个阶段,火灾火焰的面积呈现连续的、扩展性的增加趋势。在图像处理中,面积是通过取阈值后统计图像的亮点(灰度值大于阈值)数实现的。当其它高温物体向着摄像头移动或者从视野外移入时,探测到的目标面积也会逐渐增大,容易造成干扰。因此,面积判据需要配合其它图像特性使用;

2)边缘变化:早期火灾火焰的边缘变化有一定的规律,同其它的高温物体及稳定火焰的边缘变化不同。精确的方法是用边缘检测和边缘搜索算法将边缘提取出来,根据边缘的形状、曲率等特性对边缘进行编码,再根据编码提取边缘的特征量。利用这些特征量在早期火灾阶段的变化规律进行火灾判别;

3)形体变化:早期火灾火焰的形体变化反映了火焰在空间分布的变化。在早期火灾阶段,火焰的形状变化、空间取向变化、火焰的抖动以及火焰的分合等,具有自己独特的变化规律;

4)闪动规律:火焰的闪动规律,即亮度在空间的分布随时间变化的规律,火焰在燃烧过程中会按某种频率闪烁。在数字图像中就是灰度级直方图随时间的变化规律。

5 视频序列的运动检测

视频监控场景中多数物体在固定摄像机下所采集的视频序列是静止的,但火焰呈现的则是运动特性。

视频监控中的运动检测就是在视频序列中不断发现并提取运动目标,实时跟踪它们并计算出其轨迹,为下一步特征分析等提供数据。

目前,目标检测和提取算法分为帧间差法、背景差法、高斯模型法及光流法等。

运用OpencCV函数对火焰图像进行灰度化处理,主要函数:gray=cvCreateImag(cvGetSize(m_image),8,1);cvCvColor(m_image,gray,CV_BGR2GRAY)效果如图3。

进行二值化处理,加快处理速度并能将火焰与背景分开,主要函数:cvThreshold(gray,gray,0,255,CV_THRESH_OTSU) 效果如图4。

运用canny算法进行边缘检测,突出纹理信息,主要函数:cvCanny(gray, edge,(float)edge_thresh,(float)edge_thresh*3, 3) 效果如图5。

6 结论

通过对实验火焰视频图像的采集,运用OpenCV库函数对图像进行灰度化处理、二值化处理以及火焰的边缘检测,验证了OpenCV库函数在火焰图像预处理、特征提取及边缘检测上的可行性和准确性,为后期判定火焰的存在打下良好基础。

参考文献

[1]刘瑞祯,于仕琪.OpenCV教程—基础篇[M].北京:北京航空航天大学出版社,2007.

计算机视觉的优点范文第7篇

关键词:图像分割算法 PDE 活动轮廓算法

中图分类号:TN976 文献标识码:A 文章编号:1007-9416(2016)11-0125-01

1 引言

计算机视觉领域和图像处理问题的一个关键问题就是图像分割,图像分割的有效性将决定着后期的图像处理能否顺利进行,因此研究图像分割一直是广大学者的重要课题。

图像分割目的是把图像分成各具有特征的区域并提取出感兴趣的部分,它是图像处理到图像图像分析的关键步骤,是一种基本的计算机视觉技术,只有在图像分割的基础上才能对目标进行特征提取和参数测量,使得更高层的图像分析和理解成为可能。因此对图像分割方法的研究具有十分重要的意义。图像分割的数学描述如下:

已知整个图像区域,将分割成个非空子集(或子区域)、,…,,并且子区域、,…,满足以下几个条件:

(1);

(2);

(3);

(4);

(5)是连通的区域。

2 常用的图像分割算法

目前,对图像进行分割,算法有上千种,但常用的算法为以下的几种:

(1)阈值分割法:阈值分割法根据图像的亮度与设定的阈值进行比较,把大于阀值的像素分割出来,小于阀值的分割为另一类。它一般包含两个步骤,一是设定图像的灰度阀值,二是将每个像素与这个阀值进行比较,进而分类分割。这个算法只对灰度有明显差异或者渐变的情形适用。

(2)基于边缘检测的分割算法:这种算法设定一个跟原图像规模一样大的模板,然后将它们进行卷积运算,从而分割图像。边缘检测分割算法,又可以分为Roberts、Canny、Sobel、Prewitt四种算子分割算法。边缘算法对边缘的特征要求非常严格,当边缘模糊或者渐变的时候,此算法就不能再用。

(3)基于区域特征提取的分割算法:这个算法就是将区域的有效特征提取出来,从而对图像进行分割。区域增长法、区域分裂合并法等都属于特征提取分割算法,其优点是抗噪音性强,缺点是有时会出现过度分割。

3 基于PDE的图像分割算法

由于数学工具或方法的提出,产生了新的优秀算法。偏微分方程由于其特有的数学严密性,在图像分割上起了很大的推动作用。目前,基于PDE的图像分割方法引起了很多学者的重视。一般的主流算法有以下的几种:

(1)通过分析图像,构建图像的Snake模型,然后得到能量模型的极值,建立Euler方程。

(2)根据图像的特点建立相应的PDE,构造图像分割的掩模。

基于PDE的图像分割算法因为其特有的严密的数学框架,具有以下的优势:

(1)PDE建立的图像模型一般是连续的,进而可以对图像进行滤波。利用网格进行离散,使得图像的分割变得容易。

(2)以封闭的曲线为基础,最终图像分割结果可以达到亚像素的精度。

(3)水平集方法可以得到精度更高的分割结果,避免由于目标的合并与分离导致的拓扑结构问题。

基于PDE的图像分割算法的经典模型是活动轮廓模型,该模型又可以分为三类:

(1)基于边缘的活动轮廓模型,该模型通过人工事先设置某些参数,使得它的应用变得有限。

(2)基于区域的活动轮廓模型。该模型可以分为两小类,一类是模糊边缘活动轮廓模型,一类是局部二值拟合模型。

(3)混合的活动轮廓模型。该模型融合了图像的边缘信息和区域信息,使得分割的精度大大提高。

4 结语

图像的分割到目前仍是一个难题,其初始参数的设置是个开放性问题,目前初始化一般将初始曲线置于目标附件就可以。由于目前尚无通用的分割理论,因此没有一种适用于所有图像的分割算法。目前的研究方法都是针对具体问题而采用不同的分割算法,有待解决的问题有以下几个方面:

(1)如何根据不同的图像选择不同的、合适的分割算法。

(2)寻找运算速度快、精确率高的图像分割算法也是一个热点,算法的运行时间是一个问题。

(3)新方法、新概念的引入和多种方法的综合应用,应重视将各种分割算法综合起来。

参考文献

[1]杨晖,曲秀杰.图像分割方法综述[J].电脑开发与应用,2005(03).

计算机视觉的优点范文第8篇

0 引言

从X光图像分析识别出铸件或其他产品内部缺陷的应用越来越多,产品不同结构形成的x射线图像

>> 基于视觉特征的图像聚类方法研究 基于特征的图像网格生成方法 基于计算机视觉的构件表面缺陷特征提取 基于加权特征空间信息视觉词典的图像检索模型 一种基于小波变换的墙地砖缺陷图像特征提取方法 铸件缺陷的检查与修补 基于图像缺陷分割技术的综述 图像中轮廓结构的视觉特征研究 浅谈铸件疏松和超声波检测的优点 基于文本区域特征的图像型垃圾邮件过滤算法 论城市视觉形象的生成与特征 铸件缺陷无损检测方法的研究现状分析 消失模铸件的常见缺陷及对策 基于互补特征的纹理图像检索 基于颜色特征的图像检索技术 基于局部特征的智能图像融合 基于联合特征的图像检索 基于纹理特征的道路图像分类 一种基于图像特征的图像分类方法 基于机器视觉的瓷砖缺陷检测机构 常见问题解答 当前所在位置:中国 > 科技 > 基于定性视觉特征的铸件疏松型缺陷图像生成 基于定性视觉特征的铸件疏松型缺陷图像生成 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者:未知 如您是作者,请告知我们")

申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 0 引言

从X光图像分析识别出铸件或其他产品内部缺陷的应用越来越多,产品不同结构形成的x射线图像与缺陷识别算法密切相关,算法的有效性鲁棒性的调试检测因而需要大量待测产品图像样本。在产品质量较好的情况下。获取大量带缺陷样本通常需要一个较长时期。由于算法测试需要在产品批量检测之前进行,这使得样本更加难以获得。通过仿真缺陷并叠加至产品图像的方法获取样本很早便受到关注,并长期基于计算机辅助画图(CAD)软件技术:一方面可以对包含缺陷的工件整体仿真;另一方面则是上述的缺陷图像叠加。利用cAD软件除了其计算量太、模型计算复杂,还有一个较大的局限是缺陷生成的随机性差,cAD需在确定模型的基础上形成缺陷,模型的产生因此成为瓶颈技术。从实际生产看,基本上每个产品所存在的缺陷都不相同,因此缺陷的仿真,更确切地说应该是生成,就不是对某个具体对象的模仿和逼近,而应在视觉上符合缺陷的定义,在缺陷图像生成算法中满足其特征的统计数值范围。