视频分析技术同其他模式识别技术的区别
模式识别技术从数据源的性质不同来划分,可分为多个不同的分支。第一个分支是针对物理数据的模式识别技术,即针对物理数据,如仪器仪表的读数、传感器返回的探测值、雷达探测到的反向波频率或相位等,进行分析,以便获得不同的结论,如设备或系统工作是否正常,是否有异常事件发生等。这一分支是模式识别技术最初的研究对象或形式。
第二个重要的分支是对图像数据的模式识别技术,包括对灰度图像、彩色图像等,当前的模式识别技术在图像分析领域已取得十分巨大的进步,获得许多非常有实用价值的研究成果或技术,这也是当前模式识别技术最为人所熟知的研究领域。针对图像数据的模式识别技术根据图像内容的不同,又分为了许多小的研究课题,如指纹图像的识别、文字图像的识别、虹膜图像的识别、人脸识别、车牌识别等,都已在实际工程中得到广泛的应用。它们的最大的特点是对单张图像的内容提取和识别,以获取图像中的特定信息。而视频分析技术则是模式识别技术中的第三个重要的分支,是对于视频信号的分析识别技术。
在模式识别技术中,针对图像的识别和针对视频信号的识别从核心技术上来说有很多共通之处,因为说到底,视频信号其实就是由一系列的连续的视频帧图像组成(这里指的是已经过解码还原的原始视频信号,并不包括使用各种技术或协议进行编码后以便于传输的视频信号),但其中还是有一个关键的区别,使视频分析和图像识别具有了比较大的差异,这一区别就是:视频信号是“一系列的连续视频帧图像组成”,在进行视频分析过程中,必然要利用到多帧图像间的不同信息,并将这种信息的不同与两帧之间的时间间隔考虑在一起,从这个角度来说,视频分析技术分析的是一个“图像流”。既然是“图像流”,那么大量帧图像之间的差别及其对应的时间轴数据就是它区别于图像识别的关键。
视频分析技术在模式识别领域发展较晚,目前我们了解比较多一些的有“步态识别”和本文着重介绍的“行为检测”等课题。在这里需要多提到一句的是,有一些技术虽然其接入的也是视频信号,但由于其分析的信息对象的特殊性,仍然只能归纳于图像识别,而不能归入视频分析技术范围中,例如在车牌识别技术中,系统接入道路监控视频,通过线圈触发而截取一副帧图像,并针对其进行车牌号码的识别和提取,此时车牌识别技术仍是基于单张图像的识别,虽然接入的是视频信号,但并没有利用到多帧图像及其时间轴关系,也只能算成是图像识别的那一分支。因此,在模式识别技术中,视频分析技术区别于图像识别技术的关键即在于是否必须利用到视频“图像流”,并根据多个视频信号帧图像的排列、时间轴及其图像之间的差别来实现对视频信号中内容的自动提取。
虽然视频分析技术发展较晚,但由于当前国际上反恐形势的需要,社会公共安全得到空前重视,而应用于安防领域的视频分析技术也随之迅速发展起来,并形成相对成熟的产品,在安防领域得到部分的实际工程应用,这也算是市场需求推动核心技术研发的一个典型案例吧。
在安防行业领域内使用的视频分析技术由于其使用的环境、场景不同,具有一些区别于其他领域的独特特征,因而也有了一些较为特殊的,专用的称谓。各产品厂家出于对自己产品的宣传目的,也曾采用了一些特殊的叫法,如“行为识别”、“行为检测”、“行为分析”、“智能视频”、“事件检测”等等,但其所指的内容却还是接近的,在本文中,姑且使用“行为识别”这个词作为在安防领域内的这一技术的通称。
视频分析技术在安防领域的研究方向与应用现状
行为识别在安防领域中的应用实际上是指采用视频分析技术对视频视野范围内目标的活动进行提取和分析,获取活动目标的运动特征,这一技术通常也分为两个研究方向:
第一种研究方向是以监测目标作为一个整体,研究其整体运动轨迹,以便从其运动路线的方面来判断其是否违反了某种路线的规则,如是否侵入了某个特定的区域,是否在特定区域内徘徊,是否停止在某特定区域内超过特定长时间,是否有向左或向右转弯的倾向,是否遗留了某些物品等等,这种研究方向要研究的是目标整体在空间上的运动路线,并不关心被监测目标的局部肢体运动。举个例来说,如果以一个人为研究目标,这个人站在某处,不断地晃动手臂或是踢腿,但只要其在原地活动,以这种研究方向来说此人就是静止的。正因为如此,这一研究方向所采用的视频往往是大视野的,使目标的这种“肢体”(包括其他目标的局部部分,如一辆汽车的车门)运动能够忽略,而且不至于对目标的跟踪和运动路线的提取造成影响。
第二种研究方向是以监测目标的局部肢体的运动特征作为研究对象,判断其肢体运动的动作,并定义其肢体运动的性质,如是否在打电话,是否在打架,是否在偷盗,是否在文物上乱抹乱画乱蹬乱踏等等。由于要观察被监测目标的肢体的细节运动,因此这一研究方向所采用的视频往往是小视野的特写镜头,这也决定了通常要监测的是一个小的特定区域。这一研究方向目前较为常见的课题包括“步态识别”或“手语识别”等。
通常来说,由于肢体语言的复杂性,而且涉及到每个个体的习惯特性的不同,第二种研究方向的难度比第一种要大得多,也复杂得多。举个简单的例子,例如人打电话这个动作,每个人的姿势都不一样,而且涉及到摄像头拍摄的角度不同,遮挡的情况也大不相同,甚至于由于穿的衣服不同,遮挡现象也是千变万化,更麻烦的是,又有谁能肯定地从侧面判断出一个人到底是在打电话还是在扶眼镜呢?而对于第一种研究方向则不同,不论被监测目标的形态或性质(是人还是车辆,高还是矮),都已将其模糊地处理成一个刚体(所区别的仅仅是这个刚体的大小罢了),所关心地只是其宏观上运动的轨迹,而这种运动轨迹特征具有更明显的普遍性,更容易提取其规律并设置不同的规则。
这其实就是为什么目前在安防领域的行为识别产品大多属于第一种研究方向成果的原因,而对第二种研究方向来说,由于其研究对象的复杂性,目前还没能达到实用化程度,只有一些比较简单的研究成果,如步态识别,手语识别等,从其实用化方面来看,其发展趋势估计会以“量身定制”的方式为主,根据用户需求进行有针对性地算法优化和开发。而推出比较成熟的通用产品,用户拿过去进行简单参数设置就能用的可能性会小一些。
仅就第一种研究方向来说,由于研究开始得比较早,课题又相对简单,再加上当今国际反恐局势的催化,近几年获得了长足的进步,目前在国际上已有相关成熟产品出现,并将其用于实际工程应用,取得了较好的效果。国内在这一块发展相对落后一些,虽然有许多科研单位或有实力的企业展开了这方面的研究,但距离能用于实际工程的成熟产品还是有一定的差距。这种差距一方面表现在产品性能上,对于各种复杂的背景、光照条件下保持稳定的检测准确性国内研究成果仍有不足;另一方面则表现在产品化上,国外的相关产品已完成了产品化过程,形成较为成熟的成型产品,不论从核心处理模块的管理、管理软件的使用还是产品的二次开发支持等细节方面走在前头。与之相比,国内研究成果大部分还停留在实验室阶段,暂时只能作为一种技术模块进行销售或授权,用户使用起来也存在很多需要进一步完成的工作或需要解决的难题,产品仍然处于比较低级的水平。
视频分析技术产品的检测功能
从相关产品的功能来说(本文并不讨论各家产品的性能,因为并没有组织过比较权威的相关测试,而性能的发挥是与使用环境或方式密切相关的),虽然各家的产品功能称呼和分类都各有不同,但从实际效果来看,各同类技术的产品的功能大同小异,很多都是相似的,只不过根据用法不一样有时称呼也不同罢了。具体地来说,大多有以下一些行为
[Page](或其中数种)的检测功能:突然入侵检测:指有活动物体突然入侵到某个区域或越过某个边界,有时也称为“越界检测”、“跨越报警”等。
移动物体检测:指在某区域内发现移动物体,这种检测功能与突然入侵检测类似,但突然入侵检测更为敏感些,而移动物体检测则通常是通过一定时间确认可疑目标确实是外来移动个体时才产生报警。
游荡物体检测:指有活动物体在某特定区域范围内不断移动徘徊超过预定时间的检测,有时也称之为“徘徊检测”,这种检测的要求在于活动物体不能走出视野范围,否则会失去跟踪,无法判断前后是否同一活动物体。
静止物体检测:指本来处于移动状态的目标突然停下来,并处于静止状态超过预设时间的行为。该检测功能用在交通上可以称为“违章/故障停车检测”、“车辆遣洒检测”等。
遗留物体检测:这种功能其实是静止物体检测在公安系统的应用,主要用来检测被遗弃在公共场所的可疑物品,是反恐的典型应用。
运动方向检测:指检测朝某一特定方向或角度运动的物体。具备这种检测功能的产品较少。
运动路径检测:指检测活动物体是否沿某一路径朝某一方向运动。这是常见的检测功能,几乎各家产品都能实现,但实现的方式却各有不同,有使用绊线检测的,也有使用区域检测的。
物体消失检测:指原本处于静止状态的物体突然离开原来的位置。这也是常见的检测功能,但各家产品的称呼各不相同,例如“防盗检测”、“物体开始移动/启动检测”、“拿走物体检测”等等。
人群密度检测:对特定区域内的人群(有时也可针对车辆)的密集程度的定性检测,并非定量计数,而只是获得一个拥挤的估计值,以便于从宏观上对拥挤行为进行自动检测和报警。
烟火检测:检测是否出现有浓烟、火焰等,这种检测功能往往只有比较专业的,有应用针对性的产品才具有,通用产品具备这种功能的较少。
其他行为检测:还有一些并不常见的行为类型的检测,各家各有特色,各有卖点。
这里所提到的仅仅是从视频分析技术的角度来看,并不涉及对于当前市场上各家产品的比较分析。从总的情况来看可以得出两个结论:其一,随着研究的深入,视频分析技术已走进我们的生活,真正开始应用于工程实际;其二,当前国内技术暂时落后于国外的成熟产品,随着国外产品不断进入国内市场,一方面催生了应用需求,促进了国内技术的发展,但另一方面也给国内技术造成了很大的压力,如何加快研究速度,与市场和需求不断磨合,尽快推出属于自己的成熟产品,是摆在国内厂家面前一个严峻的课题.