模糊ISODATA聚类结合直方图熵值算法的异常行为检测

2022.09.25

王燕妮++李军+田思敏

摘要：针对传统智能视频监控系统不能及时准确地发现危险或者发现危险不能及时报警的问题，提出一种基于模糊迭代自组织数据分析聚类结合直方图熵值算法的异常行为智能检测方法。该方法通过模糊迭代自组织数据分析聚类方法获取视频关键帧，根据分类结果采用直方图熵值法对异常行为进行判断。实验结果表明，所提算法可以对具有复杂背景的监控区域有效地实现人体的检测，并且能准确地识别出人体异常的动态行为，有效地减少了住宅小区和养老院的安全隐患。
关键词：迭代自组织分析聚类；关键帧；直方图熵值；異常行为
中图分类号： TN911.23?34 文献标识码： A 文章编号： 1004?373X（2017）12?0120?04
Abstract： Since the traditional intelligent video surveillance system can′t discover the danger accurately and send the alarm timely， an abnormal behavior intelligent detection method combining fuzzy iterative self?organizing data analysis （ISODATA） clustering algorithm with histogram entropy method is proposed. The key frame of video is acquired with fuzzy ISODATA clustering method. According to the classification result， the histogram entropy method is adopted to judge the abnormal behavior. The experimental results show that the proposed algorithm can detect the human body in the monitoring area with complex background effectively， identify the abnormal dynamic behavior of the human body accurately， and reduce the safe hidden trouble in residential district and nursing home effectively.
Keywords： ISODATA clustering； key frame； histogram entropy； abnormal behavior
住宅小区和养老院是人口比较密集的区域，那么保证区域的安全性就很重要。现阶段智能视频目标识别算法大多采用SVM[1]或者隐马尔科夫模型[2]算法，两种算法可以达到一般实时性要求，但很多情况下还是出现遗漏或者误捡，使得识别准确率不高，不能及时阻止危险行为的发生或者发生危险行为不能及时地提醒相关人员。因此，本文提出一种新的智能视频监控[3]系统，可对异常行为进行实时监控并及时报警，有效地降低误检和漏检概率，减少大量的人力，保障社会秩序的稳定。
目前许多研究使用基于统计学习算法对人体运动行为进行分类，需要对大量样本标注，且需建立复杂的操作模型。Ballan等定义一种新的局部描述子[4]，用图像梯度和光流分别进行建模来表示区域兴趣点的人体外观和动态信息，用半径聚类方法来生成视觉码本，使用投票统计方法来分类人体行为。文献[5]提出一个新的时空背景的兴趣点分布特征对人体行为分类。文献[6]研究如何从少数的视频帧中分类人体的行为，并取得很好的分类效果。文献[7]利用人体行为的关键姿态建立HMM模型，训练动态信息。本文分析基于视频人体行为的特点，从当前需要解决的影响人体行为识别发展的几个关键技术出发，提出一种基于模糊ISODATA聚类[8]结合直方图熵值的异常行为检测算法。
1 人体目标提取和分类
1.1 混合高斯模型的运动目标提取
背景减除法首先是分析采集到的视频图像在时间轴上的关系序列，利用视频图像的关系序列分析场景的变化模式，从而建立监控场景的数字模型，最后通过当前输入的视频图像与场景背景的数字模型的对比，结合实践差分运算、二值化运算和形态学处理方法，采用阈值化技术实现运动目标的提取。
室外场景的背景构建受天气状况、监控环境光照亮度和摄像机的自身运动影响会发生相应的变化，因此本文采用混合高斯分布模型[9]对视频进行目标检测。其不仅具有很好的抗噪性，而且对动态场景有很好的适应性。混合高斯模型的运算框图如图1所示。
1.2 关键帧提取和分类
使用传统的视频采集方法难以解决视频数量成几何级数增长对视频分析和理解造成极大困难问题，因此需要寻求有效的视频采集方法将有用的视频数量从海量的视频中查询出来，其中基于关键帧[10]的视频分析方法是非常有效的途径之一。
为了提高基于视频的人体行为分类效率，本节采用ISODATA聚类方法提取视频中的关键帧。
视频关键帧的数目需要根据内容的变化程度来确定，通常内容变化较大的视频需要的关键帧数也较多。相对简单的人体行为可以通过视频序列中的几个关键帧实现人体行为的分类与识别。人体轮廓信息的最小矩形高宽比会随着时间周期性变化，因此，在一个周期内，高宽比函数的极值点对应的帧可近似看作为关键帧。对于躺下、摔倒等非周期的人体行为，因为运动姿态本身原因或者噪音干扰，使相邻的数帧内出现多个小的极值，为了获得更准确的关键帧，需要利用有效的聚类算法进行处理。
根据人体目标二值图像计算轮廓高宽比如下：
式中：H（t）为人体外接矩形的高度；W（t）为人体外接矩形的宽度；R为高度与宽度的比值。人体行为的高宽比与关键帧关系具体如图2所示。本文中主要针对周期性较强的人体行为提取关键帧，因此可以利用人体行为高宽比以及相应的不变矩[11]作为特征，通过聚类方法获取视频关键帧。为了获取人体行为视频的关键帧，采用ISODATA聚类算法。因为ISODATA算法属于无监督分类算法[12]，是K均值算法[13]的一种改进，不需要先验知识，由迭代运算来确定聚类中心。
普通ISODATA聚類方法的初始聚类中心大多数都是任意选取的，使聚类结果具有很大的偶然性和聚类时间的不确定性。通过事先设定若干迭代参数，再随机选择或设定初始聚类中心和聚类数，用相似度准则[14]实现自动 “分裂”及“合并”，达到预期的聚类效果。因此，本文采用模糊ISODATA聚类方法，因其能够自动确定聚类数目和初始聚类中心，避免了初始聚类中心选择的随机性和盲目性。
1.3 模糊ISODATA聚类算法一般步骤
1.4 关键帧提取实验结果
采用模糊ISODATA聚类方法来获取视频的关键帧，其中实验中的两种行为的关键帧数量见表1。
2 异常行为检测分析
本文采用直方图熵值来作为人体不同行为的判别总特征，完成异常行为的分析[15?16]。直方图发生扭转、平移时不会改变行为特征的基本特性，比较好地反映出人体运动变化[17?18]。本文将行人的运动方向作为行为特征，将直方图按照分类好的特征的取值范围划分为固定个数、大小相同的区间，再将提取到的个体行为特征投影到与之对应的直方图区间中。根据文献[19]原理，人体行为发生异常时，人体运动方向变化、运动幅度差别较大，可推出其所对应的直方图的分布很均匀；相反，人体正常行走时，行人在一定时间内运动方向大致类似、运动幅度差别不大，其直方图特征会集中分布到某个区间上，因此根据两者的直方图特征可迅速直观地判断出人体的异常行为。直方图模型为：
3 实验结果及分析
文中对摔倒和奔跑两种异常行为进行检测。一个异常行为持续的时间一般为1～2 s，对人体运动视频进行ISODATA聚类，分别获取两种行为的关键帧数。实验数据见表1。视频帧率为25 f/s，分辨率为320×240。针对三种异常行为做了大量测试，包括正常行为以及异常行为的几种常见情况。
（1）为了更加直观清晰地观察正常和异常情况下所提取的直方图特征熵值的区别，绘制出不同行为的特征直方图，如图3所示。
图3（a）～图3（c）为一个场景内正常行走、摔倒和奔跑的三种行为，图3（d）～图3（f）为对应场景图像中提取出来的特征直方图。图3（a）中行人正常行走，速度和方向在一定时间内变化不大，相对应的特征直方图分布就集中在一个区域。图3（b）和图3（c）是发生异常行为，因为人体的速度和方向都会发生不同程度的变化，且杂乱无章，所以导致特征直方图在各个区间上的分布相对比较的均匀。由实验可知，本文所述方法提取出的特征直方图能够在不同场景、不同光照的视频中明显区分出正常和异常行为。
（2）为了更加清晰地观察正常和异常情况下提取的直方图熵值变化，绘制了一段视频中直方图熵值变化曲线，如图4所示。
图4为一段视频的直方图熵值变化曲线，该视频共690帧，第618帧之后发生异常事件。其中，黑色表示检测的结果是正常行为，红色表示检测的结果是异常行为。从图4可看出，随着行为从正常到异常发生变化，人体行为越来越不规则，熵值呈上涨之势。在600帧后，人体离开摄像头，基于模糊聚类方法的直方图熵值识别法，能够准确地识别出异常行为发生的时间。
（3）为了反映阈值T的变化对识别效果的影响，对不同阈值下的识别结果做了比较，如表2所示。
表2 异常行为识别效果
表2为随着熵值阈值T取值的变化，基于模糊ISODATA的异常行为识别算法的检测结果。表2中，p代表识别出异常行为的概率，e表示正常行为误捡为异常行为的概率。由表2可知，正确识别率随着阈值T的增加，先提升后下降，当T取值0.8时识别率最高，为97.86%。而误捡率随着阈值T的不断增加却变得越来越小，直至降为0。
（4）为了比较本文方法和SVM[11]算法绘制出AUC异常行为曲线图如图5所示。图5为本文算法和SVM算法对异常行为识别效果的AUC（Area Under roc Curve）曲线图，可以看出，SVM算法的识别效果较低，AUC为0.87。而本文算法之别率较高，AUC接近1。因此，基于模糊ISODATA聚类的直方图熵值识别算法的效率比SVM更高。
4 结语
针对经典智能视频人体异常行为识别算法识别率不高和算法局限性，提出一种模糊ISODATA结合HOG熵值算法的人体异常行为识别方法。通过多次实际实验，有效地解决了非线性运动的误跟和丢跟现象，对拍摄场景目标发生异常行为有较高的识别率，满足实时性要求。
参考文献
[1] TAX D M J， DUIN R P W. Data domain description by support vectors [C]// Proceedings of 1999 European Symposium on Artificial Neural Networks. Brussels： [s.n.]， 1999： 251?256.
[2] 朱旭东，刘志镜.基于主题隐马尔科夫模型的人体异常行为识别[J].计算机科学，2012，39（3）：251?255.
[3] MOON H M， CHAE S H， MOON D， et al. Intelligent video surveillance system using two?factor human information [J]. Telecommunication systems， 2013， 52（4）： 2249?2257.
[4] BALLAN L， BERTINI M， BIMBO A D， et al. Effective codebooks for human action representation and classification in unconstrained videos [J]. IEEE transactions on multimedia， 2012， 14（4）： 1234?1245.
[5] WU X， XU D， DUAN L， et al. Action recognition using context and appearance distribution features [C]// Proceedings of 2011 IEEE Conference on Computer Vision and Pattern Recognition. Rhode Island： IEEE， 2011： 489?496.
[6] SCHINDLER K， VAN GOOL L. Action snippets： how many frames does human action recognition require [C]// Proceedings of 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage： IEEE， 2008： 1?8.
[7] FENG X L， PERONA P. Human action recognition by sequence of move let code?words [C]// Proceedings of 2002 IEEE International Symposium on 3D Data Processing Visualization and Transmission. Padova： IEEE， 2002： 717?721.
[8] RAVI T V， GOWDA K C. An ISODATA clustering procedure for symbolic objects using a distributed genetic algorithm [J]. Pattern recognition letters， 1999， 20（7）： 659?666
[9] 黄鑫娟，周洁敏，刘伯扬.自适应混合高斯背景模型的运动目标检测方法[J].计算机应用，2010，30（1）：71?74.
[10] 瞿中，高腾飞，张庆庆.一种改进的视频关键帧提取算法研究[J].计算机科学，2012，39（8）：300?303.
[11] 傅明，易昂，唐贤瑛，等.一种基于不变距和PNN分类网络的图形识别方法[J].交通科学与工程，2003，19（1）：11?14.
[12] 李全栋，陈树越，张微.一种改进的无监督聚类的关键帧提取算法[J].应用光学，2010，31（5）：741?744.
[13] 任江涛，施潇潇，孙婧昊，等.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学，2006，33（7）：186?187.
[14] 高山，祖辰，张道强.一种基于约束的中垂面相似度准则[J].计算机研究与发展，2012，49（11）：2283?2288.
[15] 徐火希.基于改进Mean Shift的运动目标跟踪算法[J].兵器装备工程学报，2016，37（2）：127?130.
[16] 宁倩慧，张艳兵，刘莉，等.扩展卡尔曼滤波的目标跟踪优化算法[J].探测与控制学报，2016，38（1）：90?94.
[17] 程远，李亚聪.基于相关和卡尔曼滤波的组合跟踪算法[J].探测与控制学报，2014，36（6）：63?66.
[18] 郝平.基于机器视觉的快速动态检测研究与应用[J].兵器装备工程学报，2016，37（2）：131?134.
[19] 周洁.智能视频监控中人群异常行为的检测与分析[D].宁波大学，2015.