足球比分直播

基于混合特征的行人检测算法分析.pdf

返回
基于混合特征的行人检测算法分析.pdf_第1页
第1页 / 共73页
基于混合特征的行人检测算法分析.pdf_第2页
第2页 / 共73页
基于混合特征的行人检测算法分析.pdf_第3页
第3页 / 共73页
基于混合特征的行人检测算法分析.pdf_第4页
第4页 / 共73页
基于混合特征的行人检测算法分析.pdf_第5页
第5页 / 共73页
点击查看更多>>
资源描述:
东北大学硕士学位论文 摘要基于混合特征的行人检测算法研究摘 要随着社会生活的日益丰富多彩,机场、商场、社区等各类公共场所对于行人检测技术的需求愈加强烈。行人检测技术是利用计算机强大的计算能力在图像中识别出行人目标,由于背景复杂多变、行人服装饰物各不相同、行人姿态各有差别、光线明暗变化等因素的影响,如何准确且快速地检测出行人仍是目前研究的热点问题。在该领域内,当前主流的算法是利用特征描述子提取行人特征,通过机器学习的方法训练分类器,再使用分类器来识别行人目标,本文中就是采用了这种方法实现行人检测技术。本文的主要工作集中在特征描述子与分类器两方面。通过对各类特征描述子的对比分析,采用由Dalal和Triggs提出的描述能力强的梯度直方图特征。针对梯度直方图特征计算量大、特征维数过高、没有利用图像的纹理信息等缺点,采用图像金字塔模型与熵信息组成一种新的混合特征,实现对图像的降维处理与纹理信息的利用。在分类器上,本文选择分类速度快、结构简单的支持向量机。目前常用的支持向量机都是线性核支持向量机,分类速度较快但是其检测率稍差。而非线性核支持向量机具有较好的检测率但是稍慢的分类速度限制了它的应用。针对这个问题,采用交互核这种非线性核实现了与特征相对应的分类器,并在交互核的基础上实现了一种加法核以及与其相对应的分类器。这两种分类器在保持非线性核较强分类能力的基础上,还具备了线性核的分类速度。最后,将塔式梯度直方图特征、熵特征组合的混合特征分别与交互核支持向量机、加法核支持向量机相结合,提高行人检测算法性能。本文在INRIA行人库上训练分类器,测试算法性能,通过DET曲线与ROC曲线对比检测结果。实验结果表明,本文的行人检测算法取得了较高的检测率与较快的检测速度,即使在复杂背景、行人多姿态、小范围遮挡的情况下也具有较好的检测性能。关键词行人检测;梯度直方图特征;特征描述子;支持向量机;核函数.III.万方数据东北大学硕士学位论文 摘要万方数据Research of the Pedestrian Detection AlgrithmBased on the Hybrid FeaturesAbstractWith the increasingly rich and colorful of the social life,the pedestrian detection inpublic place is required intensively such as airport,station,market,residential community andSO on.Pedestrian detection aims at detecting pedestrian using calculating power of computers.Because of the complexity of the background,light intesity,pedestrian clothing decorationsand pedestrian postures,detecting pedestrian accurately and quickly is still a hot issue of thecurrent research.In this area,one of the famous algrithms uses feature descriptor to extract the pedestrianfeature and machine learning to train classifier,then identify pedestrian by classifier which isadopted to detect pedestrian in this thesis.This thesis focuses on feature descriptor and classifier.The histogram of oriented gradientproposed by Dalal and Triggs which has strong description ability is used through thecomparison of all kinds of feature descriptors。The histogram of oriented gradient has someshortcomings which includes large amount of calculation,high dimension of features,no useof the image texture ination and SO on.In order to reduce dimension and take intoaccount of the texture ination of the image,a hybrid feature which combines the pyramidmodel and the entropy ination.The support vector machineSVMis used in this thesisbecause of its fast classification rate and simple structure.Most of the common used SVM islinear kernel SVM which have a faster classification rate but a 10wer detection rate.Nonlinearkemel SVM has a better detection rate but a slower classification rate.Considering theseissues,a nonlinear kernel called intersective kemel is adopted to realize SVM.Then theadditive kernel SVM iS realized on the basis of the intersective kemel SVM.These two SVMsCan maintain the strong calssification ability of the nonlinear kernel and the classificationspeed of linear kernel.Finally,hybrid fearures based on combination of pyramid histogram oforiented gradient and entropy fearures combines respectively with intersection kernel SVMand addition kernel SVM to increase the perance of pedestrian detection algrithm.The classifier of the algrithm is trained in INRIA pedestrian library to test the algorithm..V..万方数据东北大学硕士学位论文perance through the comparison of DET and ROC curves.Experimental results show thatthe pedestrian detection proposed in this thesis has a higher detection rate and a fasterdetection speed,even under the conditions of complex background,pedestrians with moregestures and small block.Key wordspedestrian detection;histogram of oriented gradient;feature descriptor;supportvector machine;kemel function.VI.万方数据东北大学硕士学位论文 目录目 录摘要 Ⅲ第l章绪论1.1选题背景与研究意义1.2行人检测技术的研究现状1.2.1行人检测的三类特征描述子1.2.2行人检测中常用的分类器行人检测技术面临的挑战1.4本论文主要研究内容2.1行人检测技术框架2.2特征描述子2.3目标识别2.4行人检测常用数据库与评判标准2.4.1行人检测常用数据库2.4.2行人检测技术的评判标准2.5本章小结第3章基于㈨度直方图特征与廊惭正的行人检贝填[;去173.1引言.173.2塔式梯度直方图特征与熵信息特征173.2.1梯度直方图特征.173.2.2塔式梯度直方图特征.213.2.3熵信息特征273.3实验仿真分析。28.VII.1122345■■nBBH托万方数据东北大学硕士学位论文 目录3.3.1基于梯度直方图特征的行人检测算法实验分析283.3.2基于塔式梯度直方图特征与熵特征的行人检测算法实验分析303.3.2影响检测效果的因素..333.4本章小结.37第4章基于非线性陔端向量机的行人I锄蚂卑弦394.1引言.394.2支持向量机算法.394.2.1线性可分情况404.2.2线性不可分情况..434.2.3核函数..444.3基于交互核支持向量机的行人检测算法454.3.1非线性核函数一454_3.2交互核函数..464.3.3加法核函数494.3.4分类器训练方法514.4实验仿真分析524.4.1基于梯度直方图特征的行人检测算法实验分析524.4.2影响检测效果的因素..554.5本章小结.59第5章总结与展望615.1工作总结615.2工作展望62参考文献63致谢.67作者晒舅呒擘挚位期间发匍乎啦文.71..VIII..万方数据东北大学硕士学位论文 第1章绪论第1章绪论1.1选题背景与研究意义随着社会的迅速发展和科学技术水平的不断提高,计算机已经被广泛的应用到了工作学习中。特别是在处理复杂度高、数据量大、重复次数多且安全性、稳定性、实时性要求较高的任务时,计算机往往比人类更加准确和快速。而图像处理与计算机视觉领域除了以上特点外还要求计算机更加智能化,来完成图像识别、人机交互、语音识别、智能控制、行为判断以及预警等任务。怎样从视频图像中提取出人们所需要的信息成了现在研究的重点内容。行人目标检测与识别是当前研究的一个热点问题,它利用计算机强大的计算能力对于感兴趣的目标进行自动检测与识别,是智能交通系统、视频检索系统、智能视频监控系统等技术的基础核心算法,具备广阔的应用空间与极高的实用价值。1智能视频监控系统视频监控系统目前已广泛地运用在机场、商厦、医院、军事基地、居民生活小区等各类场所。传统的视频监控系统是半自动化地作业方式,利用安装在各处的摄像头采集当前的视频信息,再传输到显示器上通过人工观察的方式实现监控功能。这样的监控方式不仅仅需要大量人力、物力、财力地支持,而且由于人为的疏忽与疲劳等因素容易造成漏检、误检等结果,进而引发各类事故。智能视频监控系统能在很大程度上避免了这些缺点,并且具有稳定性高、全天候响应等优点。智能视频监控由目标检测、目标跟踪、目标的行为理解这三大部分组成。目标检测是目标跟踪与目标行为理解的基础,目标跟踪与目标行为理解依赖于目标检测的输出。2智能交通系统由世界卫生组织发布的道路安全全球现状报告显示,每年有约1,270,000人死于道路交通事故,其中约46%都是行人、自行车或者摩托车驾驶者。中国是世界上交通事故死亡人数最多的国家之一,从2003年到2012年这10年里,我国已经有约700,000人死于交通事故。由此观之通过发展智能交通系统来减少交通事故、避免人员伤亡,是现代交通的一大任务,而行人检测技术是智能交通系统中的重要组成部分。它可以辅助驾驶员、交警进行行人与路况判断,行人异常行为预警,避免潜在的交通事故发生。因此,国内外各大汽车公司都将这个技术纳入未来汽车发展的方向。例如,2013年,奥迪公司研发的名为“Audi Connect”的技术,其中的城市交通计划就包含了行人检测技术。.1.万方数据东北大学硕士学位论文 第1章绪论系统一旦收到危险情况的报告,将决定是否有必要进行全力制动,来保护行人和驾驶员。目前这项技术正处于发展中阶段,它的准确性、实时性、可靠性还不能够完全胜任处理复杂交通中的各类情况,所以行人检测技术还需要进一步的研究。3智能机器人技术智能机器人是现代社会发展的一个重要方向,国际上机器人研究和机器人产业正走在稳健发展的道路上,而我国的机器人总数较少,但国内市场需求却很大。智能机器人对于人机交互能力的要求很高,行人检测能力就是其中之一。在发生重大灾难事故、恐怖事件中救援人员、警察无法进入的地区,可以利用智能机器人对伤员、恐怖分子、人质进行位置探测工作,为后续行动提供准确的信息。行人检测技术结合了图像处理、计算机视觉、模式识别、人工智能等诸多领域的先进技术手段,研究行人检测技术不仅仅有利于众多学科的发展,而且能为保障人民生命财产安全、促进社会的经济发展作出巨大贡献。1.2行人检测技术的研究现状近十年来,行人检测算法一直是国内外图像处理和模式识别领域的研究热点。国际上从事此方面的研究机构有法国国家信息与自动化研究所INⅪA、德国的达姆施塔特工业大学TU Darmstadt、马克斯普朗克计算机科学研究所MPI Inatics、麻省理工学院计算机视觉研究实验室、日本丰田汽车研究中心、瑞士苏黎世联邦理工学院ETH Zurich等。国内研究机构主要有清华大学人机交互与媒体集成研究所、上海交通大学自动化研究所、西安交通大学人工智能与机器人实验室、中科院自动化所模式识别国家重点实验室等。而著名期刊与学术会议,例如PAMITransactions on PaaemAnalysis and Machine Intelligence、ICCVInternational Conference on Computer Vision、CVPRConference on Compute Vision and Pattern Recognition等也收录了很多行人检测技术方面的优秀论文。1.2.1行人检测的三类特征描述子行人检测主要有三类特征描述子,一类是基于形状匹配的特征描述子,一类是底层特征描述子,另一类是混合特征描述子。基于形状匹配的特征描述子有自适应轮廓特征ACF【11、Edgeletl2】【3】、边缘模板【41等,是一种从大量的样本中选择出判别能力与直观性较强的特征,特征的选择与训练样本相关性很大。如果样本的代表性太小,就难以提取出来准确性高的特征,进而降低了检测效果。底层特征描述子是指图像的梯度、灰度、纹万方数据东北大学硕士学位论文 第1章绪论理等基本特征,不同的特征描述行人的能力有所差别。使用得较为广泛的有梯度直方图特征Hog[5·71、局部二值模式LBP[8-101、颜色特征‘11肥]等。混合特征描述子是将多种特征描述子组合在一起,利用多种方式来描述行人,从而提高行人检测的准确性。随着特征描述子的增加,特征维数也会增加,那么计算机的计算时间与支持向量机的训练样本时间与分类时间都会增加,行人检测算法的实时性得不到满足。因此,在使用混合特征描述子时,应该在检测算法的准确性与实时性之间保持一个平衡。常用的混合特征描述子有HOG.LBPtl 31、Haar-HOGtl 41、底层特征与运动信息相结合‘15】【161等。1.2.2行人检测中常用的分类器在行人检测技术中常用的分类器有支持向量机Support Vector Machine,SVM、AdaBoost、神经网络Neural Network等,其中使用范围最为广泛的是支持向量机SVM与AdaBoost。支持向量机SVM是以最优化理论为基础的学习算法训练,是一个在高维特征空间利用线性函数假设空间的学习系统,此算法实现了一个由统计学习理论导出的学习偏置1171|18】。此后,在各个领域的应用中,支持向量机表现出来的性能胜过了其他大多数的学习系统,特别是在解决高维度、小样本、非线性的问题时表现出很大的优越性与适应性。它与其他的特征描述子结合完成行人的特征提取与识别行人的任务,典型应用是Dalai提出的HOG与SVM的方法进行行人检测【51,检测结果相较于以前的各类行人检测方法有了很大程度上的提升,在MIT行人数据库【19】上几乎达到了1 00%的准确性。基于支持向量机的这些优点,很多研究者开发出支持向量机的工具包,例如林智仁教授开发的LIBSVMt201、BSVM[211,T.Joachims开发的SVMLightt221、SVMstructl23】等。AdaBoost算法是Freund和Schapire于1995年提出,是一种通过不断迭代的方法使得简单的弱分类器精度得到提升的算法,具有易于执行,分类精度较高的优点【241。该算法通过不断的训练,可以提高此分类器对数据的分类能力,目前主要应用在解决分类问题,典型的应用就是人脸识别系统。Adaboost算法是根据在线分配算法提出的,并不要预先知道弱学习算法学习正确率的下限即弱分类器的误差。它针对boosting算法存在的两个问题一个是如何处理训练样本,使得样本的分类过程顺利进行;另一个问题是如何将各个弱分类器合并与调整而形成强分类器。该算法并不是随机选取训练样本而是通过给每个样本都赋予一个权重的方式,如果一个样本被错误地分类,那么它的权重就会提高,反之权重则会降低。这样的话,训练的关注点就集中在难分的样本数据上。然后利用加权投票机制,分类准确率较高的弱分类器赋予较高权重,而分类准确率较低的万方数据东北大学硕士学位论文 第1章绪论分类器赋予较小的权重,再将弱分类器通过线性加权和的方式联合构成强分类器,强分类器的分类准确率依赖于所有弱分类器的准确率,这样就充分利用了弱分类器算法的分类能力。1.3行人检测技术面临的挑战行人检测技术的目的是将视频图像中的行人与其他物体区分开来。它的检测要求主要集中在检测的准确性与检测的实时性这两方面,而到目前为止行人检测这项技术并没有被广泛地应用,究其原因主要是以下几点。1场景的复杂性行人所处的环境复杂多变,包括光照明暗的变化、场景内物体的位置与形状的变化、环境天气的变化等,而非人物体的存在,例如人体模特、树木、雕像等都增加了检测的难度,如图1.1所示。2行人的多姿态行人的姿态是多种多样的,包括下蹲、转身、抬腿、平躺等等,如图1.1a、b所示。姿态的多样化,增加了对行人建模的难度。通过分析采集到的不同姿态的行人视频图像,发现其中既包含了刚性形变,也包含了非刚性形变。同时,拍摄视频图像的角度、行人的衣装、首饰、随身携带物品等也各不相同,即使行人是同一个姿态,但是由于这几类因素的影响,行人所呈现的特征也可能不一样进而增加了检测的错误率。3行人的遮挡问题人类是群居动物,很多的社会活动是由一群人协作完成。特别是在马路、广场、商场、校园等公共场所,人与人、人与物之间都会有互相遮挡的情况,如图1.1c、d所示。那么采集的图像中信息是有所缺失的,行人所表现出来的特征是不完整的,检测系统只能依靠所获取的不完整的行人特征进行行人目标的识别,检测效果必然会受到影响。4软、硬件系统的性能多种特征描述子与支持向量机的有机结合可以达到一个较好的检测效果,可是大量而复杂的计算会带来较慢的检测速度。对视频中的行人目标进行检测时,检测速度过慢,就失去了应用价值。一般来说,行人检测技术是作为一项基础技术,为后续的行人跟踪、行人行为理解、异常行为预警等提供输出信息。实际应用中,整个系统需要满足实时性的条件,那么行人检测这个部分也必须要满足实时性要求。所以,在开发过程中,提高硬件环境的水平同时,也要提高软件编写的水平。.4.万方数据
展开阅读全文
收藏
下载资源

加入会员免费下载





足球比分直播