足球比分直播

基于海上侦察系统的声音识别技术分析.pdf

返回
基于海上侦察系统的声音识别技术分析.pdf_第1页
第1页 / 共52页
基于海上侦察系统的声音识别技术分析.pdf_第2页
第2页 / 共52页
基于海上侦察系统的声音识别技术分析.pdf_第3页
第3页 / 共52页
基于海上侦察系统的声音识别技术分析.pdf_第4页
第4页 / 共52页
基于海上侦察系统的声音识别技术分析.pdf_第5页
第5页 / 共52页
点击查看更多>>
资源描述:
声 明本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。研究生签名童董终 硼7口年6月弓日学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密论文,按保密的有关规定和程序处理。研究生签名 青蔓孜 劢扣年石月盈日/硕士论文 基于海上侦察系统的声音识别技术研究1绪论在战场侦察和预警系统中,无人值守的无线传感器体积较小、易于布置、容易隐蔽、受地形和天气的影响较小,虽然在精度、灵敏度和专业性方面比不上光电侦察仪器和雷达系统,但是其随时随地可分布的能力极大地扩展了侦察的战场范围,因此受到各国部队的青睐。人类通过各种传感器来收集信息,据报道现在无人值守传感器系统已经发展成包括形形色色的传感器的大家族,在未来这些“隐形侦察兵”将进入城市、荒野、高山、沙漠和海洋等各个地区,提供战场环境信息、敌方行动以及我方士兵健康状况信息等。可见无线传感器在未来的战场上将发挥极大的侦察功能。现在无线传感器技术是一个热点的研究问题,不过其要想大量投入使用首先面临的就是成本问题,其次还有能耗问题和安全性问趔卜引。对于无线传感器探测到的信息进行进一步处理也非常重要,处理之后才能更准确地提取出想要的信息。在本课题的无人值守预警系统中,无线传感器系统的节点需要分布在环境恶劣的海洋区域,而且所需要覆盖的面积很宽广,节点非常多。因此开发出一种节点价格较低、能够可靠传输和处理数据且能达到可实用精度的系统是无线传感器走向应用的关键。同时对于信息处理部分能给出更加准确、实时的结果信息也是传感器探测的最终目标所在。本文针对无人值守的海上侦察传感器系统的声音传感和识别部分进行了研究,阐述了一种具有实用功效的声音探测和发送方案;重点是对已经接收到的控制平台的数据进行识别处理。从应用角度看,该方案也可以用在陆地环境识别领域。1.1基于海上侦察系统的声音识别技术研究的目的和意义声音作为人类的五大感觉器官之一,也是感知环境目标的一个重要方面,声音信息结合图像信息能反映出目标的总体信息【4】,在自动预警系统中具有重要意义。海上声音识别即对探测到的海洋环境中的声音信号进行分类识别,国内外大多数声音传感器都是针对语音和音乐的,而对环境声音信号识别的研究比较少。环境声音识别信号的复杂性高、频率范围宽和需要模板信息量大等特点导致此类研究难以进行【5】。但是环境声音分类技术应用前景广阔,目前已经开展的研究有车辆音频识别,动物个体声音识别,家庭安全防卫系统,军用预警系统和声纳识别。水下目标识别是水声学研究的关键技术,传统的识别方式是利用战舰和潜艇上的声纳员借助探测设备兼人工听测对目标进行分类。目前声纳目标识别领域对于船舶噪声的特征提取和分类技术已经有了深入而广泛的研究,这些分类技术精度较高,能比较精细地区分核潜艇、常规潜艇、商船以及鱼雷等目标【6J。无线传感器作为对这种专业识别的l绪论 硕士论文补充,能覆盖更广阔的海域,以较低的代价提供预警信息。本课题目前是针对海上预警,研究了声音在海上传输的特点,旨在研制出一种能对海上声音进行分类的系统,能够识别出来探测区域内接收到的飞机、海鸟、海面上的轮船或者声纳等声音信号。1.2基于海上侦察系统的声音识别技术研究的科学背景一个完整的海上侦察系统的声音识别系统示意图如图1.1所示。图1.1声音识别系统1.2.1环境声音检测技术检测电路的好坏对系统后续处理影响很大,它是对声音进行一系列转换的关键。检测的数据本身对识别结果有严重的影响。声音是以波的形式传播的,振幅代表质点振动的强度,频率代表每秒钟振动的次数。完成声音信号一电信号转换工作的器件就是传声器,俗称麦克风。传声器主要分为两类动圈式和电容式。动圈式传声器是由两个线圈组成的,所以当声音振动了膜片,音膜在声波的作用下带动音圈一起振动,音圈在磁场中切割磁感线,产生感应电流,再由放大器放大输出。电场的交流电只是起放大感应电流的作用。电容式传声器中有一个固定的后极板和一个活动的振膜作为前极板,它们之间的距离很小,当声波引起其震动的时候,金属薄膜间距的变化引起了电容的变化,故而产生电流。电容式传声器中得到广泛应用的是驻极体电容传声器,它由驻极体材料制成,内部使用的振膜采用了一种永久性电荷的驻极体材料‘7叫。传声器的主要技术指标有灵敏度,指向特征,频率响应,输出阻抗和动态范围等。在不同的应用系统中,应该根据具体的要求选择合适的传声器【101。1.2.2环境声音识别技术在声音识别中,语音识别是发展最早、也是比较成熟的领域,语音识别的目的是把语音信息转换成文本或者命令。与之不同的是,环境声音识别一般用在预警和检测中,目的是识别目标。目前环境声音识别方面的研究较少,所用的特征提取和识别/分类算法2硕士论文 基于海上侦察系统的声音识别技术研究大都借鉴于语音识别或者声乐识别领域已有的算法。环境声音识别过程跟语音识别相同,其识别过程如图1.2所示。训练所得声音模板是Or否亩∑.别算法待测试的声音信号出-立 特日 预征信 呻 处 提号 理取输入图1.2声音识别过程声音识别所包含的算法内容如下面三个步骤所示.1声音预处理包括去噪,带通滤波,模数转换,基元选取和端点检测等,这些都对预处理后的特征提取和声音识别有一定影响,所以在不同的应用条件下要做不同的选择。2声音特征提取早期的声音信号处理多是基于时域特征,时域特征包括短时平均能量和短时平均幅度,短时过零率,短时自相关函数等。本课题研究的特征提取是对数字声音信号进行频域操作,提取出表征此声音的特征信息,分为时.频域特征提取和频域特征提取。常见的时.频域特征提取方法有短时傅里叶变换STFT,快速小波变换FWT,连续小波变换CWT,维纳格.威尔分布WVD等。时.频域特征提取是把声音信号分成时间段来处理,而频域特征提取对包含在整个信号中的频率信息做出总体分析。在语音和音乐识别中常见的频域特征提取技术有频率开方,频谱质心,子带能量比,同态倒谱系数HCC,美尔倒谱系数MFCC,线性预测倒谱系数LPCC,LPC美尔倒谱系数,Bark频率倒谱系数,LPC Bark频率倒谱系数,感知加权的线性预测PLP等。3声音识别/分类算法这是整个识别技术的核心,应用比较广泛的识别技术有动态时间规整DTW,隐马尔科夫模型HMM,学习向量量化LVQ,自组织图谱SOM,遍历隐马尔科夫模型E-HMM,人工神经网络ANN,BP神经网络,长时统计,高斯混合模型GMM以及支持向量机SVM。这些方法中有些技术从其定义上就能判定是不能用于非语音识别,例如那些利用13腔声音特征,子字节,元音和辅音等特征进行识别的技术[H-13】,本文后面几节要对这些算法的可用性进行研究。在不同的应用场合下,不同的特征提取技术与不同的识别算法组合可以产生不同的识别效果,声音识别率的实验一般是用MATLAB计算实现。l绪论 硕士论文声音识别可以采用识别芯片直接在传感器前端识别,这样的识别芯片主要可以分成单片微控制器、信号数字处理器、人工神经网络构成的识别芯片、语音识别系统级芯片,这方面的研究已经进入商业化阶段【141 51,其中典型的语音识别产品就是RSC.364和UniSpeech。但是这些芯片都是针对语音识别,而对复杂多样的环境声音的识别能力有限,能够处理的数据量有限,课题采用在后端对发送并保存到监测中心的声音进行处理,这种处理是非实时的离线处理方式。1.2.3环境声音识别实现方法1基于MATLAB的声音识别仿真技术在音频处理方面,MATLAB提供了wav文件读写函数和声卡的录音以及放音函数,利用这些函数可以实现对语音信号的处理工作。MATLAB声音识别过程常用的语音工具箱有VoiceBox、AuditoryToolbox、WAVELAB850和tftb.0.2等,利用这些工具箱中提供的函数可以对声音进行端点检测、短时能量计算、过零率计算、小波变换、倒谱系数计算以及声音识别。进行声音识别之后,利用MATLAB中的绘图函数绘制出每一步处理得到的波形图、语谱图和识别结果等,可以以直观的方式观察整个识别流程。基于以上特点,MATLAB无疑是进行此类实验运算的首选工到16’m。2HTK的语音识别工具箱HTKHidden Markov Model Toolkit是剑桥大学智能机器实验室开发的一个实验工具包,是语音识别领域著名的开源工具包。L矗nj嘲Spccch 1.,anguagc Con吐ramtData Labels Models Network DictionaryModel AdaptionTrainmgHMMDefinitionsTe肺inalⅣOGraphical I/O图1.3 HTK的系统结构HTK是语音识别研究中广泛使用的一个工具包,为语音识别的研究提供了一个方便的平台,它使用HMM模型作为语音识别的核心,可以支持连续和离散密度HMM,4硕士论文 基于海.卜侦察系统的声音识别技术研究可读性和可扩充性好且调试功能强大。HMM是多个状态的连续混合高斯模型,它的每一个状态都用若干正态分高斯分布概率密度函数的线性组合来表示,每个高斯混合密度函数有各自的均值矢量和协方差矩阵,这些都是通过大量的MFCC参数进行统计得到的。设置HMM为一个状态,即可以搭建出高斯混合模型,课题将利用HTK搭建高斯混合模型,并进行识别实验。3基于MFC的声音识别编程课题涉及到在MFC程序中直接处理wav格式的音频信号。way也称波形文件,几乎就是对原来的采样幅度进行保存,只是加入了一些控制信息,它可以被大多数播放软件播放。表征它的特征有三个参数采样位数、采样频率以及声道数。声道有单声道、双声道和立体声,采样频率一般有llkHz、22kHz和44kHz三种。WmdOWS中的音频处理有三种模式高级音频函数和媒体控制接口MCI设备驱动程序;低级音频函数MIDIMapper和低级音频设备驱动WaveXAPI;DirectX中的DirectSound。第一种方法极其简便,但是灵活性较差;使用WaveX API函数的方法相对来说难一点,但是能够对音频数据进行灵活的操控;而采用DirectSound的方法,控制声音数据最为灵活,效果比前二者都好,不过实现起来是三者中最难的。可见,WaveX API相对来说即灵活方便,又简单,所以采用这种方法。此外,MFC提供的绘图功能,通过编程可以直观地显示出信号的频谱图,并以某种标识显示识别结果。1.3环境声音识别/分类技术在国内外的研究发展现状声音识别传感器中的研究起源于语音识别和语音通信领域。贝尔实验室首先用目视语音图谱来进行识别,随着计算机技术的发展,通过硬件和软件进行自动识别成为了可能。20世纪六、七十年代语音识别领域中最重要的发展是线性预测编码LPC技术和动态时间规整DTW技术,对于特征提取和时间长短不一致问题提出解决方案。20世纪八十年代,主要是解决连接词识别和统计识别模型,人们开始从宏观上把握语义,研究成果有动态规划LP技术、矢量量化VQ技术和隐马尔科夫模型HMM理论。20世纪九十年代模型设计根据不同的应用环境不断细化,参数提取和优化以及自适应技术取得进展。此时,人工神经网络技术的应用成为语音识别的一条新途径,它具有自适应性、并行性、非线性、鲁棒性、容错性和学习特性。语音识别技术由于应用范围广泛,市场广阔,经济效益可观,得到了很大的发展,而且比较完备的系统不断出现,比如mM的ViaVoice系列、Microsoft的Whisper以及CMU的SPHIN.II[18J。随着应用需求,对声音的识别开始不仅局限于语音上,人们开始寻求对非语音的环境声音识别技术。虽然这些研究主要借鉴了语音识别的技术,但是由于它们有各自的应用环境和音频特点,具体实践中采用技术和参数有一定的差异。已有的环境声音识别研51绪论 硕士论文究主要在以下六个领域进行。1智能交通运输领域利用车辆运动的音频信号来识别车型,能够得到流量信息和实现智能化管理。车辆噪声范围大致为400到7000Hz,多数研究是采用信号幅度和短时过零率,之后采用隐马尔科夫模型进行识别【19捌。长安大学的袁小滨等是使用谐波集法和小波子空间能量的方法,对机动车声音信号进行了特征提取【211。此外,基于飞机声音识别的监测系统,可以分析出声音对机场周边居民区的影响【221。2智能机器人领域智能机器人对声音的识别可以用作家庭安全系统和家庭自动化服务系统,机器人身上的声音识别传感器充当机器人的耳朵,识别环境声音,确定声音方位,并对外界的声音做出反应。在此类研究中,应用到了各种声音处理方法,特征提取选用美尔倒谱系数、傅里叶变换或者同态倒谱系数,结合学习矢量量化、人工神经网络等识别方法,对玻璃打碎声、脚步声、咳嗽声和钥匙响声等声音进行识别,从而提供防卫信剧23,241。3动物声音识别领域一方面在仓储害虫防范中,可以根据害虫的声音特点来区分害虫种类,据此采取相应的措施。基本过程是先经过Madline神经网降噪、数值归一化处理以及FFT算法作频谱分析得到声音特征,然后利用声音特征构造多个支持向量机进行识别或者把提取的特征送入BP神经网络识别分类f25捌。另一方面是一些动物个体声音的识别,这是研究特定种族的群居和季节性分布、追踪动物原本的生活习惯的一种有趣和重要的方法。东北林业大学的黄英来采用倒谱与隐马尔科夫结合的识别算法,Yuanfeng Ma和他的搭档则用响度识别的方法来区分两只长须鲸的声音【27捌。4声纳识别领域目前,水下目标的识别主要靠声纳员的听觉为主,以声音信号的处理结果为辅来进行判断,提高信号处理的实时性和准确性有利于识别自动化的研究。其中,被动声纳目标不仅含有目标物体的特征,而且还受到海洋背景噪声的影响,因此对被动声纳目标的分析一直备受关注。声纳噪声分析中常用的特征分析方法有波形分析、时域特征分析和频谱域的包络谱分析、线谱分析以及连续谱分析等,其中主流研究都集中在频谱分析129]。船舶噪声分析使用的分类算法一般是采用BP神经网络分类器以及基于遗传算法的改进型BP神经网络分类器E30,31】。5乐声识别领域由于乐器种类的多样性,乐声识别是比较复杂的。乐声识别常用的提取算法有美尔倒谱系数,常用识别算法有高斯混合模型和支持向量机。De Poli和Prandoni用美尔倒谱和自我组织图的技术来进行乐器识别;gaminsky和Materka用短时均方根能量和神经网络进行吉他、小提琴、木琴和手风琴的音色识别;而在Antti Eronen和AnssiⅪap丽6硕士论文 基于海上侦察系统的声旨识别技术研究的实验中,分析了短时均方根能量、质谱中心、正弦波跟踪以及频谱波形等多种声音频率特征,选择了一种分层结构的分类算法,即上层采用高斯混合模型、下层采用k-NN算法。在国内,大连理工大学和中国科学院研究生院等机构也有不少人对音乐识别做了研究,主要采用美尔倒谱特征提取方法和高斯混合模型以及神经网络分类算法相结合的方式f32矧。6非语音的人类声音识别领域台北大学的Wen-Hung Liao和Yu.Kai Lin对人类的笑声、尖叫声、喷嚏声和打鼾声进行了识别研究,使用了美尔倒谱系数特征提取结合支持向量机分类方法完成了声音识别,识别率达到83%左右【36】。可以看出先前的实验大多数是借助MATLAB工具仿真实现,有一些是基于DSP或者FPGA硬件芯片实现。本课题也要在MATLAB中进行环境声音识别仿真,进一步将识别技术应用到海上无线传感器系统监测平台软件中。1.4本课题主要完成的工作内容虽然海上目标的声音相对复杂,理论上来说,没有两种不同的物体拥有相同的噪音,因此通过对声音施加一定的分类技术来对物体进行区分是可行的,海上声音识别一直都是海洋军事研究的热点问题。无线声音传感器单元主要是从海上检测和发送声音信号,本课题主要针对海上常见声音信号进行识别,重点完成了海上声音分类技术的MATLAB仿真研究以及对海上声音进行识别的软件界面的开发,论文安排如下。第一部分介绍海上声音识别系统研究目的和意义,声音识别技术的科学技术背景以及国内外研究发展现状。第二部分分析了声音信号的传输环境和海上声音信号的特点,分析了声音信号的三种预处理方法预加重,分帧和端点检测。第三部分深入研究了各种语音识别、环境声音识别和声纳识别的算法,总结出几种适用于海上声音识别处理的特征提取方法和识别算法。第四部分在MATLAB工具中对预处理和特征提取技术过程进行了演示,同时在MATLAB工具中进行了动态时间规整算法实验,最后在HTK语音工具包中搭建高斯混合模型,进行识别实验和结果分析。第五部分采用易于实现的傅里叶变换特征提取方法和动态时间规整识别算法,在海上监测软件平台上增加了声音识别软件。.第六部分对全文的工作做出总结,对下一步的此类声音识别研究提出建设性意见。72海上声音信号特征研究 硕士论文2海上声音信号特征研究本章从声音信号的传播环境、检测方法、预处理方法和特征提取算法四个方面对声音特征进行分析研究。2.1海上声音传感传播环境对声音信号影响很大,所以研究声音在海上传播的特性对理解传感器接收到声音信号的特点非常有必要。在之后的信号处理中,需要根据接收到的声音频率范围和声强等特点选用合适的处理方法和参数。整个声音识别的过程是传感器将待识别的模拟信号转换为电信号进入系统的输入端,首先经过预处理,包括加窗分帧与端点检测;然后将分帧后的信号逐帧进行特征提取;最后使用分类算法进行识别。传感器采样精度,分帧区段大小选择,特征矢量的选择,识别算法的选用都会对识别的结果产生影响。2“--3章将对声音识别的各个环节进行详细阐述。2.1.1声音在海上的传播特性海水是一种非常特别的介质,无线电或者光在海水里传播的衰减非常大,唯有声波能够在海水中传播很远的距离,所以探测和研究声波就成为水下探测最有效的手段,对海洋调查、水下作战具有重要作用。由于海洋各区域的多样性和不均匀性,声音在海水中传播会有不同的特点。课题是针对海上声音进行处理,所以重点放在声音识别方面。在海水中,声速大约在1450一-1540m/s,声速会随着温度、盐度和深度略有不同,在海面上声速是340m/s,所以同一地点的声音在水下会首先接收到。在声学研究中习惯用声强或者声压的对数来表示声音的大小、强弱,声压级定义如下所示厂 D、Lp20I lg兰I 2.1‘\一P何/Lp为有效声压比参考声压的以10为底的对数,乘以20。一般来说,在空气中,Pref20l-t Pa在水中,P佗rl la Pa。声压值的变动范围很宽,用对数换算后,可以大大缩小声压的数值范围。日常生活中,说话的声压约为65--一70dB,小口径炮产生噪声的声压约是130““140dB,大型喷气式飞机噪声的声压约是150---一160dB。由于声强和介质阻抗成反比,水的特性阻抗是空气的3570倍,所以相同声压值的声波,在空气中声强是水中的3570倍。因此得出结论若是海面航行的物体发出的声音,虽然在水中传播速度较快,但是其从海面上传播的声信号更容易探测到。8硕士论文 基于海上侦察系统的声音识别技术研究声强在海水中传播的必然有所衰减,原因主要有三首先是拓展损失,声波波阵面随着传输的进行而不断扩大,声强衰减;其次是吸收损失,是指在均匀介质中,介质粘滞、热传导等驰豫过程引起了声强衰减;最后是散射损失,在海洋中存在着气泡、微生物等物体以及介质不均匀性,引起声波散射、吸收,导致声强衰减。海水中不同的声音波形有不同的衰减系数,假设声波以柱面波的形式传播,扩展引起的传播损失为TL1019r 2.2其中,r为传播距离半径。吸收和散射是无法分开研究的,海水吸收系数Q定义如下一划南] 眨3,algl产●l L厶j,X l JI X I J其中,I。为X0处平面波起始声强。比较之下,声音在空气中的损耗不计,因此声音在水中损耗更大,水下探测对接收器灵敏度要求更高【371。噪声是影响军用和民用水声探测设备的主要重要因素,可以主要考虑海洋背景噪声,研究噪声的特性,采用相应的降噪措施来提高声音识别正确率。噪声是一个随机过程,分布在海上的声音传感器接受到的噪声也是一个随机量。如果一个随机过程经过一段时间之后,它的统计特性保持不变,则称为平稳随机过程。西p1,t12①pl,flT 2.4在水声学上,为了处理方便,一般都把噪声当成平稳随机过程。作为随机过程的噪声,其随机过程的功率谱函数是确定的统计量,它能够反映出各频率分量的平均强度。假设声强的频谱密度函数为Sf,则Ir Sfdf 2.5其中,fl~£是任意频率区间,I为此区间的总声强。在此还要指出的是水下噪声指向性,风浪噪声是海面辐射噪声,具有垂直指向性,而像航行船只之类的远物发出的声音,具有水平指向性。因此,对于特定海域需要进行噪声功率谱分析,进一步去噪。此外选择水平指向性优良的传声器,对于探测航船类目标有极大的优势。 ’2.1.2海上声场语音信号是由字句来构成的,静音帧比较多,字库有限,带宽有限。海上声场是噪声信号,不过海上声音声场频率主要集中在低频段,所以同语音采样一样的传声器频率响应可以满足此次采样要求。下面介绍了几种海上常见的声音信号及其特点。任何两只船拥有的噪声都是不一样的,舰船的声音有螺旋桨声音、船与水摩擦的声9
展开阅读全文
收藏
下载资源

加入会员免费下载





足球比分直播