足球比分直播

基于CELP算法语音信号的编码压缩设计.pdf

返回
基于CELP算法语音信号的编码压缩设计.pdf_第1页
第1页 / 共35页
基于CELP算法语音信号的编码压缩设计.pdf_第2页
第2页 / 共35页
基于CELP算法语音信号的编码压缩设计.pdf_第3页
第3页 / 共35页
基于CELP算法语音信号的编码压缩设计.pdf_第4页
第4页 / 共35页
基于CELP算法语音信号的编码压缩设计.pdf_第5页
第5页 / 共35页
点击查看更多>>
资源描述:
东南大学硕士研究生学位论文 基于CELP算法语音信号的编码撬缩设计第一章绪论语言是人类在长期的进化过程中形成的最方便、最快捷、最直接的通讯方式。人与人交往、交流思想、描述事物的最直接工具是语言。声音是语言的一种重要传播媒介,可以说语音是人类语言中最富含信息量的一种表现方式。人类对于语音信号的研究首先是模拟语音,然后到数字化语音,特别是五十年代以后,人类现在已经全面进入计算机时代,在通信系统中数字化语音所占的比重不断增加,数字化方法在语音的传送、存储、识别、合成等方面不断增强,依靠各种计算机系统从事劳动,生产和科学研究。现在我们已经非常清楚,在未来的ISDN、卫星通讯、移动通讯、微波接力通讯和信息高速公路等系统中将无一例外的都采用数字化语音和存储。对于语音信号处理,一方面是从语音的产生和语音的感知来对其研究,前者涉及大脑中枢的言语活动如何转换称人发声器官的运动,从而造成声波的传播;后者涉及耳对声波的搜索并经过初步处理后转换成神经元的活动,然后主机传递到大脑皮层的语言中枢。这一研究与语言学、语音学、认知学、心理学和神经生理学等密不可分。目前对于这整个语言链的底层,物理层,其中包括发声器官和耳的功能已经研究的比较透彻,但是对于上层神经元和大脑语言中枢的工作原理,则可以说还不清楚。另~方面,是将语音作为~种信号来进行处理。六十年代中期形成的一系列数字信号处理方法和算法;数字滤波器、快速傅立叶变换FFT、与语音信号处理的要求分不开的,嗣后,在七十年代初期产生了线性预测编码LPC和同态信号处理的算法,它们已经成为进行语音信号处理最强有力的工具,且广泛匾用于语音信号分析、合成及各个应用领域。八十年代阱后,出现东南大学硕-J一研究生学位论文 基于CELP算法语音信号的编码压缩设计了一系列更为重要的方法和算法,其中包括语音编码中采用的分析和成法,简称为ABSAnalysis By Sysnthesis以及各种自适应处理方法和变换方法。在语音编码方面,自从三十年代末提出的脉冲编码调制PCM原理以及声码器Vocoder概念后,语音信号编码一直沿着这两个方向发展,它们也可以称为语音信号的波形编码与声码化编码,或称为非参数编码与参数编码也称作模型编码。语音信号的波形编码力图使重建语音波形保持语音信号的波形形状,这类编码器通常将语音信号作为一般的波形信号来处理,它具有适应能力强、语音质量好等优点,丹所需用的编码速率高。脉冲编码调制PCM、自适增量调制ADM、自适差分编码ADPCM、白适预测编码APC、自适应子带编码ASBC、自适应变换编码ATC等都属于这类编码,它们分别在64~16kb/s的速率上能给出高的质量编码,当速率进一步降低时,其性能下降较快。同波形编码不一样,参数编码通过对语音信号的特征参数的提取及编码,力图使重建语音信号具有尽可能高的可懂性,即保持原语音的语意,而重建信号的波形同原语音信号的波形可能会有相当大的差异。这类编码器的优点是编码速率低,它的主要问题是合成语音的质量差,特别是自然度较低,另外,这类编码器对说话的环境噪声较敏感。计算机的发展为语音信号编码技术的研究提供了强有力的工具,大规模、超大规模的集成电路的出现则为语音编码的实现提供了基础,如何在中低速1 6kb/s以下上获得高质量的语音编码,一直是语音编码研究的主要目标。七十年代中期,特别是八十年代以来,语音编码技术有了突破性的进展,提出了一些非常有效的处理方法,产生了新一代的参数编码算法,这就是混合编码,多脉冲激励线性预测编码MPLPC、规则脉冲激东南大学硕士{}f究生学位论文 基于CELP算法语音信号的编码压缩设计励线性预测编码RPELPC、码本激励线性预测编码CELP等都属于这类新型参数编码器。1 985年Manfred R.Schroeder和Bishnu S.Atal在IEEE ICASSP年会上首先提出了用码本作为激励源的线性预测编码技术CELP。CELP有着高质量的合成语音及优良的抗噪声和多次转接性能,在16kb/s以下速率上得到了广泛的应用。1988年,美国政府标准语音编码器采用由美国国防部与ATT贝尔实验室共同研制的CELP声码器FEDSTD一1016,1 989年8kb/s速率的北美数字移动通信全速率编译码器标准采用修改的CELP技术矢量和激励线性预测编码Vector Sum Excited Linear PredictivecodingVSELP,1991年IEEE通过了用延时码激励线性预测编码Low-Delay Code Excited Linear Predictive CodingLD*CELPl作为1 6kb/s语音编码标准。不久ITUT又在CELP模型上制订了CSACELP算法,将压缩率减少到8kb/s。虽然后来很多国际知名通信公司制订了一些低于8kb/s的压缩方法,但或多或少都存在一些缺陷,不能得到很好的应用。例如美国国防部与ATT贝尔实验室共同研制的4.8kb/sCELP声码器、以及更低速率的线性预测编码器LPC,它可以实现2 4kb/s甚至更低速率的编码。但它们对于含有噪声的语音,由于无法提取参数,性能将严重恶化。在国内,中科院声学所,中科院语言所,清华大学,中国科技大学,北方交通大学等先后对语音信号数据压缩进行了一定程度的研究。但是,当前的压缩方法在语音在质量上还不能满足人们的要求。因此,研制~个高质量的语音信号压缩系统是必要和急需的。本次论文在语音信号的参数编码为背景下,以码激励线性预测编码器为基础,研究如何在不改变自然度和清晰度情况对语音信号进行压缩,以东南大学硕士j洲究生学位论文 基于CELP算法语音信号的编码压缩设计达到速率在6.4kb/s的编码压缩算法。论文主要完成了以下几个方面的工作1通过阅读大量语音信号处理方面的文献资料,在掌握参数编码算法的基础上,了解到多脉冲激励对于实现语音信号的压缩,以及语音的质量及抗干扰性方面有着较好的性能。2在此基础上,以码激励线性预测编码器CELP作为技术的切入点对语音编码进行压缩,使得语音编码的速率降低,达到了6.4kb/s。由于各方面的限制,本次论文工作中仓卒之处颇多,也有许多的遗憾,比如说用未能把语音的质量做得近似与原是语音,没有达到更低的速率,而这是进行语音编码压缩的一个重要的应用,也是很有应用价值的研究方向,但是时间所限,不能做进一步的工作。因水平和时间所限,错误与不足之处在所难免,特请各位评阅人与有关人士不吝赐教与指正。东南大学硕士酬究生学位论文 基于CELP算法语音信号的编码压缩设计第二章语音信号编码系统2.1语音信号编码系统概述今天的语音信号编码系统,归纳起来有两大类。第一类是编码一存储一回放系统,或称为数字语音录放系统;第二类是编码一传输一解码系统,或称为数字电话通信系统。图2.1和图2.2分别表示为数字语音录放系统和数字语音通信系统的框图。输语输语图2 1图2 2同模拟语音录放系统相比,数字语音录放系统具有灵活性高、可控性东南大学坝士酬究生学位论文 基于CELP算法语音信号的编码压缩设计强、寿命长等优点,因而得到越来广泛的应用。例如,数字录音电话、语音信箱。电子留言簿、发生字典、多媒体查询系统以及各类发声电子玩具等。在这些应用中有时对编码器实时性要求不高,话音数据采集后,不一定非要进行实时编码压缩不可,但希望能有较高的压缩效率,以降低所需存储器容量。对解码器而言,则要求算法尽量简单,成本要低,并能构实时或基本实时解码。例如构成能够发声的字典或多媒体信息查询系统。编码器需求量很少,只要在厂家或信息中心装备即可,复杂度可以比较高,也无需完成实时编码。解码器则不然,用量很大,除要求成本低之外还需要能基本实时解码,以减少响应延迟。同模拟语音通信系统相比,数字语音通信系统具有抗干扰性强、保密性好、易于集成化等优点,因此目前语音通信系统都在向数字化方向发展。在数字语音通信系统中,不仅要求能够实时解码,往往还提出一些其它方面的要求。例如抗信道误码能力要高,具有传送带内数据和单频、多频等非语音信号能力等。无论是数字语音录放系统,还是数字语音通信系统对语音编解码器的性能提出了一些共同的要求,其中包括编码速率、编码质量、编解码延时及算法复杂度。2.2语音编码发展的历史概况语音编码的各种国际标准集中反映了语音编码技术发展水平,标准的制定则根据应用背景,对于编码质量、编码速率、编码延时以及算法复杂度等四个因素进行综合权衡而做出的最优选择,以期在实际应用中获得最佳效益。表2.1列出了当前针对电话带宽语音编码而制定的一些主要国际标准,以及它们的质量和应用范围。图2 3则更定量的描述了质量与编码lO东南大学硕士刎究生学位论文 基于CELP算法语音信号的编码压缩设计速率之间的关系。虚线代表期望达到的目标。求∽o蔓G00d 4G 7Il 64kb/S PCMG 72l 32kb/s ADPCM2 4 8 1 6 32 64图2 3目前语音编码MOS分与编码速率之间的关系从表2.1可以看到八十年代以来语音编码技术迅速发展的情况。国际电报电话咨询委员会CCITTl 972年指定了G.7ll 64kb/s脉冲编码调制PCM语音编码技术以及IC技术的限制,其后停顿了较长一段时间,知道1 884年才公布了Q721 32kb/s自适应差分脉冲编码调制ADPCM标准,并且在1986年根据运行中出现的问题,对算法做了部分修改。这两个标准都达到了进入公用电话网的质量。码本激励线性预测CELP编码方法的提出后,16kb/s以下中、低速率语音编码的话音质量有明显的提高。CCITT从1 988年开始研究符合进入公用网要求的16kb/s语音编码标准,对该速率的算法提出了如表2 2所示的一些主要要求。胁~胁东南大学{lif士研究生学位论文 基于CELP算法语音信号的编码压缩设计编码标准 CCITT CCITT CCITT GSM CTIA NSA NSAG 71l G.721 G 728公布年代 1972 1985 1992 1988 1989 1989 1982比特率kb/s 64 32 16 1 3 8 4.8 2 4算法名称 PCM ADPCM LD.CELP RPE VSELP CELP LPC用用领域 电话网 公用网 公用网 数字移动通信 保密话音MOS分 4.3 4.1 4.1 3.7 3.8 3.2 3 5DRT 95 94 94 93 93 90DAM 73 68 70 68 64 53表2.1目前国际上一些电话语音编码标准算法的性能及主要应用参 数 CCITT 要求 最后目标编码延时 5ms 2rns话音质量无误码 量化失真≤4qdu误码为10。 优于G.721 32kb/s ADPCM误码为10一, 优于G.721 32kb/s ADPCM多级编译码器 3次非同步转接量化失真≤4qdu 同步转接无量化失真累积传送音频信令 能传送DTMF信号表2.2 CCITT对16kb/s高质量短延时语音编码算法的一些主要要求表2 2中qdu是一种量化噪声单位,G.71l PCM一次编解码产生的量化噪声定义为单位qdu,≤4qdu大体上相当于4.0以上。此表中同时要求延时≤5ms和量化失真≤4qdu是十分苛刻的,当时没有一种现成的算法能够满足。有些算法量化失真接近要求,但采用前向分帧处理,延时大于5ms。经过一年多的工作,CCITT选定了ATT Bell实验室提出的1 6kb/s短延时东南大学硕iq,l。究生学位论文 基于CELP算法语音信号的编码压缩设计线性预测编码方案LDCELP,并经过进一步的研究和优化,与1992年和1 993年分别通过了浮点和定点算法G 728。该算法采用了后向自适应算法,即从量化后的语音信号中提取LPC参数及增益系数,其延时2ms。经过测试,该算法全面满足表2.3提出的各项要求。为了构成统一的移动通信系统,从1982年,西欧着手研究新一代数字移动通信体制,并于1988年公布了标准,称为GSM标准。其中语音编码采用了1 3kb/s具有长时预测规则码激励RPELTP的线性预测方案。它的特点是算法简单、话音质量达到通讯等级、抗误码性能好,加纠错保护后速率打倒22 8kb/s能在10一·突发性信道误码情况下工作,适用于数字移动通信。与此同时,北美、日本也在研究自己的数字移动通信体制。1989年北美蜂窝电话工业组织CTIA公布了北美数字移动通信标准IS一54标准。为了使原有模拟调频信道能扩容3倍,语音编码采用了8kb/s矢量和激励线性预测VSELP方案。该算法属于CELP类型,只不过采用了自适应长时码本以及两个结构化的随机机理码本。比起经典的CELP,VSELP运算量减少很多,并能用定点算法实现,有利于硬件的简化。其质量也达到通信等级,并且比GSM的l 3kb/sRPELTP编码器的质量略高。1982年美国安全局NSA公布了2.4kb/s的LPC一10声码器标准FSl01 5标准,采用1 0阶LPC预测器。它能给出DRT为90%的可懂度,因此在保密通信网中的到了广泛的应用。它的问题是合成语音自然度差且环境噪声能力差。为了提高保密通信网的话音质量,NSA从1 985年开始组织研究了新一代声码器,并于1989年公布了8kb/sCELP标准的。在这个方案中采用了自适应长时码本和叠接稀疏随即码本,所需计算量也比经典CELP小。它具有比LPC好的多的自然度及抗环境噪声能力。东南大学硕士研究生学位论文 基于CELP算法语音信号的编码压缩设计除了上述提到的一些标准外,其它一些国家和组织业提出了一些标准算法。例如日本的数字移动通信标准6.7kb/s VSELP,国际海事卫星组织Inmarsatl 990年公布的4 l 5kb/s改进型多带激励IMBE语音编码标准等。这些国家和组织还正在进一步研究降低速率的新的算法和标准,例如北美、西欧和日本正在制定将各自的数字一动通信用语音编码速率降低一半的新的算法和标准。CCITT目前也正在指定高质量短延时的8kb/s语音编码标准,并开始指定4kb/s乃至2kb/s的高质量的语音编码标准。2.3衡量语音编码性能的一些主要因素语音编码或称语音压缩编码研究的基本问题,就是在给定编码速率的条件下,如何能得到尽量好的重建语音质量,或称编码质量,同时应尽量减少编解码延时以及算法的复杂程度。换一个角度也可以说,在给定编码质量、编解码延时及算法复杂度的条件下,如何降低语音编码所需的比特率。这四个因素之间有着密切的联系,并且在不同的应用中对各方面的侧重要求也有所不同。一、编码质量语音编码质量是衡量语音编码算法优劣的关键性能之一。如何评价语音编码质量呢这个问题也成为语音编码领域所研究的一个重要课题。对此多年来人们提出了许多方法,归纳起来可以分成两类,即客观评定方法和主观评定方法。可观评定方法用客观测量的手段来评价语音编码质量,常用的方法是信躁比、加权信躁比、平均分段信躁比等。它们都是建立在均方差的基础上,其特点是计算简单,但是不能完全反映人们对语音质量的感觉,这个问题对于16kb/s一下的中、低速率语音编码尤为突出,因此此法主要适用14
展开阅读全文
收藏
下载资源

加入会员免费下载





足球比分直播