飞行试验是飞行条件为真实、模拟或虚拟的试验。很多科研人员都会进行一些飞行试验,本文是一篇核心期刊快速发表范文,主要论述了语音视频信号混合编码实时遥测技术。
【摘 要】在飞行试验中,为了全面掌握试验机的工作状态,需要将飞行员的语音信号进行遥测。本文提出一种将语音和视频信号进行混合编码遥测传输的测试方案,该方案将编码后的数据流插入到机载测试系统中,通过数据采集单元的PCM数据流传输进行遥测发射,地面站接收到遥测信号后,利用软件对数据流进行实时解码还原出语音和视频信号。该方案节省了遥测信号带宽资源的占用,语音和视频信号通过一套遥测设备进行发射,具有系统设备使用成本低的优点。
【关键词】语音,视频,编码,遥测
1 引言
在飞行试验中,为了掌握试验机的人机工作状态,飞行员与地面指挥员通过无线电台进行语音交流传递信息,这种半双工的“问、答”式工作方式易分散飞行员注意力,不利于试验任务的执行。如果将飞行员“全部语音”传输到地面,结合“问、答”方式,试飞工程师和地面指挥员就更容易全面的掌握试验机的工作状态。
同样机载测试的模拟视频遥测是将摄像头输出的视频信号直接调制发射传输到地面,一路视频信号占用一套遥测设备,非常占用资源。
为了解决上述问题,首次将语音视频信号同时采集,采用基于ADPCM和MPEG-4的数字编码方式[1],通过IRIG-106标准的PCM数据帧将数据流实时遥测到地面站,地面站接收信号后通过软件解码实时还原出语音视频信号。
2 语音编码方案
2.1语音编码的概述
语音编码的方法有三种:波形编码、参数编码和混合编码。
波形编码能使重建语音波形保持原语音信号的波形形状,它具有适应能力强、语音质量好的优点,但所需的编码速率高,如脉冲编码(PCM)、自适应差分脉冲编码调制(ADPCM)等;参数编码通过对语音信号特征参数的提取及编码,保持了语音的语意,所需的编码速率比较低,但合成语音质量较差,如LPC-10、MPE-LPC;混合编码采用了合成-分析的方法,克服了参数编码的缺点,在中低速率上获得了高质量的语音编码,大大节省了传输信道容量及存储量,为不断拥挤的通信频带提供了一种解决方法,混合编码有CELP、LD-CELP、ASCELP 等编码方式。
另外,语音算法的选择除了压缩率外, 更应该侧重低延时、低复杂度和语音的传输质量。
2.2基于ADPCM原理的语音编码原理
之所以要对语音进行压缩,因为语音信号本身的A/D转换会导致存储容量需求的增加及传送信道带宽的增加。如一段44.1KHz,量化精度为16bit的立体声语音信号,其一分钟占约10M的存储容量。如果直接用PCM码对之进行编码并存储和传输则存在非常大的冗余度,可对其进行4:1或16:1的压缩。
脉冲编码调制(简称:PCM)是使用最为广泛的调制方法。在PCM的调制过程中,将输入的模拟信号进行取样,量化和编码。这种方法通过用脉冲编码来代表取样后的模拟信号的幅度。语音信号通过PCM编码后得到的信号,最能够保持其真实度,但是其需要的存储空间及传输带宽也很大,所以就有了ADPCM语音编码技术,要了解ADPCM语音编码下面先介绍其他几种语音编码原理。(1)差分PCM编码原理。差分PCM(即DPCM)记录的不是信号的绝对大小而是相对大小,因为信号的相对大小变化比信号本身要小,码位用的也比较少。差分系统就是利用这种信息的冗余,不记录信号的绝对大小,而是记录相邻之间差值的大小。差分编码采用预测编码技术,从输入中减去预测值,然后对预测误差进行量化,最终的编码就是预测值与实际值之间的差值。解码器用以前的数据对当前样值进行预测。这种方法使用的比特数较少,但它的性能决定于预测编码方法以及它对信号的变化的适应能力。(2)增量调制(DM)编码原理。增量调制(DM)是一种特殊简化的DPCM,其只用1bit量化器,因为只用一个量化级来代表样值的变化,为了跟踪信号的变化,必须使用高的采样频率。在DM中,存在两类误差,一种是斜率过载误差,其产生原因是语音波形幅度发生急剧变化时,译码波形不能充分跟踪这种急剧的变化而产生的失真;另一种是颗粒噪声,因为在无声状态或信号幅值固定式,量化输出都呈0,1交替序列而产生的。(3)自适应增量调制(ADM)编码原理。一般情况下,颗粒噪声对音质的影响比较大,所以要对增量调制的△的幅值取得足够小,但是△取得足够小斜率过载失真就会比较大,为了减少失真就需要提高采样率,这样就会影响信息压缩的效果。所以为了解决上述问题,就出现了自适应增量调制(ADM),其原理为:在语音信号的幅值变化不太大的区间内,取小的△值来抑制颗粒噪音;在幅值变化大的地方,取大的△值来减小过载噪音。其具体实现方法为:在颗粒噪音不产生大的影响的前提下,确定最小的△幅值。在同样的符号持续产生的情况下,将△幅值增加到原来的2倍。即当+ △、+ △这样持续增加时,如果下一个残差信号还是相同的符号,那么再将△幅值增加一倍,如此下去,并且确定好某一个最大的△幅值上限,只要在这个最大的△幅值以内同样的符号持续产生,就将△幅值继续增加下去。如果相反,残差信号值为异号时,就将前面的幅值△设为原来的1/2,重新以△/2为幅值。
2.3 基于ADPCM原理的语音编码原理
自适应差分脉冲编码调制(简称为:ADPCM)用预测编码来压缩数据量。它结合了ADM 的差分信号与PCM的二进制码的方法,是一种性能比较好的波形编码。其根据语音信号具有短时平稳性的非平稳随机过程及相邻样点间有着很强相关性的特点,采用自适应量化和自适应预测技术对语音信号进行编码。它的一个重要特点就是可以在较低的数据率的情况下,获得较高质量的重构语音。
其核心思想为:(1)利用自适应的思想改变量化阶的大小,即使用小的量化阶去编码大的差值;(2)使用过去的样本值去估算下一个输入样本的预测值, 使实际样本值和预测值之间的差值总是最小。编码器和译码器都是根据前面出现的PCM 抽样值对下一个PCM抽样进行预测,然后在接受端再恢复成先前的PCM信号。所以,发送端只需要向接受端发送预测值与实际值的误差。由于正常情况下,这些误差的幅度要比原始信号的幅度小很多,所以,对此误差进行编码所需代码的位数要比对原始信号系统编码所需要的位数少很多,从而达到压缩的目的。 ADPCM编码方法之所以是一种比较好的编码,因为其虽然有着较好压缩率,但其音质也比较好(MOS值达到4.1,最好标准为5)。另外其算法延迟较小,实现简单,成本较低。
3 视频编码方案
视频编码技术是基于MPEG标准,MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码以减小信息表示方面的统计冗余度。这几种技术的综合运用,大大增强了压缩性能。
MPEG标准主要有以下五个:MPEG-1, MPEG-2, MPEG-4, MPEG-7和MPEG-21等。这些编码技术都是很成熟的技术,在我们的方案中,对具体原理部分我们就不加以叙述,我们会比较下各种编码的优缺点,然后选择一种编码方案作为我们系统的编码方案。
3.1 基于MPEG-4视频压缩
在本系统中,我们选择MPEG-4编码技术作为我们的视频编码方案,因为在之前的MPEG-1,MPEG-2等都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在以下缺陷:(1)将图像固定地分成相同大小的块,在高压缩比情况下会出现严重块效应,即马赛克效应;(2)不能对图像内容进行访问,编辑和回放等操作;(3)未充分利用人类视觉系统特性。
MPEG-4采用了新一代视频编码技术,它在视频编码发展史上第一次把编码对象从图像帧拓展到具有实际意义的任意形状视频对象,从而实现了从基于像素的传统编码向基于对象和内容的现代编码的转变,其核心编码技术是基于AV对象(AVO,Audio visual object)的编码、存储、传输和组合。
3.2 MPEG-4视频压缩关键技术
MPEG-4除采用第一代视频编码的核心技术外,还提出了一些新的有创建性的关键技术,并在第一代视频编码技术基础上进行了卓有成效的完善和改进,其关键技术有:(1)视频对象提取技术:MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩,因此视频对象提取即视频对象分割,是MPEG-4视频编码关键技术,也是新一代视频编码的研究热点和难点。(2)VOP视频编码技术:VOP(视频对象平面)是MPEG-4编码的核心概念,其在编码过程中,针对不同VO采用不同的编码策略,即对前景VO的压缩尽可能保留细节和平滑,对背景VO采用高压缩率的策略。这种方法不但克服第一代视频压缩中的方块效应,也提高了压缩比。(3)运动估计与运动补偿技术:MPEG-4采用I-VOP,P-VOP,B-VOP三种帧格式来表征不同的运动补偿类型。它采用了H.263中的半像素搜索技术和重叠运动补偿技术,同时又引入重复填充技术和修改块(多边形)匹配技术以支持任意形状的VOP区域。
4 语音视频实时遥测系统的实现
通过上面的叙述,我们知道原始语音信号和视频信号的实时遥测非常占用资源,所以我们需要对其进行编码并压缩。在本方案中,视频压缩支持三路复合视频中的一路或者一路S-端子视频输入信号进行采样编码成数字信号,然后利用MPEG-4编码模块进行视频信号的压缩。同时可以接受另外一路通过ADPCM编码原理进行压缩的语音信号,以实现语音视频编码的混合。
MPEG-4视频信号和ADPCM语音信号同时进入到MPEG-2模块形成一个MPEG-2传输流,一个MPEG-2传输流是某些固定长度(188字节)的数据包。将这些数据包按照数据采集单元的底板接口通信协议分解成16位字,以参数形式插入到标准的IRIG-106 PCM数据帧中并进行遥测。
地面接收站接收到遥测信号后,通过地面解调设备和软件将语音信号和视频信号从PCM流中实时解调还原出来供地面人员监控。其系统框图如图1所示。
5 结语
通过对语音视频信号进行数字编码,经机载测试系统的遥测发射机进行遥测发射,这样既减小了带宽,又能使多路视频信号通过一条PCM流遥测下来;且语音信号的ADPCM码可以加入到视频信号的MPEG-2流中,进行混合编码,这样大大提高了效率,也节省了硬件资源。
按现有飞机的实施方案,1路语音加视频信号进过PCM编码后的位速率1.5Mb/s左右,而现有的机载测试系统PCM遥测发射机的遥测带宽有10Mb/s,这样1路遥测系统可以遥测6路视频加语音信号,如果用传统模拟视频发射机就需要6路遥测系统,且飞行员语音还要单独外通过无线电台方式与地面交流。
该方案经过系统调试和飞行试验,能够实现语音和视频信号的同步。采用该方案,使用一套PCM遥测系统可以遥测多路语音视频,大大节约了硬件资源和成本。
参考文献:
[1]廖广锐,刘萍.基于ADPCM语音压缩算法研究[J].计算机与数字工程,2007,第7期.
[2]林志锋,黄华灿,李学等.ADPCM语音压缩编解码器的FPGA实现[J].数字信号处理,2009,第33卷第5期.
[3]戚晓晶,李治国.视频实时传输中MPEG-4技术的应用[J].科技创新与应用,2012,2月(上).
科技类核心期刊推荐《中国科技博览》办刊宗旨:本刊坚持国家科技创新、教育创新方针,传播科技理念、报道科技动态、倡导科技创新、促进科技进步;广泛探讨交流科技、教育工作成果;多方位、多层次介绍科教创新的前沿性内容。征稿对象:全国教科研工作者、广大教师、各级科技与教育管理部门领导、科研院所、科技教育人员、科教领域管理人员、各大院校的在读博士生、硕士生及社会各界关心科教工作的人士。