简述数字信号预处理包括哪些内容

1个回答

  • MFCC是计算语音信号的Mel频率倒谱系数,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系.Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域.由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降.因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC.

    MFCC参数的提取包括以下几个步骤:

     预滤波(低通):前端带宽为300-3400Hz的抗混叠滤波器.

     A/D变换:采样频率,线性量化精度.

     预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响.

     分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为32ms,帧叠为16ms.

     加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响.

     快速傅立叶变换(Fast Fourier Transformation, FFT):将时域信号变换成为信号的功率谱.

     三角窗滤波:用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应.

     求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果.

     离散余弦变换(Discrete Cosine Transformation, DCT):去除各维信号之间的相关性,将信号映射到低维空间.

     谱加权:由于倒谱的低阶参数易受说话人特性、信道特性等的影响,而高阶参数的分辨能力比较低,所以需要进行谱加权,抑制其低阶和高阶参数.

     倒谱均值减(Cepstrum Mean Subtraction, CMS):CMS可以有效地减小语音输入信道对特征参数的影响.

     差分参数:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能.可用到了MFCC参数的一阶差分参数和二阶差分参数.

    采样前的低通滤波,主要是消除采样时的频谱混叠.由硬件完成.

    预加重主要是提高高频的频谱分量.软件,硬件都可以完成.

    预加重前,也可以用高通滤波器,消除低频噪音.

    如果计算mfcc是有了预加重.之前的预加重就不要做.

    采样前的硬件低通滤波是一定要做的.