内容提要

1.数字信号处理基础

2.常用特征提取

1.数字信号处理基础1.1模拟信号到数字信号的转化(ADC)—— 采样和量化

语音信号处理和自然语言处理(语音信号处理以及特征提取)(1)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(2)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(3)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(4)

1.2频率混叠现象

语音信号处理和自然语言处理(语音信号处理以及特征提取)(5)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(6)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(7)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(8)

Q2:为什么会出现频率混叠这种现象呢?

答:肯定存在一个正弦波采样不满足奈奎斯特定理

1.3奈奎斯特定理

语音信号处理和自然语言处理(语音信号处理以及特征提取)(9)

频率混叠中的图(b)显然不满足奈奎斯特定理,故产生了频率混叠

1.4离散傅里叶变换(DFT)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(10)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(11)

1.4.1DFT的定义

给定一个长度为N的时域离散信号x(n),对应的离散频域序列为X(m)为:

语音信号处理和自然语言处理(语音信号处理以及特征提取)(12)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(13)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(14)

1.4.2DFT的性质

语音信号处理和自然语言处理(语音信号处理以及特征提取)(15)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(16)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(17)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(18)

对x(n)左移k个采样点,得到x_{shift}(n) =x(n-k),对x_{shift}(n)进行DFT,有

语音信号处理和自然语言处理(语音信号处理以及特征提取)(19)

1.4.3DFT的频率轴

语音信号处理和自然语言处理(语音信号处理以及特征提取)(20)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(21)

为了提高DFT频率轴的分辨率,而不会影响原始信号的频率成分。我们可以将时域长度为N的信号x(n) 补0,增加信号的长度,从而提高频率轴分辨率。对信号进行补0的操作,不会影响DFT的结果,这在FFT(快速傅里叶变换)中和语音信号分析中非常常见。比如,在语音特征提取阶段,对于16k采样率的信号,一帧语音信号长度为400个采样点,为了进行512点的FFT,通常将400个点补0,得到512个采样点,最后只需要前257个点。

2.Fbank和MFCC特征提取

语音信号处理和自然语言处理(语音信号处理以及特征提取)(22)

Inverse Fourier transform of logarithm of spectrum 对数谱的逆傅里叶变换

2.1 Step1 预加重

语音信号处理和自然语言处理(语音信号处理以及特征提取)(23)

2.2 Step2 加窗分帧

语音信号处理和自然语言处理(语音信号处理以及特征提取)(24)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(25)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(26)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(27)

2.3 Step3 DFT

在经过上一步的加窗分帧后,会将原语音信号分割成很多个小段的语音信号,但这个小段语音信号并不是在时域上离散周期的,因此需要周期延拓,把这400个采样点认为是某个语音信号的一个周期来进行DFT

语音信号处理和自然语言处理(语音信号处理以及特征提取)(28)

2.4Step4 梅尔滤波器组和对数操作

语音信号处理和自然语言处理(语音信号处理以及特征提取)(29)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(30)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(31)

上图中,左边的倒谱明显是有两种正弦波复合而成,红线所示的正弦波与比较尖锐的正弦波(即高频和低频),低频的称为谱包络,高频的称之为谱细节,而谱包络的峰值称为共振峰,频域信号可以分解成谱包络(Envelope)和谱细节的乘积,不同音素的谱包络和共振峰具有区分性,为了提取谱包络,进行对数操作,即右边的变换

对X[m] = H[m]E[m]进行对数操作后,可变换为log|X[m]| = log|H[m]| log|E[m]|,此时谱包络和谱细节都将被提取到

Step5 IDFT

语音信号处理和自然语言处理(语音信号处理以及特征提取)(32)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(33)

Step6 动态特征计算

语音信号处理和自然语言处理(语音信号处理以及特征提取)(34)

语音信号处理和自然语言处理(语音信号处理以及特征提取)(35)

Step7 能量计算

语音信号处理和自然语言处理(语音信号处理以及特征提取)(36)

,