还剩4页未读,继续阅读
文本内容:
第四章语音信号分析思考题答案
1、短时能量短时平均幅值和短时过零率的定义是什么?这两种时域参数的用途有哪些?窗口函数的长度和形状对它们有什么影响?常用的有哪几种窗口?设加窗分帧处理后得到的第帧语音信号为则其短时能量为n xm,nN-l hI纥=点小短时过零率定义为,=万皿03E5-D]|浊音的短时平均幅度最大而短时过零率最低清音的短时平均幅度居中而短时过零率最高,无声的短时平均幅度最低而短时过零率居中一个好的窗函数的标准是:在时域因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;在频域要有较宽的带3dB宽以及较小的边带最大值常用的窗函数有矩形窗和汉明窗
2、短时自相关函数和短时平均幅差函数的定义及其用途是什么?在选择窗口函数时应考虑什么问题?21短时自相关函数的定义为尺仆=Zx„znx„i dWKm+对于浊音,通过计算其短时自相关函数,找到自相关函数的最大值,则可以检测其基音周期计算自相关函数所用的窗口长度与平均能量等情况略有不同这里,值至少N要大于基音周期的两倍,否则将找不到第一个最大值点另一方面,值也要尽可N能地小,否则将影响短时性因此长基音周期要用宽的窗,短基音周期要用窄的窗
3、语音信号的短时谱的定义是什么?如何利用FFT求语音信号的短时谱?如何提高短时谱的频率分辨率?如何利用实数序列傅里叶变换的频谱具有的对称性?什么是语音信号的功率谱?为什么在语音信号数字处理中,功率谱具有重要意义?对第帧语音信号进行离散时间傅里叶变换,可得到短时谱nNTXe=mem—0令相当于是对上式在频域的取样,可以用来计算w=2pik/N,FFT.2id H,2-nkmMe」丁=X.A=E*me-Jm=0在语音信号数字处理中,功率谱具有重要意义,在一些语音应用系统中,往往都是利用语音信号的功率谱s〃产=炭・x;『=|XJeN-\仆…工RS e=|X e|2=n nG=-N+
14、请叙述同态信号处理的基本原理(分解和特征系统)倒谱的求法及语音信号两个分量的倒谱性质是什么?有哪几种避开相位卷绕的方法?请叙述它们的工作原理如图所示为一卷积同态系统的模型,该系统的输入卷积信号经过系统变换后a输出的是一个处理过的卷积信号这种同态系统可分解为三个子系统,如图所示,b即两个特征子系统(它们只取决于信号的组合规则)和一个线性子系统(它仅取决于处理的要求)第一个子系统,如图所示,它完成将卷积性信号转化为加性c信号的运算;第二个子系统是一个普通线性系统,满足线性叠加原理,用于对加性信号进行线性变换;第三个子系统是第一个子系统的逆变换,它将加性信号反变换为卷积性信号,如图所示图中,符号*、+和•分别表示卷积、加法d和乘法运算a*++++乃(〃)*及(川xn xnyn ynbcd1Z[%]=Xz=X[z-X z22lnXz=lnX z+l L¥z=X z+i z=XzI I2I
2、3Z”[z]=Z-1[X z+X z]=%n+%n=xn12I21Z[yn]=yz=y z+y zi2,2exp yz=yz=Yiz•%z3yzi=ZT[Kz•%z]=%*y n
25、什么是复倒谱?什么是倒谱?已知复倒谱怎样求倒谱?已知倒谱怎样求复倒谱?有什么条件限制?虽然」・]与・]系统中的£和夕信号也均是时域序列,但它们所处的离散时域显然不同于%〃和口所处的离散时域,所以称之为“复倒频谱域”以〃是欠屋的“复倒频谱”,简称为“复倒谱”,有时也称作对数复倒谱同样,序列》八也是y〃的复倒谱在绝大多数数字信号处理中,Xz、Az、Yz、Pz的收敛域均包含单位圆,因而]与・]系统有如下形式/[%〃]二—・]/e%=ln[Xy]%n=F-1[Xej]Kejw=F[yn]巾*]re=exp[re]n=F-,[yejw]7设Xe%=|Xe%|ejarg[xejw]则对其取对数得Xejw=ln|Xej|+jarg[Xejw]即复数的对数仍是复数,它包含实部和虚部由于对数的虚部arg[Xe®]是Xe~的相位,所以将产生不一致性如果只考虑发小的实部,并令cn=F-1[ln|Xejw|]显然c〃是序列化〃对数幅度谱的傅里叶逆变换°c〃称为“倒频谱”或简称为“倒谱”,有时也称“对数倒频谱”倒谱对应的量纲是“Quefnmcy”,它也是一个新造的英文词,是由Frequencyv转变而来的,因此也称为“倒频”,它的量纲是时间c〃实际上就是要求取的语音信号倒谱特征
6、如何将信号模型转化为模型参数?最常用的是什么模型?什么叫逆逼近和逆滤波器?什么叫线性预测和线性预测方程式以及如何求解它们?由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数而这组预测系数就反映了语音信号的特性,可以作为语音信号特征参数用于语音识别、语音合成等最常用的是线性预测模型⑺GE4z=1-X aizi=iSz线性预测中的成为逆滤波器:Az线性预测分析的基本思想是用过去个样点值来预测现在或未来的样点值pp5n=[Q,S ri-ii=1预测误差£“为p屋ezi=s-.szi=sn-5-ii=i通常用莱文逊一杜宾算法来求解
7、什么叫线谱对?它有什么特点?它是如何推导出来的?有什么用途?线谱对分析也是一种线性预测分析方法,只是它求解的模型参数是“线谱对“线谱对是频域参数,因而和语音信号谱包络的峰有着更紧密的联系;同时它构成合成滤波器时容易保证其稳定性,合成语音的数码率也比用格型法求解时要低Hz具体推导过程参见教材第页72-
738、什么叫MFCC和LPCMCC如何求解它们?是频率倒谱系数的简称,该分析着眼于人耳的听觉特性,因为,人耳MFCC Mel所听到的声音的高低与声音的频率并不呈线性正比关系,而用频率尺度则更符合Mel人耳的听觉特性具体求解步骤参加教材第页65-66为倒谱系数,即通过求解的倒谱系数再转换成符合人LPCCMFC LPCMel LPC听觉特性的尺度,进行非线性变换,从而求出倒谱系数Mel LPCMelC+a•MCn+1k=0n0MC,n=-1-a2-MC zi+l+a-MC/n+l k=l0MC_^n+1+aMC*n+1-MC_zz klkA
9、小波分析的意义是什么?有什么特点?小波变换则针对短时傅里叶变换的缺点,采用了一种面积固定不变但形状不断改变的分析窗口来对非平稳信号进行变换小波分析采用具有时域局域化特性的小波函数作为基底,无论低频还是高频的局部信号,它都能自动调节时频窗以适应实际分析的需要小波分析在局部时域分析中具有很强的灵活性,能聚焦到信号时频段的任意细节因此小波变换具有多分辨分析的特点,其在时频两域都具有表征信号局部特征的能力,是一种时间窗和频率窗都可以改变的时频局部化分析方法小波变换在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于分析非平稳信号因为语音信号是一种典型的非平稳信号,因此小波变换在语音信号处理中也有广泛的应用在语音信号的压缩、端点检测以及基音检测等多个方面小波变换均有着极为成功的应用。