云开·全站体育app登录 基于统计模型的语音激活检测算法改进

发布于:25-02-15 播放次数:

摘要:语音激活检测技术是应用于语音聆听领域以减少节点能量消耗的关键技术,其核心是语音激活检测算法。考虑到基于统计模型的高度使用语音激活检测算法引起的高误差检测率的问题,建议通过使用相邻语音框架的逻辑和操作方法来改进它。该实验表明,改进的算法的误差检测率明显低于改进之前,这提高了语音信号检测的准确性并有效地减少了节点能量消耗。

0简介

语音激活检测技术仅在检测语音信号时才使用语音激活检测算法激活节点,以便可以将其从休眠状态切换到工作状态,并且在剩余时间内处于休眠状态。它是减少节点能耗的关键技术之一。基于统计模型的语音激活检测算法用于通过选择特征参数,根据当前框架的信息来计算模型中未知参数,获得判断力,并判断语音是否有语音,来建立统计分布模型。信号[1]基于此。它的优势是它可以适应时变噪声的特征,并且在复杂环境中具有很高的检测精度[2-4]。但是,很容易根据当前语音框架的参数来判断是否存在语音信号。因此,改善基于统计模型的语音激活检测算法以降低错误检测率对语音聆听领域具有重要意义。

1基于统计模型的语音激活检测算法

1.1算法的基本步骤

基于统计模型[2-3,5]的语音激活检测算法基于贝叶斯定理和似然比测试。测试过程分为三个步骤:提出假设,分析参数和测试判断。

1.1.1提出假设

声音信号x要测试有两个假设:一个是仅存在噪声n,然后零假设H0是正确的,并且确定未检测到语音。另一个是语音s和噪声n同时存在(S和N彼此无关),那么,如果选择H1是正确的,则确定已经检测到声音,可以描述为:

H0:x(t)= n(t)(1)

确定没有语音信号。

H1:x(t)= n(t)+s(t)(2)

确定存在语音信号。

1.1.2分析参数

首先,应根据其频率特性进行周期性采样,以使波形参数从连续时间序列变为离散时间序列。然后,基于采样信号的绝对幅度绘制直方图,计算概率密度表达式,模拟语音信号由数字参数表示[1]。噪声信号的离散傅立叶变换系数,T框架中的纯语音信号和噪声信号如下。

x(t)= [x0(t),x1(t),…,xm-1(t)] t(3)

s(t)= [s0(t),s1(t),…,sm-1(t)] t(4)

n(t)= [n0(t),n1(t),…,nm-1(t)] t(5)

在x(t),s(t)和n(t)中,KTH光谱分量的系数分别为XK,SK和NK。 XK(R)和XK(i)分别表示离散傅立叶变换系数XK的真实和虚构部分。假设每个DFT系数的实际和虚部遵守拉普拉斯概率密度函数,如果实际部分是假想部分之间的方差相同,则显示XK(R)和XK(i)的概率密度分布在公式(6)和等式(7)中。

语音离散信号处理时间多久_离散时间语音信号处理_离散时间语音信号处理pdf

在,

它是指XK方差的平方根。由于XK的实际部分和虚构部分近似独立,并且它们的方差可以被认为是相等的,因此XK的概率密度函数可以表示为[1,6]:

H0和H1的条件概率密度函数为:

语音离散信号处理时间多久_离散时间语音信号处理_离散时间语音信号处理pdf

其中λs,k和λnkaiyun.ccm,k分别代表SK和NK的方差。

1.1.3检查判决

基于两个假设的条件概率密度函数,计算KTH频谱分量的似然比:

其中,λk是基于拉普拉斯统计分布模型的语音激活检测算法的KTH光谱分量的判断统计。分析噪声添加的语音后,基于公式(11)计算信号的KTH光谱分量的似然比。在实际应用中,为了使计算简单,瞬时光谱振幅| xk |可以使用而不是

两个假设的拉普拉斯概率密度如图1所示。在两个概率密度曲线的交点处,p(xk | h0)= p(xk | h1),似然比λk= 1;在两个交叉点之间,p(xk | h0)> p(xk | h1),λk1,然后h1的概率大于h0,而h1是正确的,也就是说开yun体育app官网网页登录入口,检测到语音信号。

离散时间语音信号处理pdf_离散时间语音信号处理_语音离散信号处理时间多久

1.2算法的过程

基于统计模型的语音激活检测算法的过程如图2所示。

离散时间语音信号处理pdf_语音离散信号处理时间多久_离散时间语音信号处理

2对算法的改进

2.1改进想法

算法改进是指逻辑和操作的概念,表1中显示了基于统计模型算法:(1)如果KTH帧的信号检测确定结果(K是一个正整数大于或等于1)的是“ 0”,k-1帧的信号输出结果为“ 0”,然后在操作结果之后为“ 0”,表明没有语音信号; (2)如果k-th帧信号检测确定结果为“ 0”,则K-1帧信号检测确定结果为“ 1”,操作后的结果为“ 0”,也可以判断那里没有语音信号; (3)如果K-th帧信号检测判断的结果为“ 1”,而K-1-trage信号检测判断的结果为“ 0”,那么计算的结果仍然是“ 0”。 ”,仍然被判断为没有语音信号; (4)仅当两个检测结果为“ 1”时云开·全站体育app登录,操作后的结果为“ 1”,语音信号才能存在。只有当当前帧信号的判断结果为“ 1”时,才有可能判断有语音信号。因此,为了简化判断,只有当当前帧判断结果为“ 1”时,只能执行操作和操作。

离散时间语音信号处理_语音离散信号处理时间多久_离散时间语音信号处理pdf

2.2改进算法的过程

改进的算法的工作原理是采样和构架语音信号,然后根据上一节中的检测和激活算法来完成K-th帧信号的验证判断,然后将结果存储在寄存器中。如果结果为“ 0”,请返回以继续完成后续帧。如果结果为“ 1”,请使用上一个帧信号执行计算,并根据计算结果完成最终判断。改进的算法流如图3所示。

离散时间语音信号处理pdf_语音离散信号处理时间多久_离散时间语音信号处理

3。改进的算法验证和分析

3.1测试步骤和结果

MATLAB平台用于检测和模拟语音信号。该仿真主要完成基于统计模型(用算法1表示)的语音激活检测算法的误差检测率,并在不同的噪声环境下改进的算法(用算法2表示)。

测试步骤如下:(1)在更安静的环境中记录一个大约6 s的语音剪辑作为原始样本,并将其保存在.wav格式中; (2)分别将原始语音样品与车辆噪声和人群噪音混合; (3)使用两种检测算法模拟信噪比0〜20 dB之间的混合信号以获得误差判断率。测试结果如图4和5所示。

离散时间语音信号处理pdf_语音离散信号处理时间多久_离散时间语音信号处理

3.2测试结果的分析

在车辆噪声环境中,算法的误差检测率随信噪比的增加而增加。这是因为车辆噪声和语音信号之间的差异导致算法同时增加信噪比增加,并且错误率相同。增长率大于准确性的增长率。在人群噪声环境中,算法的误差检测率随信噪比的增加而降低。

在相同的信噪比的情况下,在噪声环境中,改进的算法明显低于语音信号的先前误差检测率,而信噪比则相同,这提高语音信号检测;当语音激活检测时,该技术是在且仅在检测到语音信号时激活语音聆听节点从休眠状态切换到工作状态。因此,改进的算法可减少节点的能量消耗并扩展节点的生命周期。

4结论

基于统计模型的改进的语音激活检测算法是通过相邻的帧逻辑和方法实现的。实验结果表明,在改善算法后,语音信号的误差检测率显着低于改进之前,这会降低节点的能量消耗并延长节点寿命,并适用于便携式语音检测设备。

参考

[1] Peng Lihua。关于高噪声环境中语音激活检测技术的研究[D]。武汉:瓦兹港科学技术大学,2007年。

[2] Sohn JS,Sung Wy。使用基于软决策的噪声频谱适应的语音活动探测器[C]。 IEEE语音编码研讨会论文集,1998:365-368。

[3] Cho YD,KondozA。基于统计模型的语音活动检测器的分析和改进[J]。 IEEE信号处理信,2001,8(10):276-278。

[4] Dai Qijun,Bian Zhengzhong,Chen Yanpu等。基于统计模型[J]的音频/静默检测语音信号检测的研究。 Xi'an Jiotong大学杂志,2002,36(8):839-846。

[5] Ephraim Y,Malah D.使用最小方误差短时频谱振幅估计器[J]使用最小方误差的语音增强。 ACOUST语音和信号处理的IEEE交易,1984,32(6):1109-1121。

[6] Jing Zhanrong,Yang Yan。信号检测和估计[M]。北京:化学工业出版社,2004年。