当前位置 :

新闻中心

空时信号研究团队在基于张量模型的多通道 语音增强研究方面取得进展

  语音是人类之间信息交流最重要的方式,也是信息传播的重要途经之一。然而在很多场合中,由于受到复杂环境噪声的影响或者通信信道噪声甚至其他人声音的干扰,我们听到的语音并不是纯净的。语音增强算法可以在一定程度上减轻或者抑制背景噪声以及分离出目标语音,使得人们听到高质量的语音信号,因此语音降噪或者语音增强技术是语音信号处理系统和通信系统等领域的重要技术分支。

  目前,中国科大语音及语言信息处理国家工程实验室叶中付教授研究团队针对背景噪声是白噪声和色噪声的多通道语音降噪算法展开了深入研究,基于张量代数分析方法,探索把多通道麦克风采集的数据表示成三维甚至更高维的张量形式。针对白噪声,研究团队首先提出了一种基于张量模型的多通道语音增强算法,该算法将接收到的多通道语音数据表示为一个三阶张量,并设计三个模式滤波器即帧内滤波器、帧间滤波器和空间滤波器,对该张量进行多维度滤波从而估计出干净的语音信号;然后针对色噪声,通过对上述算法做了三个有效的补充,提出了改进算法。这两种语音增强算法均取得了很好的降噪效果,研究成果均以正式论文的形式发表在IEEE Signal Processing Letters上。论文作者为博士研究生童仁杰及其导师叶中付教授等。

  论文信息:

  1.       Tong R, Bao G, Ye Z. A higher order subspace algorithm for multichannel speech enhancement[J]. IEEE Signal Processing Letters, 2015, 22(11): 2004-2008.

  2.       Tong R, Ye Z. Supplementations to the Higher Order Subspace Algorithm for Suppression of Spatially Colored Noise[J]. IEEE Signal Processing Letters, 2017.