当前位置 :

新闻中心

微软亚洲研究院首席研究员俞栋受邀访问我实验室

  4月13日,微软亚洲研究院首席研究员俞栋受邀访问语音及语言信息处理国家工程实验室,并在科技实验西楼第二会议室做题为“Structured Computational Networks for Speech Recognition”的学术报告。报告由智能语音信息处理研究方向特任研究员杜俊老师主持,来自信息学院及科大讯飞研究院部分感兴趣的师生及专家聆听了此次精彩报告。

  在报告中,俞老师用最近提出的PAC-RNN(预测-自适应-纠正递归神经网络)作为例子,阐述了如何进一步提高语音识别系统的性能。在PAC-RNN系统中,一个特定的分类深度神经网络会基于当前帧以及一个预测深度神经网络基于历史产生的预测状态来估计状态的后验概率。分类神经网络产生的结果会反馈给预测神经网络,从而提高对于未来帧预测的准确性。

  俞老师表示,对于PAC-RNN,我们可以认为给定新的当前帧信息,分类深度神经网络能利用预测深度神经网络产生的预测状态纠正一些错误。另外,可以认为分类深度神经网络具有根据预测深度神经网络的预测结果进行自适应的行为。实验结果表明,PAC-RNN在TIMIT语音识别任务以及Babel关键词识别任务上都取得了比DNN和LSTM更好的性能。

  报告会后,俞老师和师生就相关的语音识别问题进行了互动讨论,现场气氛活跃。本次报告拓宽了研究生的学术视野,促进了国内外语音识别领域的学术交流。

  俞栋博士在中国科学院自动化研究所和Indiana University at Bloomington获得硕士学位,并在University of Idaho获得博士学位,于2002年加入微软语音研究组。目前是IEEE的高级会员、ACM和ISCA会员,担任《IEEE transactions on audio, speech, and language processing》编辑,主要研究方向涉及语音处理、语音识别的鲁棒性、口语对话系统、机器学习和模式识别等。