当前位置 :

新闻中心

语音及语言信息处理国家工程实验室研究团队包揽世界顶级语音识别大赛三项冠军

  美国当地时间9月13日,国际多通道语音分离和识别大赛(CHiME)组委会宣布,由语音及语言信息处理国家工程实验室领衔的中国技术团队包揽了赛事全部三个项目的冠军。

  据悉,CHiME比赛重点解决的是真实、复杂场景下的语音识别,因此是语音识别领域最高难度的比赛之一。参赛的各个语音系统需要克服高噪声、混响等干扰,在咖啡厅、公交车、街道等日常生活场景中,准确地识别和处理英文语音。

  语音系统在六麦克风、双麦克风和单麦克风场景这三个项目中表现优异,并大幅刷新了各项目的纪录。比如,在六麦克风场景下,系统的词错误率降至2.24%,相比历史成绩,错误率下降了逾六成。

  

 

  各参赛机构词错误率对比(六麦克风):实验室2.24   


  各参赛机构词错误率对比(双麦克风):实验室3.91  

   各参赛机构词错误率对比(单麦克风):实验室9.15

 

  参赛系统凝聚了中国科学技术大学杜俊教授团队、科大讯飞研究院、西北工业大学陈景东教授、佐治亚理工学院李锦辉教授等国内外知名专家的合作成果。大赛组委会认为,在复杂场景语音识别任务上,“该系统已经给出了接近完美的解决方案”。

  CHiME比赛始于2011年,今年由谷歌公司承办。它由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等知名研究机构所发起,旨在使学术界和工业界提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性。