当前位置 :

新闻中心

语音及语言信息处理国家工程实验室在2016国际语音合成评测中取得优异成绩

  在刚刚结束的国际语音合成评测活动中,语音及语言信息处理国家工程实验室报送的参测系统取得了自然度、相似度、可懂度、段落表现等所有测试指标的最高分。

  国际语音合成评测活动开始于2005年,是现今国际上规模最大、最具影响力的语音合成评测活动,历届活动吸引了美国卡耐基-梅隆大学、英国爱丁堡大学、日本名古屋工业大学、IBM研究院、微软亚洲研究院等语音技术领域的世界一流研究机构与企业参加。

  与前两年的测试不同,2016年的测试活动再次将主要测试语种由非英语语种转换到英语,要求参测单位使用一个5小时的英文儿童有声读物音库构建语音合成系统。主办方拟定的测试指标除了传统的相似度、自然度、听写错误率外,还有针对故事合成的段落表现评分,其包括总体感觉、愉悦度、停顿等共7项指标。今年的测试活动共吸引了全球共16个单位提交参测系统。

  在不到两个月的时间内,语音及语言信息处理国家工程实验室的语音合成研究团队克服了准备时间段、音库容量有限、录音风格变化大等困难,充分发挥了其核心技术优势,采用了基于统计声学模型的单元挑选与波形拼接合成方案,研发了结合深度神经网络的代价计算等新技术,高质量完成了语音合成系统的构建。最终提交的参测系统在自然度、相似度、可懂度、段落表现等所有测试指标上均取得了所有参测系统的最高分。其中,所提交参测系统的自然度平均意见分(MOS)达到了4.2分,是唯一超过4.0分的参测系统。