Blizzard Challenge 2019国际语音合成评测中语音国家工程实验室再创佳绩
发布时间:2019-08-05

在刚刚结束的BlizzardChallenge 2019 国际语音合成评测活动中,中国科学技术大学语音及语言信息处理国家工程实验室与科大讯飞组建的联合团队(以下简称科大-讯飞团队)提交的参测系统再度摘下多项指标的第一名。

Blizzard Challenge是语音合成技术领域最具权威性和影响力的国际评测活动。今年的评测活动是首次以中文语音合成作为主任务,发布的公共语料库为罗振宇脱口秀风格录音数据,测试文本包括故事、百科、诗词等多种体裁,并且含有中英文混读、儿化音等难点任务。

此次评测活动吸引了多达25家参测队伍,打破了Blizzard Challenge历史上参测队伍数量的历史记录。测试指标包括合成语音自然度、与目标发音人相似度、合成语音听写错误率三个主观评测项目。科大-讯飞团队提交的基于深度学习声学建模与波形生成的参测系统摘下自然度、相似度两项关键指标的第一,错误率指标名列第四。在评价语音合成系统最关键的自然度平均意见分(MOS)指标上,该系统(4.5分)与罗振宇真人录音(4.7分)的分差只有0.2分,这也是历年评测活动中合成语音与自然参考语音自然度的最小差距。


11.png

2222.png