语音识别技术研究

  语音识别技术研究的目标是让各种机器设备能够具有和人类一样的听识能力。根据识别目标的不同,语音识别一般又分为识别说话内容的语音内容识别技术(一般通称为语音识别技术)、识别说话人身份的声纹识别技术、以及识别当前所用语种的语种识别技术。

  1、语音内容识别核心技术研究:

  1)语音的自动分割技术;

  2)声学特征鲁棒性处理技术;

  3)声学模型训练技术;

  4)高精度快速解码问题;

  5)模型自适应技术;

  2、声纹识别技术研究:

  1)短语音情况下说话人建模和识别技术;

  2)低信噪比情况下的声纹识别;

  3)声纹识别的时间飘移算法

  4)超大规模说话人集合上的快速声纹识别算法;

  3、语种识别技术研究:

  1)针对短语音语种识别的语音识别技术优化;

  2)结合高层韵律信息的语种识别技术研究;

  3)基于可编程的图形加速硬件的并行计算技术

  4、语音识别应用系统研究:

  1)语音模糊查询系统:如在海量地理信息系统中,用户使用语音进行地名查找;

  2)语音文档检索系统:在基于音频内容的多媒体管理系统中,实现用户多媒体文档进行基于内容的检索;

  3)智能语音路由系统:如实现自助式的客服系统,用户对系统进行提问和咨询;

  4)语音监控审查系统:如应用于安全领域的语音监控系统对可能的敏感词、敏感说话人或敏感语种或方言汇进行监控等。