新加坡国立大学人类语言技术实验室研究员杨继臣来访语音国家工程实验室并做学术报告
发布时间:2021-09-21

       2021918日上午,新加坡国立大学研究员杨继臣博士受语音及语言信息处理国家工程实验室凌震华教授的邀请,在科大西区科技实验西楼118会议室做了题为“Features based on subband transform and multi-level transform for anti-spoofing的精彩报告。本次报告由凌震华教授主持,信息学院部分感兴趣的师生参加了报告会。

1632464329150740.jpg

  杨老师首先介绍了伪造语音检测任务的研究背景和发展情况,接着就伪造语音检测任务上使用的两种前端特征处理技术,分子带变换和多级变换展开了详细介绍。其中,分子带变换技术首先将恒Q变换后得到的频谱分成多个子带,然后在各个子带上应用离散余弦变换以提取频谱信息。而多级变换以逐级处理的方式提取恒Q变换后得到的频谱信息,以前一级的离散余弦变换结果前12个系数作为主要信息,剩余部分作为下一级离散余弦变换的输入,最后将多级离散余弦变换的主要信息结合作为特征输出。在ASVspoof2015数据集上的实验结果表明,两种前端特征处理技术搭配后端深度神经网络在伪造语音检测任务上表现出色,尤其是基于多级变换的方式取得了迄今为止的最佳检测性能。

1632464378139973.jpg

报告结束后,杨老师耐心地聆听与回答了在场师生的提问。本次报告会在探讨与掌声中圆满结束。


【个人简介】

杨继臣2010年毕业于华南理工大学,获通信与信息系统专业博士学位,师从贺前华教授。2011-2015年在华南理工大学做博士后,师从蔡敏教授和贺前华教授。期间主持国家博士后科学基金和国家自然科学基金青年基金各一项。2016-2020年先后在新加坡资讯通讯研究院和新加坡国立大学做研究员,师从李海洲教授。自从2007年9月读博以来,研究方向一直是语音信号处理,目前研究兴趣主要有说话人识别,伪造语音检测和声音转换等。近5年,在IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)发表论文4篇,在IEEE Transactions in Information Forensics and Security (TIFS)发表论文1篇。目前为IEEE 高级会员,担任TASLP和International Journal of Speech Technology的审稿专家。