2017年8月20至24日,语音通信领域的国际顶级学术会议INTERSPEECH 2017在瑞典斯德哥尔摩召开,我校2015级电子系本科生王诗宇同学以第一作者身份题为“Phonetic Restoration of Temporally Reversed Speech”的论文被会议录取,参会并作海报报告。该论文发现时域上反转的普通话的可懂度在很大程度上受到韵母(vowel)段反转的影响,保留原始声母(consonant)段并没有提高时域上反转语音的可懂度;此外,时域反转的精细结构(fine structure)波形包含大量的可懂度信息,表明时域反转语音信号的可懂度不完全归因于语音信号包络波形中的幅度调制。论文指导老师为电子与电气工程系陈霏副教授。
INTERSPEECH是由国际语音通信协会 ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会,该会议每年举办一次,每次都会吸引全球语音信号领域以及人工智能领域知名学者、企业以及研发人员参加。本届会议的主题为“Situated Interaction”,研究内容涵盖了语音感知、生成和获取,语音编码和增强,语音识别,语音合成,说话人和语种识别,语音和音频信号分析,口语对话系统等多个方向。
另,电子系本科同学韩怡媛以第一作者身份在美国声学学报期刊(<The Journal of the Acoustical Society of America>)发表文章“Relative contributions of formants to sentence intelligibility in Mandarin Chinese”(http://asa.scitation.org/doi/10.1121/1.4983747),该工作研究了言语识别中,语音信号的各个共振峰对于言语识别率的相对贡献,发现第二共振峰(The second formant, F2)携带更多的言语可懂度信息,该研究对于设计语音编码策略和降噪算法有重要的指导作用。