学生论坛

2023年第十七届全国人机语音通讯学术会议
优秀学生论坛日程
时间:2023年12月10日(星期日)

序号

时间

报告题目

报告人

分会主席

1

11:00 - 11:08

Learning From Yourself: A Self-Distillation Method for Fake Speech Detection

薛军
安徽大学

王龙标





2

11:08 - 11:16

基于并行分支循环注意力的时频域语音分离方法

杨雪
北京工业大学

3

11:16 - 11:24

一种低延时鲁棒MVDR波束形成器的设计方法

周静
北京工业大学

4

11:24 - 11:32

基于预训练网络的半监督声音事件检测

徐亮
北京理工大学

5

11:32 - 11:40

基于汉语中介语料库的二语韵律边界偏误检测

李瑞珊
北京语言大学

6

11:40 - 11:48

海口普通话“子”缀的轻声分布差异

钱薪屹
北京语言大学

7

11:48 - 11:56

Anomalous Sound Detection Using Self-Attention-Based Frequency Pattern Analysis of Machine Sounds

张合静
哈尔滨工程大学

8

11:56 - 12:04

面向声音事件检测的特征及决策解耦初探

高利剑
江苏大学

9

12:04 - 12:12

跨年龄说话人确认:学习年龄不变的说话人表征

覃晓逸
昆山杜克大学

10

12:12 - 12:20

基于神经同态合成的语音增强研究

何树林
内蒙古大学

Lunch break

11

13:30 - 13:38

面向声纹识别的隐蔽后门攻击

叶哲
宁波大学

薛少飞 











12

13:38 - 13:46

迈向通用语音离散令牌:ASR 和 TTS 案例研究

杨亦凡
上海交通大学

13

13:46 - 13:54

基于簇感知DINO的自监督说话人验证

韩冰
上海交通大学

14

13:54 - 14:02

Towards More Realistic, Powerful, and Efficient Speech-based Self-Supervised Learning

马子阳
上海交通大学

15

14:02 - 14:10

基于噪声解耦和度量学习的鲁棒说话人识别研究

孙瑶
天津大学

16

14:10 - 14:18

利用位置相关的局部-全局依赖进行合成语音检测

刘晓晖
天津大学

17

14:18 - 14:26

用于多通道语音分离的声源位置感知全神经波束模型

付燕杰
天津大学

18

14:26 - 14:34

用于对话行为识别的基于关系匹配的局部和全局上下文建模研究

司宇珂
天津大学

19

14:34 - 14:42

基于预训练语音表征学习的少监督语音合成

强春雨
天津大学

20

14:42 - 14:50

基于多任务学习的异常声音检测建模和多尺度评分

章羽聪
武汉大学

21

14:50 - 14:58

基于ad-hoc麦克风阵列的多通道语音去混响融合模块

郭红梅
西北工业大学

22

14:58 - 15:06

Maximal Speaker Separability via Robust Speaker Representation Learning

李哲
香港理工大学

23

15:06 - 15:14

Complex Patterns of Tonal Realization in Taifeng Chinese

张小砚
中国社会科学院语言研究所

24

15:14 - 15:22

基于语音的端到端阻塞性睡眠呼吸暂停检测

张凯博
清华大学

 

注:每个报告8分钟,其中2分钟为提问时间