香港中文大学（深圳）武执政副教授：智能语音技术研究进展

发布者：梁栋发布时间：2025-09-04 浏览次数：10

报告题目: 智能语音技术研究进展

报告人：武执政副教授香港中文大学（深圳）

主持人：余光正教授

报告时间：2025年9月5日（星期五）下午3:00-4:00

报告地点：物理楼（18号楼）二楼213报告厅

欢迎广大师生参加！

摘要：让AI像人一样自然交流是很多科学家的追求的目标。语音包含丰富的信息，不仅仅是内容，还有副语言和环境信息。副语言信息包含了情感、口音、年龄等，而环境信息表达了语音所发生的场景信息。随着研究的深入和技术的进步，口语理解系统不仅需要理解文字信息，还需要识别和处理语音中的副语言信息和环境信息，从而具有良好的共情能力，使其不仅能听得清、听得懂，还能听出“人情味”。该报告将分享人工智能如何能够像人一样有“眼力劲”，像人一样带情感的说话；该报告也将分享可扩展至多任务的语音基座模型研究进展。

个人简介：武执政博士现任香港中文大学（深圳）副教授，入选国家级青年人才、深圳市跨模态认知计算重点实验室副主任，连续多次入选斯坦福大学“全球前2％顶尖科学家”，多次获得最佳论文奖，也曾获得华为火花奖。于南洋理工大学博士学位，曾在Meta（原Facebook）、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武教授发起了开源工作Merlin、Amphion、Emilia，被超过700家单位使用（包括OpenAI）。 Amphion多次进去GitHub趋势榜榜首、Emilia成为HuggingFace音频类最受欢迎数据集（Most Liked）。武教授发起了第一届语音鉴伪国际评测、第一届语音转换国际评测，组织了2019年语音合成国际评测（Blizzard Challenge 2019）。武教授现为人工智能语音领域权威期刊IEEE/ACM TASLP、SPL等语音领域权威期刊编委, 也是IEEE Spoken Language Technology Workshop 2024的大会主席。

«返回上一级学术动态

导航

学术科研

香港中文大学（深圳）武执政副教授：智能语音技术研究进展