• 首页  学术科研  学术动态> 正文
  • 香港中文大学(深圳)武执政副教授:智能语音技术研究进展

    发布者:梁栋  发布时间:2025-09-04  浏览次数:10

    报告题目: 智能语音技术研究进展

    报告人:武执政 副教授 香港中文大学(深圳)

    主持人:余光正 教授

    报告时间:2025年9月5日(星期五)下午3:00-4:00

    报告地点:物理楼(18号楼)二楼213报告厅

    欢迎广大师生参加!

     

    摘要:让AI像人一样自然交流是很多科学家的追求的目标。语音包含丰富的信息,不仅仅是内容,还有副语言和环境信息。副语言信息包含了情感、口音、年龄等,而环境信息表达了语音所发生的场景信息。随着研究的深入和技术的进步,口语理解系统不仅需要理解文字信息,还需要识别和处理语音中的副语言信息和环境信息,从而具有良好的共情能力,使其不仅能听得清、听得懂,还能听出“人情味”。该报告将分享人工智能如何能够像人一样有“眼力劲”,像人一样带情感的说话;该报告也将分享可扩展至多任务的语音基座模型研究进展。

     

    个人简介:武执政博士现任香港中文大学(深圳)副教授,入选国家级青年人才、深圳市跨模态认知计算重点实验室副主任,连续多次入选斯坦福大学“全球前2%顶尖科学家”,多次获得最佳论文奖,也曾获得华为火花奖。于南洋理工大学博士学位,曾在Meta(原Facebook)、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武教授发起了开源工作Merlin、Amphion、Emilia,被超过700家单位使用(包括OpenAI)。 Amphion多次进去GitHub趋势榜榜首、Emilia成为HuggingFace音频类最受欢迎数据集(Most Liked)。武教授发起了第一届语音鉴伪国际评测、第一届语音转换国际评测,组织了2019年语音合成国际评测(Blizzard Challenge 2019)。武教授现为人工智能语音领域权威期刊IEEE/ACM TASLP、SPL等语音领域权威期刊编委, 也是IEEE Spoken Language Technology Workshop 2024的大会主席。


    «返回上一级学术动态