站内搜索

我院学生获 SLT2024 第二届未来对话系统-检索增强生成挑战赛冠军

2024年12月2日-5日,IEEE语音语言技术研讨会(Spoken Language Technology Workshop 2024, SLT 2024)在中国澳门成功举办。由邢晓芬副教授、徐向民教授指导的团队DWHLAB(成员:林华冬、陈艺荣、陶玟羽、陈铭宇)在众多队伍中脱颖而出。 “Domain Adaption and Unified Knowledge Base Motivate Better Retrieval Models in Dialog Systems with RAG”针对MobileCS2数据集中领域特殊性和知识库异构性两大挑战,综合利用标注数据和未标注数据对检索模型执行领域适应的继续预训练,并将异构知识库转换为具有QA形式的统一知识库,最后通过对比学习算法在构建的难负样本上进一步优化检索模型。该方案在比赛中取得优异成绩,荣获赛道一冠军。

SLT是由IEEE信号处理学会、语音与语言处理技术委员会主办的语音与语言处理研究领域的顶级国际会议。特定主题的挑战赛(Challenge)是SLT大会议程中的精彩部分,第二届未来对话系统-检索增强生成挑战赛(The 2nd FutureDial-RAG Challenge)是其中一项被收录的挑战赛,由中国移动和清华大学联合承办。

The 2nd FutureDial-RAG Challenge旨在利用第二版中国移动客服对话数据(Mobile Customer-Service Dialog, MobileCS2),对构建基于检索增强生成(Retrieval-Augmented Generation , RAG)的对话系统进行基准测试和激发研究。该挑战赛包括两个赛道:1)基于知识库和对话上下文的信息检索:此赛道要求构建一个基于知识库和对话上下文的检索模型,在真实客服对话中给定上下文的情况下,检索出多源数据库中和当前上下文中最相关的知识片段,进行基于测试语料的离线客观评估;2)检索增强对话系统构建:此赛道要求构建一个检索增强对话系统,进行基于测试语料的离线客观评估和人工交互式评估。

通过大赛,加强了和世界相关领域科研团队的学习和交流,拓宽了我院在该领域的视野和探索,促进了我院在该科研领域深入发展的强大动力和积极性。(文图/林华冬,初审/燕维英,复审/曾抒姝,终审/张健)

 

The 2nd FutureDial-RAG Challenge 获奖证书