大语言模型在语言（翻译）测评中的应用

讲座伊始，韩教授梳理了语言模型发展的四个阶段。从基于统计的n-gram，基于神经网络的Word2vec、NLP，基于预训练表征方法的ELMO、BERT，到2020年大语言模型GPT-3的发布，每一个阶段都体现了机器语言处理能力的重大飞跃。韩教授指出人文社科领域与计算机科学相结合是目前的研究趋势，他详尽介绍了大语言模型在社会学、心理学、语言学等6大领域的25个典型任务，鼓励大家主动思考自身研究主题和大语言模型结合的可能性，并指出这仍是目前学术研究的“蓝海”。

随后，韩教授结合最新权威文献详细阐述了大语言模型在语言测试领域的具体应用和重要关切点。这方面的研究可以重点探索阅读与听力测试中的试题自动生成质量，对比生成题目类型、提示工程（prompt engineering）等对于生成题目质量的影响，探索写作与翻译形成性评估中人工智能辅助反馈的质量和效果等前沿课题。

韩教授还结合新加坡国立大学进行的5项大语言模型在口笔译测试中的研究，抽丝剥茧地向我们揭示了严谨的实验设计和数据分析过程，以及在科研过程中如何将探索性实验逐步拓展为系列研究，为不同语言测试方向的师生都带来了启发，有力提升了大家的设计思维和科研思维。

最后，在讨论环节，韩教授和在场师生共同探讨了读后续写语料标注、大语言模型生成语料调试、翻译黄金标准等热点话题。

本次讲座加深了外国语学院师生对大语言模型在语言测试应用这一文工结合领域的了解，提供了测试与翻译研究的新思路，为大语言模型赋能外学科发展注入了新活力。

主讲人简介：

韩潮，新加坡国立大学人文社科学院副教授，博士生导师。研究兴趣包括语言（口笔译）测试与评估、研究的可复制性与元研究、以及研究方法论。近年来，在语言测试、教育评估以及口笔译研究领域发表了学术论文60余篇，其中在Language Testing，Assessment and Evaluation in Higher Education，Computer Assisted Language Learning，Interpreting和Target等SSCI期刊上发表了近40篇研究论文。

文字王琼婕、赫雨萌

图袁洁

地址：：广州天河五山华南理工大学22号楼

电话：020-87111604

邮编：510641

印度洋岛国研究中心微信公众号

外国语学院微信公众号