(EvaHan2023古籍文白翻译国际比赛冠军)
近日,华工创新院大数据智能识别与智能系统创新平台金连文教授团队在EvaHan2023古籍文白翻译国际比赛中斩获冠军。金连文教授团队凭借在古籍领域长期积累的丰富大数据资源,加以自动生成的对话模板,通过大模型指令微调技术训练,构建数字人文模型——通古大模型。该模型可智能实现文白翻译、句读标点和古籍检索等功能,使大众更便捷有效地了解中国传统文化。
千年华夏文明留下的海量古籍文献,具有宝贵的历史价值和社会价值。但由于语言演变,通读理解古籍文献难度大,知识储备要求高。金连文教授及其团队一直致力于利用先进的AI技术使古籍阅读更简单,先后发布“通古大模型”“古籍文档分析与识别系统”“彝文文档分析识别系统”等多项成果,为我国古籍文物数据挖掘、知识发现、智能化开发与利用等领域提供了技术支撑。
依托华工创新院提供的完善研发与成果转化条件,金连文教授团队目前还致力于开发业内先进的古籍文档分析与识别系统,集成古籍句读(自动标点)和文本翻译两大功能,未来用户只需提供一张古籍图片,系统便能自动识别并定位其中所有的文本,并将识别文本按照正确的阅读顺序排序,添加标点符号并翻译为现代文,方便阅读理解。
古籍文献是中国丰富传统文化的重要载体,金连文教授团队开发的一系列技术,有助于促进中华优秀传统文化传承与发展,对增强国家文化软实力、民族自信具有重要意义。(图文/华工创新院)