华东师范大学等联合研发东巴古籍智能翻译系统,助力传承世界唯一存活象形文字
近日,由华东师范大学与丽江师范学院组成的社会实践团队联合丽江市东巴文化研究院,依托语言文字基础理论与多种人工智能技术,成功研发并发布东巴古籍智能翻译系统。
东巴文是纳西族的独特文字,拥有1400多个单字,是目前世界上唯一存活的象形文字,被誉为文字的“活化石”。丽江市东巴文化研究院编著的《纳西东巴古籍译注全集》于2003年被联合国教科文组织列入《世界记忆名录》。然而,由于其字符的多样性和非标准化特征,传承复杂且充满挑战。
基于此,2021年底,华东师范大学、丽江师范学院和丽江市东巴文化研究院组建跨领域专家团队,启动东巴古籍智能翻译系统研发项目。系统以实际翻译流程建模,构建“图像—语音—直译—意译”级联式智能翻译流程。在人工采集与专家协作基础上,建立包含个手写东巴文的数据库,集成组“形、音、义”多模态数据集。通过深度学习技术,实现对东巴古籍中象形文字的智能化识别与分割处理,并以华东师范大学智能教育研究院自主研发的教育大模型为基座,经过大量语料数据训练,实现东巴文智能翻译的领域适应。
经过近3年的努力,该系统初步实现东巴古籍的智能识别与翻译功能,不仅可以实时反馈提供修改建议,优化翻译流程,还支持用户对翻译结果进行个性化调整,以满足专业研究的需求。
丽江市东巴文化研究院院长和洁蕾表示,该系统的研发是数智时代背景下人工智能与多学科交叉融合的探索,将推动东巴古籍文献的深度保护、研究和利用。
据悉,三方还将深入探索东巴文的语义和文化细节,扩展多模态语料库,持续优化和迭代东巴古籍智能翻译系统。(记者 李兴文 李铁成 和茜)