大模型与语言资源学术研讨会在广州大学举行,推动粤语语料库建设与大模型评测
信息时报讯(记者 黄淑仪 通讯员 广大宣)11月14日,大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会在广州大学黄埔校区举行。此次大会由广州大学与广州市社会科学界联合会联合主办,汇聚了相关部门负责人、学术委员会专家学者以及产业企业代表等百余位嘉宾,旨在推动语言资源的数字化与大模型应用的多语言服务化,标志着广东省在粤语语料库建设方面迈出了重要一步。
粤语是岭南文化重要基因和特色要素,为弘扬广州历史文化,传承广州千年文脉,广州大学与广州市社科联经过多次调研、多方论证,决定以人工智能时代粤语语言的传承发展为着力点,合作共建“粤语语料库建设与大模型评测重点实验室”(下称“实验室”)。现场,随着嘉宾共同启动重点实验室,标志着该实验室正式投入使用。
粤语语料库建设与大模型评测重点实验室启用。通讯员供图
据悉,实验室以广州大学为主体,依托广州大学网络空间安全学院、人文学院、新闻与传播学院,打造跨学科协同创新科研平台。接下来,重点实验室将围绕粤语文化精神标识体系研究、通用粤语语料库建设、大模型粤语言语交互质量评测、大模型粤语言语交互质量提升研究四个方向开展科学研究。广州大学副校长张其学指出,粤语语料库建设与大模型评测重点实验室的成立,不仅能推动粤语文化的数字化传承,更能在粤港澳大湾区乃至全球的文化交流与合作中发挥积极作用,还将成为广州大学跨学科发展中的重要学术平台。
重点实验室主任、广州大学齐佳音教授介绍实验室相关情况。通讯员供图
会上,重点实验室主任、广州大学齐佳音教授介绍,重点实验室将通过建立岭南文化核心语料及细分领域知识库、粤语数据资产库、粤语高质量数据集,以重点实验室为载体形成面向人工智能应用的粤语文化数据资源基础服务能力以及面向人工智能粤语服务的内容安全合规评测能力,为粤语的数据化、资源化、服务化和产业化助力。
实验室采取1+1+N的运行机制,由广州大学和广州市社会科学界联合会联合共建,采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。重点实验室第一期建设周期为五年。实验室设立“双首席科学家”。由中国工程院院士、广州大学网络空间安全学院名誉院长方滨兴院士,香港科技大学(广州)党委书记、广州大学二级教授屈哨兵教授分别担任重点实验室技术首席专家与语言首席专家,承担学术指导和咨询工作,保障重点实验室学术发展方向。
为首席专家颁发聘书。通讯员供图
现场,方滨兴院士、屈哨兵教授以及北京语言大学语言资源高精尖创新中心主任荀恩东教授分别作了精彩的主旨报告,分享了他们在大模型技术、语言资源研究、语料库建设等方面的最新成果与见解。当日下午,与会专家学者及产业界代表在参观了广州大学中央实验室后,围绕大会主题展开了深入的交流与研讨。