日本开发大规模语言模型“-LLM”正式发布
东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“-LLM”正式发布。
“-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人文社会科学领域的能力。
面对全球范围内用于大语言模型计算的GPU短缺现状,此次研究团队选择使用富士通制造的CPU。通过提升“富岳”的计算能力,研究团队成功实现了完全基于CPU的AI学习。
“-LLM”目前已向全球研究者和技术人员开放,以鼓励更多的专业人士参与到模型的进一步改进和新的应用研究中,旨在推动更多创新性研究和商业应用的发展。随着该模型的推广,预计将加速推动AI技术在各行各业的应用,尤其是在需要深度理解并运用日语的领域。
普通公众可在富士通的官网上免费下载并体验这一技术。这种开放的策略有助于提高公众对AI技术的理解和接受度,同时也可促进技术的广泛应用与可持续发展。(李杨)