阿里云发布通义千问2.5性能赶超GPT-4Turbo
5月9日,阿里云正式发布通义千问2.5,阿里云表示,该模型性能全面赶超GPT-4 Turbo。
据介绍,相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。
对比GPT-4,在中文语境下,通义千问2.5在文本理解、文本生成、知识问答&生活建议、闲聊对话,以及安全风险等多项能力上均全面赶超。
在权威基准上,通义千问2.5得分追平GPT-4 Turbo,是国产大模型首次在该基准取得这样的成绩。
此外,原通义千问APP正式宣布更名为“通义APP”。
阿里云也于今日发布了最新款开源模型1100亿参数的Qwen1.5-110B,据称该模型在MMLU、、GPQA等基准测评中超越了Meta的Llama-3-70B模型。推出的开源大模型排行榜上,Qwen1.5-110B位列榜首。
在加速技术进步的同时,国产大模型也正推进在行业落地。据披露,目前通义大模型已通过阿里云服务企业超9万、通过钉钉服务企业超过220万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
今日港股收盘,阿里巴巴港股报76.8港元/股,涨幅0.85%,总市值15647亿港元,今日开盘价为75.75港元。