阿里云发布通义千问2.5性能赶超GPT-4Turbo

aixo 2024-05-10 17:11:08

2024-05-10 17:11:08

5月9日，阿里云正式发布通义千问2.5，阿里云表示，该模型性能全面赶超GPT-4 Turbo。

据介绍，相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。

对比GPT-4，在中文语境下，通义千问2.5在文本理解、文本生成、知识问答&生活建议、闲聊对话，以及安全风险等多项能力上均全面赶超。

在权威基准上，通义千问2.5得分追平GPT-4 Turbo，是国产大模型首次在该基准取得这样的成绩。

此外，原通义千问APP正式宣布更名为“通义APP”。

阿里云也于今日发布了最新款开源模型1100亿参数的Qwen1.5-110B，据称该模型在MMLU、、GPQA等基准测评中超越了Meta的Llama-3-70B模型。推出的开源大模型排行榜上，Qwen1.5-110B位列榜首。

在加速技术进步的同时，国产大模型也正推进在行业落地。据披露，目前通义大模型已通过阿里云服务企业超9万、通过钉钉服务企业超过220万，通义开源模型累计下载量突破700万。通义落地应用进程加速，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

今日港股收盘，阿里巴巴港股报76.8港元/股，涨幅0.85%，总市值15647亿港元，今日开盘价为75.75港元。

GPT