阿里云通义千问团队 Qwen2 大模型开源，性能超越众多模型

aixo 2024-06-08 10:19:18

2024-06-08 10:19:18

今日，阿里云通义千问团队 Qwen2 大模型开源的消息吸引了众多 AI 开发者的目光。Qwen2-72B 性能超过了业界著名的开源模型 -70B，也超过文心 4.0、豆包 pro、混元 pro 等众多国内闭源大模型。

1.Qwen2是什么？

Qwen2是由通义千问团队精心打造的新一代大型语言模型，它不仅是Qwen1.5系列的重大升级，更是在多个维度上实现了技术的飞跃。Qwen2系列模型包括不同规模的模型，从0.5B到72B不等，以适应不同场景的需求。这些模型在自然语言处理的多个领域展现出卓越的性能，特别是在代码理解、数学推理、逻辑推理和多语言理解等方面。

核心特性：

多样化模型选择：推出了5款不同规模的预训练模型和经过指令微调的模型，包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B，以满足不同层次的需求。

扩展语言支持：在原有的中文和英文基础上，新增了27种语言的高质量数据，使得Qwen2在多语言处理上更加出色。

性能卓越：在多个评测基准测试中，Qwen2展现出了超越现有顶尖模型的领先性能。

增强数理逻辑：Qwen2在代码编写和数学问题解决方面的能力得到了显著增强，为技术领域提供了强有力的支持。

超长上下文处理：特别是Qwen2-72B-模型，支持处理长达128K 的上下文，这在大型文档理解和复杂对话处理中尤为重要。

2.Qwen2怎么用？

在和 Face上可以在线体验，在上可以下载其开源模型，本地部署体验。

Tips：下载的Qwen2系列模型目前好像有些BUG

项目地址：

:7b

传送门：

项目地址：

Qwen2魔搭项目地址：

项目地址：

Llama

阿里云通义千问团队 Qwen2 大模型开源，性能超越众多模型

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号