通义发布1100亿参数开源模型Qwen1.5-110B

aixo 2024-05-11 06:23:51

2024-05-11 06:23:51

5月9日，阿里云正式发布通义千问2.5，并称模型中文性能全面赶超GPT-4 Turbo。同时，通义还发布了1100亿参数开源模型Qwen1.5-110B，该模型在MMLU、、GPQA等基准测评中超越Meta的Llama-3-70B，在开源大模型排行榜Open LLM 上进入榜首。

大模型技术爆发一年多，行业竞争态势激烈而又多变，通义千问走的是基础模型技术研发的路线。相比此前的通义千问2.1版，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。根据权威基准的测评结果，通义千问2.5得分追平GPT-4 Turbo，是该基准首次录得国产大模型取得这样的成绩。

大模型的训练和迭代成本极高，绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮，让开发者不必从头训练模型，也把模型选型的主动权交给了开发者，大大加速了大模型的应用落地进程。去年8月，通义宣布加入开源行列，随之沿着“全模态、全尺寸”开源路线陆续推出十多款模型，目前其开源模型下载量已经超过700万。

一个月前，百度CEO曾李彦宏公开表态的“开源模型落后论”曾引发业界公认，他称，“大家以前用开源觉得便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后”。

阿里云CTO周靖人则在9日的发布会后表示，开源大模型的意义在全球范围已经被多次证明，没有再讨论的必要。“开源对整个技术发展的意义大家都可以看到。阿里云自己做最先进的AI模型，也敢于开源，这对企业真正做创新性开发将起到至关重要的作用。”他说。

通义千问

通义发布1100亿参数开源模型Qwen1.5-110B

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号