通义发布1100亿参数开源模型Qwen1.5-110B

aixo 2024-05-11 06:23:51
大模型 2024-05-11 06:23:51

5月9日,阿里云正式发布通义千问2.5,并称模型中文性能全面赶超GPT-4 Turbo。同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、、GPQA等基准测评中超越Meta的Llama-3-70B,在开源大模型排行榜Open LLM 上进入榜首。

大模型技术爆发一年多,行业竞争态势激烈而又多变,通义千问走的是基础模型技术研发的路线。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。根据权威基准的测评结果,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得这样的成绩。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮,让开发者不必从头训练模型,也把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。去年8月,通义宣布加入开源行列,随之沿着“全模态、全尺寸”开源路线陆续推出十多款模型,目前其开源模型下载量已经超过700万。

一个月前,百度CEO曾李彦宏公开表态的“开源模型落后论”曾引发业界公认,他称,“大家以前用开源觉得便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后”。

阿里云CTO周靖人则在9日的发布会后表示,开源大模型的意义在全球范围已经被多次证明,没有再讨论的必要。“开源对整个技术发展的意义大家都可以看到。阿里云自己做最先进的AI模型,也敢于开源,这对企业真正做创新性开发将起到至关重要的作用。”他说。