通义千问中文性能追平GPT-4?

aixo 2024-05-10 18:23:23
大模型 2024-05-10 18:23:23

在通义大模型发布一周年之际,阿里云再度公布新进展。5月9日,阿里云举行了阿里云AI峰会—北京站,正式发布通义千问2.5,据悉,该模型中文性能全面赶超GPT-4 Turbo。同时阿里云还公布,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B(meta的模型),成为开源领域最强大模型。

据介绍,北京站只是阿里云举办相关峰会的其中一个地点,接下来还会巡回在多个城市举行,并在每个城市邀请多个已应用阿里云相关模型的企业做分享。此次在北京站现场,小米、新浪微博等负责人出席分享。

南都记者关注到,在本次峰会中阿里云多番强调近期备受业界关注的大模型开源问题。阿里云方面认为,开源能把生态做强。目前国内的大模型头部厂商中,除了阿里云外,还有商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。

不过,据公开报道,百度创始人、董事长兼首席执行官李彦宏此前在一次内部谈话时表示,模型开源并不是一个“众人拾柴火焰高”的情况,这跟传统的软件开源不一样,闭源才有真正的商业模式,才能持续领先,才能聚集人才和算力。

最新版本通义千问中文性能追平GPT-4?

5月9日,阿里云方面透露,2023年4月问世以来,通义千问从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威测评结果,通义千问2.5得分追平GPT-4 Turbo。

不过,南都记者关注到,4月25日联合创始人兼首席执行官萨姆·奥尔特曼在斯坦福大学发表演讲时表示,GPT-5将比GPT-4智能很多,不过仍保持闭源决策。

除此以外,大会当日阿里云还宣布,原通义千问APP更名为“通义APP”。据悉在这一年间,通义已发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。

阿里云透露,目前通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

大会上,阿里云还宣布通义灵码推出企业版。通义灵码是国内用户规模第一的智能编码助手,2023年10月发布至今,通义灵码的插件下载量已超350万,每日推荐代码超3000万次,被开发者采纳的代码超亿行,是国内最受欢迎的智能编程助手。

在阿里云当天的大会上,通义还发布了1100亿参数开源模型Qwen1.5-110B。据透露,通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型得分超越 Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型.5-7B则是代码模型榜单Big Code的榜首模型。

阿里云反复强调开源能做强“生态”

目前,大模型的开源与非开源正在成为业界讨论的焦点。南都记者了解获悉,开源后模型的源代码、模型数据和模型训练的过程等内容都是公开可用的,这些模型可以供使用者下载、使用、修改、分享和重构。大模型极高的训练和迭代成本,让目前绝大部分的AI开发者和中小企业都无法负担,而开源则可以降低模型的二次开发门槛,有助于加速大模型应用的落地。

目前,大模型行业也正在形成两派。最先让AI走入普通人生活的,经历了GPT-2开源、GPT-3仅公开论文、GPT-3只发布技术报告的时段,已越来越有非开源倾向。据悉,5月初在麻省理工学院与校长科恩布鲁斯探讨相关问题被问及的闭源决策时,联合创始人兼首席执行官萨姆·奥尔特曼对“闭源之问”选择了含糊回答的政策,并表示已经提供了免费的AI工具——GPT-3.5了。

另一方面,以Meta为代表的大模型厂商也推动了一股大模型开源风潮。去年8月,通义也宣布加入开源行列,并沿着“全模态、全尺寸”开源路线陆续推出十多款模型。据阿里云方面透露,目前通义开源模型下载量已经超过700万。南都记者关注到,目前在多家国内大模型头部厂商中,商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。

在大会中,阿里云首席技术官周靖人反复提到了“生态”二字,这个“生态”就由模型开源来造就。他表示,阿里云认识到今天这样一个时代“生态”的重要性,“大模型的发展离不开整个生态,不单单是通义本身的发展,我们更希望今天能够把AI技术发展的能力,赋能给企业和开发者,能够让大家更快地推进AI技术一系列的创新和发展。”由此通义一直在坚持开源。

在接受媒体群访时周靖人也表示,模型之上的应用和创新非常多,不能仅仅局限于使用某一款闭源的框架或者说只能对接某一个形式。在他看来,不管在PC端还是手机端,大模型可以适配各种各样的场景,能够快速搭建更加复杂的业务,而这需要一个非常开放的开源生态去对接。

大模型的开源除了能加快模型落地应用,也可以反哺到模型本身的迭代升级中。模型开源后,在开发者社区的驱动和改进下,模型确实有可能获得更好的迭代。目前阿里云就有一个名为魔搭的开发者社区,据悉魔搭社区的开发者用户数已超过了500万。

“在大模型场景下开源是最贵的”

不过,在一些坚持闭源逻辑的厂商看来,开源大模型后开发者的参与对大模型迭代帮助不大。据公开报道,百度创始人、董事长兼首席执行官李彦宏就在2024百度AI开发者大会上发表主题演讲时表示,“在大模型场景下开源是最贵的。”李彦宏在现场结合文心大模型的实践给出解释:“开发者通过文心4.0降维裁剪出来的更小尺寸模型,比直接拿开源模型调出来的模型,在同等尺寸下的效果明显更好;同等效果下,成本明显更低。”

根据公开报道,此前李彦宏还在一次内部谈话时表示,模型开源也不是一个“众人拾柴火焰高”的情况,这跟传统的软件开源,比如Linux、安卓等很不一样。而百度要开源还得自己去维护一套开源的版本,这并不划算;闭源才有真正的商业模式,才能持续领先,才能聚集人才和算力。

月之暗面创始人杨植麟也认为“开源追不上闭源”,在接受媒体采访时杨植麟曾表示,闭源是一个对市场的整合,会有人才聚集和资本聚集,最后一定是闭源更好。“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

不过,与李彦宏、杨植麟不同,周鸿祎在第二十七届哈佛中国论坛上就表示自己“相信开源的力量”,“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。” 周鸿祎还表示,开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源大模型只做了一年就已经超过了GPT-3.5的能力。他认为,未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。

值得一提的是,阿里云除了在布局开源模型,也在布局自己的闭源模型。在大会结束后接受媒体群访时,周靖人表示,“实际上(我们)形成的是一个开源和闭源的整体体系,我们希望把这些选择能够让我们的企业、开发者来做自主的、没有担忧的选择。”

杨植麟对此也曾表示,其认为开源和闭源接下来在大模型领域里会是互补的关系。“开源可以支持开发者去尝试各种创新的应用,而且在开发过程中可以对数据、训练过程、环境部署等合规性有更高的要求,场景也会更灵活。而闭源的话也会有自己的价值,比如说像未来的很多超级应用的入口,不管是生产力端还是娱乐消费端,都会有以闭源为核心的超级应用出现。这两种不同的模型其实是一定程度的互补,而不是冲突的关系,如何取舍其实是看每个公司不同的策略。我们(月之暗面)的策略是希望去打造超级应用,这是我们目前专注的地方,所以会把时间都花在上面。”

GPT