阿里通义千问 Qwen2 大模型发布并同步开源,涵盖 5 个尺寸模型

aixo 2024-06-09 12:39:02
大模型 2024-06-09 12:39:02

【阿里通义千问Qwen2大模型发布并同步开源】《科创板日报》7日讯,阿里通义千问Qwen2 大模型今日发布,并在 Face和 上同步开源。

Qwen2 系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B,上下文长度支持进一步扩展,最高达128K 。

提到阿里大家很容易想到支付宝、淘宝等软件,但是阿里也有个很强的“武器”,那就是阿里的达摩院,当时可是和华为并驾齐驱的两条科技发展路线。

所以也就不难明白,为什么这次阿里的大模型反响这么大了。

AI领域长期被美国主导,这次阿里硬生生撕裂出一个口子,估计这下拜登头疼了,华为那边还没搞清楚,又来一个阿里。

6月7日,阿里云通义千问发布全球性能最强的开源模型Qwen2-72B,性能不仅超过美国最强的开源模型,也超过国内所有的闭源大模型。

那么达摩院是怎样的存在,对中国科技有什么影响呢?

阿里的达摩院,低调的科技殿堂

达摩院成立于2017年10月,是阿里巴巴集团下属的一个致力于开展基础科学和颠覆式技术创新研究的企业驱动型“新型研发机构”。

它的愿景是打通应用基础研究和产业应用,探索技术产品化、产品市场化的转换路径,推动科技的进步和产业的发展。

达摩院的研究领域十分广泛,包括机器智能、数据计算、机器人、金融科技等,并且在这些领域取得了显著的成果。

人工智能芯片:达摩院自主研发了全球首款基于RISC-V架构的神经网络处理器芯片“含光800”,这款芯片具有高性能、低功耗和高可扩展性等优势,可用于语音识别、图像处理等场景。

量子计算:达摩院在量子计算领域取得了重要成果,包括建成了两座硬件实验室,并且与浙江大学合作实现了全球首个超越百量子比特的超导量子模拟器。

机器翻译:达摩院开发了全球首个支持多语种互译的机器翻译

系统“阿里小蜜”,该系统可实现中文与英文、日文、韩文、法文等40多种语言的即时通话。

达摩院汇聚了全球顶尖的研发人才,包括多位高校教授、IEEE 级别科学家等。

他们致力于在基础科学和颠覆式技术创新领域取得突破,推动科技的进步和产业的发展。

同时,达摩院还积极与高校和科研机构合作,共同推动科研项目的进展和人才的培养。

中国人有自己的大模型,这是必然趋势

未来AI大模型是全球数字技术体系的竞争,这个体系包括芯片、云计算、闭源模型、开源模型、开源生态等等。

目前来看我国和美国在AI方面还是有一定的差距,但是这种说法其实是狭义的。

因为AI大模型只是处于初级开发状态,芯片和云计算以及闭源大模型方面美国确实有优势。

因为这些国家开发比较早,同时设立了技术壁垒,通过不正当的手段打压后来者。

但是在开源大模型和开源生态方面,我国的AI大模型逐渐显示出了优势。

比方说,阿里云早就明确了以创建开放繁荣的AI生态为目的。

阿里云也是这么做的,通义千问目前是国内最受欢迎的开源大模型,下载量已突破1600万次,海外开源社区已经出现了超过1500款基于通义千问二次开发的模型和应用。

争气!国产AI大模型彻底崛起!美国也拿我们没办法!

AI大模型是未来的趋势,尽管美西方前段时间疯狂使出阴招,几乎所有的美国科技巨头都在建议不要发展AI,但是明眼人一看就知道咋回事。

那就是他们已经占据的了科技高地,然后从舆论上封锁后来者。

说AI大模型有多么恐怖,会对未来产生多大的影响。

如果认真那就会输的底朝天,几个月后,消息几乎销声匿迹,美西方加紧了AI的研究与开发,这不是赤裸裸的双标是什么?

如今我国的大模型发展稳扎稳打,尤其是以阿里为代表的科技公司,让美国也拿我们没有办法。

为科技工作者点赞!