参战万亿MoE模型！上海大模型独角兽出手，腾讯阿里米哈游参投

弦子 2024-04-23 16:40:55

2024-04-23 16:40:55

智东西4月17日消息，今日，上海多模态大模型独角兽MiniMax正式推出abab 6.5系列模型，包含abab 6.5和abab 6.5s两个模型。

MiniMax成立于2023年1月，是当前国内估值最高的大模型公司之一。今年3月，MiniMax完成阿里参投的新一轮融资，投后估值超过25亿美元。此前米哈游、腾讯均有投资MiniMax。

在MoE尚未成为行业共识时，MiniMax已经押注MoE路线，今年1月发布其首款基于MoE架构的abab 6，并在过去3个月潜心研发出性能更强的万亿参数MoE模型abab 6.5，在核心能力测试中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等顶尖大语言模型。

标注星号的是MiniMax调用API测试得到的结果，其余分数来自对应的技术报告。

abab 6.5和abab 6.5s采用相同的训练技术、数据，支持200k tokens上下文长度。abab 6.5s更高效，1秒能处理近3万字的文本。

MiniMax在200k tokens内进行了业界常用的“大海捞针”测试。在891次测试中，abab 6.5均能正确回答。

MiniMax团队称找到了越来越多加速实现Scaling Laws的途径，包括改进模型架构、重构数据pipeline、训练算法及并行训练策略优化等。今天发布的abab 6.5和abab 6.5s是其加速Scaling Laws过程的阶段性成果。

abab 6.5系列模型会滚动更新到MiniMax旗下的产品中，包括生产力产品海螺AI和MiniMax开放平台上。

热门文章

波士顿动力发布全电动Atlas机器人，外型更像人但灵活度远超

2024-04-18

极越01正式发布，高阶智驾方案4.99万元一次性买断

2024-01-23

苹果AI升级大泄露，Siri将在iOS18重生！库克用Apple重新定义AI

2024-06-10

中国智驾技术应用触及临界点，新公司挤压老牌供应商生存空间

2024-01-23

苹果M3系列芯片瞄上了AI从业者，新款MacBook Pro起售价便宜

2024-01-23

AI热潮下东南亚数据中心规模将仅次于中美

2024-05-28

Teledyne FLIR IIS扩展其Forge相机系列，达到IP67防护等级，适用于智能农业、食品和饮料行业

2024-05-11

汽车行业开启淘汰赛，新旧势力都在寻找出路

2024-01-23

苹果CEO接班人最新曝料！黑马出现，比库克年轻15岁，加入苹果23年

2024-05-11

OpenAI大招要来了！AI语音助手狙击谷歌，官宣下周二上新，GPT-5年前见

2024-05-11