Meta 开源 MobileLLM 家族，为智能手机打造高效模型

aixo 2024-11-09 10:06:02

2024-11-09 10:06:02

Meta 于上周发布新闻稿，宣布正式开源可在智能手机上运行的小语言模型家族，并同时为系列模型新增600M、1B 和 1.5B 三种不同参数版本，附项目项目页如下（点此访问）。

Meta 研究人员表示，模型家族专为智能手机打造，该模型号称采用了精简架构，并引入了“ 激活函数”、“分组查询注意力（-query ）”机制，能够在兼顾效率与表现成果。

此外，模型据称训练速度较快，Meta研究人员声称他们在 32 颗 A100 80G GPU 的服务器环境下，以 1 万亿词（）训练不同参数量的模型时，1.5B 版本只需 18 天，而 125M 版本仅需 3 天。

而从结果来看， 125M 和 350M 两款模型在零样本常识理解任务中的准确率比、OPT、BLOOM 等 State of the Art（SOTA）模型分别高出 2.7% 和 4.3%。

Meta研究人员同时将 -1.5B 与业界其他参数量更大的模型进行比较，在结果测试方面据称领先 GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B 等模型。

LLM

热门文章

腾讯设计杰出专家:大模型加速产业进入全新智能时代

2024-05-12

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

2024-05-10

站长之家：正筹备展示革命性的人机对话技术

2024-05-12

AI搜索的战场，我们为什么要在意的？

2024-05-10

联合创始人Mike被任命为首席产品官

2024-05-17

微软 Phi-3-vision 基准测试,主打“视觉能力”

2024-05-28

中国品牌人物500强前十回应：别在意低头做事

2024-01-22

以专业知识内容助力民众跨越自媒体运营门槛

2024-01-22

Temu们狂卷低价，亚马逊也坐不住了

2024-01-23

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号

2024-01-22