英伟达与 Meta 联合发布最新 AI 模型，采用尖端技术实现小而强

aixo 2024-08-17 10:24:27

2024-08-17 10:24:27

8月17日，英伟达公司与Meta公司联合发布了最新的Llama-3.1- 4B AI模型。这款AI模型采用了尖端技术，包括结构化权重剪枝和知识提炼等，成功地将40亿参数的大型模型“小而强”。

在Llama-3.1- 4B模型上，英伟达使用了结构化剪枝技术，在深度和宽度方向上进行了优化。具体来说，他们通过删除网络中不那么重要的层或神经元来实现深度剪枝，并将其从8B模型缩减为4B模型；同时，还采用了一种叫做嵌入维度修剪的技术，在MLP（多层感知机）中的中间层进行宽度剪枝。

除了这些优化方法之外，还采用了经典蒸馏技术来提高Llama-3

本文属于原创文章，如若转载，请注明来源：英伟达与Meta发布Llama-3.1- 4B AI模型

true中关村在线月17日，英伟达公司与Meta公司联合发布了最新的Llama-3.1- 4B AI模型。这款AI模型采用了尖端技术，包括结构化权重剪枝和知识提炼等，成功地将40亿参数的大型模型“小而强”。在Llama-3.1- 4B模型上，英伟达使用了结构化剪枝技术，在深度和宽度方向上进...

Llama

热门文章

腾讯设计杰出专家:大模型加速产业进入全新智能时代

2024-05-12

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

2024-05-10

站长之家：正筹备展示革命性的人机对话技术

2024-05-12

AI搜索的战场，我们为什么要在意的？

2024-05-10

联合创始人Mike被任命为首席产品官

2024-05-17

微软 Phi-3-vision 基准测试,主打“视觉能力”

2024-05-28

中国品牌人物500强前十回应：别在意低头做事

2024-01-22

以专业知识内容助力民众跨越自媒体运营门槛

2024-01-22

Temu们狂卷低价，亚马逊也坐不住了

2024-01-23

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号

2024-01-22