英伟达推出全新服务和微服务,与 Llama 3.1 系列模型共同助力全球企业生成式 AI 发展

aixo 2024-07-24 14:18:35
算力 2024-07-24 14:18:35

7月24日,《每日经济新闻》记者从英伟达处获悉,英伟达推出了全新 AI 服务和 NIMTM推理微服务,与同样刚推出的Llama 3.1系列开源模型一起,为全球企业提供生成式AI相关服务。

根据英伟达方面的数据,Llama 3.1多语种大语言模型(LLM)集合是一个具有8B、70B和405B三种参数规模的生成式AI模型集合。当与适用于Llama 3.1 405B的 NIM推理微服务结合使用时,NeMo NIM微服务可以为RAG工作流中的开放和商业文本问答带来极高的检索准确性。 AI 能提供一种可用于快速构建自定义超级模型的端到端服务。

根据英伟达的说法,借助 AI ,企业能使用Llama 3.1模型和 NeMo平台(包含在 Face 上排名第一的 -4 340B 模型)创建自定义模型;还可以使用自有数据以及由Llama 3.1 405B和 模型生成的合成数据,来训练这些超级模型。

创建自定义模型后,企业可构建 NIM推理微服务,以便在其首选的云平台和全球服务器制造商提供的认证系统上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。

英伟达创始人兼首席执行官黄仁勋提出,Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来,Llama 3.1将掀起各个企业与行业创建先进生成式AI应用的浪潮。

Meta创始人兼首席执行官马克·扎克伯格则表示,全新的Llama 3.1模型是开源AI迈出的极其重要的一步,英伟达还和Meta一起为Llama 3.1提供了一种提炼方法,供开发者为生成式AI应用创建更小的自定义模型。