英伟达 CEO 黄仁勋:算力租赁价格平稳,将进一步扩大产能

aixo 2024-09-20 03:04:31
大模型 2024-09-20 03:04:31

▌算力:算力租赁价格平稳,黄仁勋表示英伟达将进一步扩大产能

北京时间9月11日周三晚,英伟达CEO黄仁勋在高盛组织的一场科技对谈中告诉高盛CEO所罗门,英伟达将在第四季度扩大产能,并在明年继续扩大。英伟达股价伴随黄仁勋的讲话收盘至116.9美元,大涨8.15%,增加2158亿美元市值,折合人民币1.5369万亿元。谈话要点总结如下:

1.黄仁勋表示,过去的摩尔定律是每5年性能提升100倍,每10年提升1000倍。我们只需等待CPU变得更快。然而,如今这个时代已经结束了,我们正进入一个计算膨胀的时代。接下来会发生的第一件事,就是世界上价值数万亿美元的通用数据中心将被升级为加速计算型数据中心,这是必然的事情。英伟达想做的第一件事是,将这些原本可能占用50、100或200兆瓦的大型数据中心,压缩成一个非常小的数据中心。英伟达的机架可能看起来很昂贵,每个机架花费几百万美元,但它可以替代成千上万个节点。

2.由于英伟达的加速计算带来了巨大的成本节约,在过去10年里,计算能力提高了100万倍。所有数据、所有预测数据只用交给计算机,让它自己去找到算法。接下来是生成AI的第一波浪潮。在这一阶段,像英伟达这样的基础设施提供商和所有云服务提供商将基础设施部署到云端,让开发者可以使用这些机器训练模型或进行模型微调。这带来了非常好的回报,因为需求非常强劲。每一美元的支出,都能带来五倍的收益。

3.去年,英伟达的收入经历了爆炸式增长,而这离不开供应链的支持。台积电和供应链的快速响应能力令人难以置信。在不到一年的时间里,英伟达大幅增加了产能,明年还会继续扩大。这种敏捷性和应对能力是英伟达选择台积电的原因。

4.英伟达每次都会开发七种不同的芯片。每种芯片的更新周期大约是两年,可以在每年给它们一个中期提升。因此,英伟达每年都可以推出一个比上一代更好的 AI 集群或超级集群,因为有很多不同的组件可以进行优化。这种规模的性能提升直接转化为客户的总拥有成本。例如, 的性能是前代产品的三倍,如果某个客户有1吉瓦的电力预算,那么他们的收入也会增加三倍。

▌AI应用:发布o1大模型,强化学习突破推理极限

北京时间9月13日午夜,正式发布全新模型技术产品o1,包括两种版本o1-和o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。这是一个重大突破,新模型可以实现复杂推理,做到一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。

可以解决比以前GPT时期的科学、编码和数学模型更难的问题。o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式,而o1的训练旨在让其独立解决问题。在强化学习的过程中,使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题,就像人类习得拆解、分析问题的方式一样。

o1上线之后,现在可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统1和系统2,已经从仅使用系统1(快速、自动、直观、易出错)进化到了可使用系统2思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

表示,对于复杂推理任务而言,o1代表着AI能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名号。它在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升。这也预示着AI时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

▌AI融资动向:Glean获E轮融资2.6亿美元

本期AI初创公司的融资中,Glean/融资额前二,分别为2.6亿/2.3亿美元。Glean是美国一家AI工作助手和知识管理平台,为公司的所有应用程序提供了统一的搜索体验,以帮助员工准确地找到需要的东西并发现应该知道的东西。最初将专注于生成无限制的3D世界——创建和编辑具有物理、语义和控制的虚拟空间,还将允许任何人想象和创建自己的世界,将生成式人工智能的潜力从2D图像和视频扩展到3D世界。

▌投资建议

o1系列是首个经过强化学习训练的模型,突破 Law。通过训练,o1模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误,对于复杂的推理任务来说,这是一个重大进步,称代表了人工智能的最高水平。推动AI应用从简单的自动化处理扩展到高层次的认知推理,因推理链条加长,对算力需求剧增。此外,黄仁勋重申B卡时间表,于开始发货,且强调需求强劲。我们认为o1系列模型潜力巨大,可消除此前投资者对于算力可持续性的担忧。

建议关注以AI为核心的龙头厂商科大讯飞(.SZ)、有望迎来需求爆发的AI应用金桥信息(.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(.SH)。

▌风险提示

1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

算力动态:算力租赁价格平稳,黄仁勋表示英伟达将进一步扩大产能

1.1

数据跟踪:算力租赁价格平稳

本周算力租赁价格环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。

1.2

产业动态:黄仁勋表示英伟达将进一步扩大产能,刺激

英伟达股价大幅上涨

北京时间9月11日周三晚,英伟达CEO黄仁勋在高盛组织的一场科技对谈中告诉高盛CEO所罗门,英伟达将在第四季度扩大产能,并在明年继续扩大。英伟达股价伴随黄仁勋的讲话收盘至116.9美元,大涨8.15%,增加2158亿美元市值,折合人民币1.5369万亿元。谈话要点总结如下:

1.黄仁勋表示,过去的摩尔定律是每5年性能提升100倍,每10年提升1000倍。我们只需等待CPU变得更快。然而,如今这个时代已经结束了,我们正进入一个计算膨胀的时代。接下来会发生的第一件事,就是世界上价值数万亿美元的通用数据中心将被升级为加速计算型数据中心,这是必然的事情。英伟达想做的第一件事是,将这些原本可能占用50、100或200兆瓦的大型数据中心,压缩成一个非常小的数据中心。英伟达的机架可能看起来很昂贵,每个机架花费几百万美元,但它可以替代成千上万个节点。

2.由于英伟达的加速计算带来了巨大的成本节约,在过去10年里,计算能力提高了100万倍。所有数据、所有预测数据只用交给计算机,让它自己去找到算法。接下来是生成AI的第一波浪潮。在这一阶段,像英伟达这样的基础设施提供商和所有云服务提供商将基础设施部署到云端,让开发者可以使用这些机器训练模型或进行模型微调。这带来了非常好的回报,因为需求非常强劲。每一美元的支出,都能带来五倍的收益。

3.去年,英伟达的收入经历了爆炸式增长,而这离不开供应链的支持。台积电和供应链的快速响应能力令人难以置信。在不到一年的时间里,英伟达大幅增加了产能,明年还会继续扩大。这种敏捷性和应对能力是英伟达选择台积电的原因。

4.英伟达每次都会开发七种不同的芯片。每种芯片的更新周期大约是两年,可以在每年给它们一个中期提升。因此,英伟达每年都可以推出一个比上一代更好的 AI 集群或超级集群,因为有很多不同的组件可以进行优化。这种规模的性能提升直接转化为客户的总拥有成本。例如, 的性能是前代产品的三倍,如果某个客户有1吉瓦的电力预算,那么他们的收入也会增加三倍。

AI应用动态:访问量环比增长11.39%,发布o1大模型

2.1

流量跟踪:访问量环比增长11.39%

本期(2024.9.09-2024.9.13)AI相关网站流量数据:访问量前三位分别为(700.9M)、Bing(413.7M)和Canva(173.4M);访问量环比增速前三位分别为(11.39%)、文心一言(10.96%)和(9.63%);平均停留时长前三位分别为.AI(0:12:44)、(0:12:35)和(0:09:07);平均停留时长环比增速前三位分别为文心一言(2.34%)、Kimi(1.17%)和(1.09%)。

2.2

产业动态:发布o1大模型,强化学习突破推理

极限

北京时间9月13日午夜,正式发布全新模型技术产品o1,包括两种版本o1-和o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。这是一个重大突破,新模型可以实现复杂推理,做到一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。

表示,对于复杂推理任务而言,o1代表着AI能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名号。它在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升。这也预示着AI时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

可以解决比以前GPT时期的科学、编码和数学模型更难的问题。o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式,而o1的训练旨在让其独立解决问题。在强化学习的过程中,使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题,就像人类习得拆解、分析问题的方式一样。

其中部分o1模型功能及性能测评如下:

1) 通用推理能力:在一系列不同的人类考试和机器学习基准测试中测试了o1模型。实验结果表明,在绝大多数推理任务中,o1的表现明显优于GPT-4o。此外,启用视觉感知能力后,o1在MMMU基准上得分为78.2%,成为第一个与人类专家相当的模型。o1还在57个MMLU子类别中的54个上优于GPT-4o。

2)强化学习能力:o1给大模型规模扩展vs性能的曲线带来了一次上翘。它在大模型领域重现了当年强化学习的成功——给越多算力,就输出越多智能,一直到超越人类水平。也就是从方法上,o1大模型首次证明了语言模型可以进行真正的强化学习。

3)思维链:通过强化学习,o1学会磨练其思维链并改进其使用的策略。o1学会了识别和纠正错误,并可以将棘手的步骤分解为更简单的步骤。o1还学会了在当前方法不起作用时尝试不同的方法。此外,思维链(CoT)推理为安全和对齐提供了新的思路。发现,将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观和原则。

4)编程能力:基于o1进行了初始化并进一步训练了其编程技能后,训练得到了一个非常强大的编程模型(o1-ioi)。该模型远远超过了GPT-4o和o1——它的Elo评分为1807,表现优于93%的竞争对手。

5)人类偏好评估:在更多领域的具有挑战性的开放式提示上评估了人类对o1-和GPT-4o的偏好,发现在数据分析、编程和数学等推理能力较强的类别中,o1-的受欢迎程度远远高于GPT-4o。

发布o1大模型,性能持续提高。o1上线之后,现在可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统1和系统2,已经从仅使用系统1(快速、自动、直观、易出错)进化到了可使用系统2思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

的大规模强化学习算法,教会模型如何在数据高度有效的训练过程中利用其思想链进行高效思考。换言之,类似于强化学习的。发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,也还在继续研究。

AI融资动向:Glean获E轮融资2.6亿美元

本期AI初创公司的融资中,Glean/融资额前二,分别为2.6亿/2.3亿美元。Glean是美国一家AI工作助手和知识管理平台,为公司的所有应用程序提供了统一的搜索体验,以帮助员工准确地找到需要的东西并发现应该知道的东西。最初将专注于生成无限制的3D世界——创建和编辑具有物理、语义和控制的虚拟空间,还将允许任何人想象和创建自己的世界,将生成式人工智能的潜力从2D图像和视频扩展到3D世界。

行情复盘

本周,AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为2.40%/1.95%/0.20%/0.30%,日跌幅最大值分别为-1.05%/-1.58%/-0.85%/-1.94%。AI算力指数内部,中际旭创以+16.62%录得本周最大涨幅,ST证通以-10.00%录得本周最大跌幅。AI应用指数内部,梦网科技以+13.17%录得本周最大涨幅,领益智造以-13.87%录得本周最大跌幅。

投资建议

o1系列是首个经过强化学习训练的模型,突破 Law。通过训练,o1模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误,对于复杂的推理任务来说,这是一个重大进步,称代表了人工智能的最高水平。推动AI应用从简单的自动化处理扩展到高层次的认知推理,因推理链条加长,对算力需求剧增。此外,黄仁勋重申B卡时间表,于开始发货,且强调需求强劲。我们认为o1系列模型潜力巨大,可消除此前投资者对于算力可持续性的担忧。

建议关注以AI为核心的龙头厂商科大讯飞(.SZ)、有望迎来需求爆发的AI应用金桥信息(.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(.SH)。

1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

证券研究报告:《黄仁勋表示英伟达将进一步扩大产能,发布o1大模型—计算机行业周报》