生成式AI的能力不断拓展,应用潮已经开始

aixo 2024-05-16 00:21:27
芯片 2024-05-16 00:21:27

作者:邵旭辉, 管理合伙人,在机器学习、大数据系统和软件系统工程领域从事研发和管理工作多年,曾任雅虎广告及大数据平台工程副总裁、Turn CTO及ID 副总裁。他持有清华大学自动化学士学位及明尼苏达大学EECS博士学位。

上个月的GTC后,生成式AI相关的讨论久久不能平息,这个月Gen AI领域刚刚宣布的两个高额融资消息也引发了大量关注:以近10亿美金的估值融资2.27亿美金,则以20亿美金估值融资1.75亿美金。从文字到视频生成、机器人,生成式AI的能力不断拓展,应用潮已经开始,行业内外,大家都很关心这个话题:AI将会带我们到何处去?

作为AI、深度学习领域多年的从业者,曾经的大公司管理者、创业者以及如今的深科技领域投资人,我在此抛砖引玉,谈谈我对生成式AI发展的个人判断。

本质上,我认为生成式AI的竞争力根植于这三个维度:

一是算力及基础设施,这也是许多大公司优势明显的地方。

二是算法,当然也意味着算法背后的人才。

第三则是数据及应用场景,对创业公司来说,这一部分仍存在着大量机遇。

我们下面可以从这三个维度来生成式AI的未来。

Gen AI并非算力竞赛,创业公司的机会在这些领域

在算力方面,是GPU的领头羊、CUDA生态的开创者,具有巨大的优势,但其实,未来的生成式AI并非绝对以算力定成败。

算力有限的创业公司或者科研机构,机遇主要在哪里呢?

首先,创业公司可以打造生成式AI的基础设施,解决底层的问题。

几乎所有的领域的公司,都在考虑自身在生成式AI方面的竞争策略。在数据隐私/计算安全、准确性/可靠性、商业逻辑等等领域都会有很碎片化的的要求。而大厂的工具链服务链只能解决一部分需求,其他的就需要初创企业来填补。.AI、.AI、.AI 等都属于这个范畴。这些创业企业搭建了机器学习领域的基础架构,比如.AI,他们提供的解决方案让复杂数据能较为简便地转化为可用的企业级AI,提供预测分析、AI助手、数据标签等功能。

其次,虽然大公司在算力方面拥有优势,创业公司可以将目光投向专业领域——对于这些领域来说,持续积累的专业数据将会有着不可替代的价值,其中的行业壁垒、合规等方面的积累也能形成一定的护城河。

而更重要的是,不少领域(比如生物医药、网络安全、科研、制造)的底层逻辑和大模型擅长的语言文字视频并不相近,无法直接套用,也不容易简单的做二次开发就能获得好的结果。

从另一个角度来说,大模型也同样打开了许多新机遇,过去一些离商业化较远的领域可能忽然就有前进的动力了,其中往往会有创业公司的机会。

文初提到的AI写代码就是一个新出现的机遇,这两家企业都是近年来发展迅速的AI公司,的创立时间才刚刚半年。我们也投资了一个同类别的公司,通过AI来帮助人们找程序中的bug并修复它们。这类企业在AI与软件工程的交叉点找到了自己的市场。

近期机器人的热潮也是个很好的例子。

过去传统机器人往往只能解决单个任务,机器人的传感器、成本投入都有限,也限制了它的发展。

随着LLM的发展,机器人能够在虚拟空间通过强化学习( )来进行学习、迭代、完成复杂任务,带来了一系列连锁反应——企业愿意开发拥有成本更高、能力更强机器人,这一行业也有了更多的想象空间与投入。斯坦福大学李飞飞教授参与的团队也构建了类似于当年的针对虚拟空间训练测试机器人的基于物理模型的大规模训练场景。

今年3月,机器人公司与合作发布的视频引发了很多关注:金属覆身的机器人接入了的大语言模型,能够迅速理解人类的意图并做出相应的动作,包括整理、准确放置物品以及完成一些相对模糊的指令——一名男子对“给我找个吃的”,机器人略思索后,拿起了桌上的苹果,并递给了他。值得注意的是,桌上还有四散的碗盘、沥水架等,苹果是唯一一个可食用的物品,这个简单的动作涉及了推理与思考过程,加上之前整理、收纳,机器人展现了完成多个复杂任务的能力。

除了外,引领的大模型风潮下,各类引入了LLM的机器人正在涌现: of 的学者也发布了基于大语言模型,能够更好地理解3D环境的家用机器人。在工业、农业、医疗等领域,可以想象,新型的 机器人会带来很多的新变化。

新型芯片及算法可能会重写垄断格局

目前,在生成式AI的算法方面,呈现、、三巨头垄断的格局。不过在我看来,这样的情况也会在技术进展下面临变化。

这并非我一家之言,可以说,几乎是一个行业共识,只是很难预测它具体的时间点。

今年GTC上,的原作小组首次聚集,八位作者中的七位与黄仁勋对话,而核心观点就是:已经够老了,期待看到更新的模型。

作者之一、的创始人及CEO Gomez评论道:我想看到比好十倍的模型来替代它……在内存占用和许多架构方面都有优化的可能性,比如一个非常长的是很昂贵、无法扩展的,它的可能不必要那么长 ,我们可以压缩许多倍,带来指数级的缩小。

从仿生学的角度来说,这个观点也很站得住脚——目前算法的功耗算力,跟自然界还有很大差距。

人的大脑功耗几十瓦。昆虫的大脑功耗是毫瓦/微瓦级的,神经元数量极少,也能完成特别复杂的立体视觉、三维控制、捕猎逃生等感知相关的行为。同等情况下,如果让电脑复现小动物在自然界里识别、控制、捕猎、求生的能力,需要更先进的模型,也一定会逐步出现更先进的模型。

而未来更好的算法与模型也很可能意味着更多专用的、小型的芯片会迎来发展。

比如我们此前投资的D-,主打存内计算,预计将在2024大规模量产,目前已经有大量订单。另一个模拟计算芯片设计企业也备受关注,已经发布了多篇论文,

除此之外,开源的相对小型的 模型(如's PHI-2 and 7B)也会迎来快速发展。在我看来,这些开源的小模型对于AI行业持续、健康的发展是很有必要的。这次AI的热潮与以往的科技潮不同,大公司并未占据所有重要的研究方向——谷歌上市时,许多大学就停止了对搜索算法的研究,因为谷歌已经有了很好的团队和资源来推进搜索算法。而生成式AI则不是,对于研究机构而言,这些开源的小模型中还有很多值得探索的地方,目前所有名校的计算机系也都在积极研究开源模型。

甚至可以说,文初我提到的、未来我们期待的新的算法很可能就会从这些科研人员的工作中涌现。

GenAI发展的背后是人才之争

这个对更新、更好的生成式AI算法的期待,也意味着另一件事:生成式AI的竞争也意味着人才之争。

目前,中美是在AI人才方面占据全球一二位置的两个国家。

从绝对人数来说,中国占据了第一位——今年三月,纽约时报报道了一个追踪AI相关人才的报告,中国有着全世界最多的AI本科生人才,而与三年前相比,如今在美国的顶级AI人才中,中国人的比例也已经超过了美国人。比起过去,这些中国人才在美攻读学位后,也更多地“回流”中国。

当然,美国有着世界数量最多的一流大学,与创新气氛浓厚的科技企业,也孕育出了将LLM石破天惊带入大众视野的Open AI,对各国的AI人才仍旧有着强烈的吸引力。

不可否认,基于天时地利人和等方面考虑,中美牢牢占据了未来AI发展综合最优的前二宝座。

在这个背景下,还有一个值得注意的趋势:人才的两极分化。

由于AI+ 的杠杆作用越发明显,创立一个优秀的AI企业所需要的技术人才的数量比几年前已经显著减少了。企业接下来对人才的竞争,会越来越集中于少数顶尖人才的争夺。

无论在硅谷还是在北上杭,我们已经看到顶级AI人才被高价争抢,而普通大学生找不到工作的这种两极分化,而这样的趋势未来也会更加明显。

Gen AI将成万亿美元市场,投资人如何入局?

从我和我身边的创投从业者的角度看来,我们的共识是Gen AI的未来是光明的—— 报告预测,GenAI将成为未来十年发最迅速的市场之一,市场总量超过万亿美元,复合年增长率超过40%。它变革性的能力会影响各行各业。

对于投资人而言,如果想要投资这个市场,我有以下建议:

首先,投资生成式AI项目,本质上仍旧是在深科技技术中寻找那些具有商业化潜力的项目。投资人最好能具备AI相关技术背景,并且保持持续学习及市场敏锐度。目前生成式AI的技术变化、突破、市场都在迅速发展。比如此前一些挂着大模型名号的项目,也许在某次更新后就会完全失去市场,能够识别这些项目,可以帮助规避许多风险。

其次,正如文初分析的,目前生成式AI的支柱分为人才/算法、算力、应用/数据三大方向。作为投资人,前两者的投资难度较大,然而应用/数据中,有着大量的未来机遇,可以考虑投资一些相关资源。

比如应用场景和应用场景相关的数据——对于中国投资人来说,半导体 、新能源、先进制造都是不错的方向。以制造业为例,拥有大量垂直行业内的数据,才能做出好的AI,指导未来的先进制造。

从时间上来看,技术上如果不能特别确定 ,也可以等一下商业落地的信息,付出一些增值成本来换取更稳定的信号。

有关AI,这个问题我常听到:AI能最终代替人类吗?

我认为这要从不同尺度上去理解——我们究竟在讨论的是AI从什么程度上在挑战人类进化?如果是生物体层面,这有着百万年以上的积累,是最难的;从人类认知层面,也至少有10万年进化横亘在AI面前;而出现数千年的人类语言相对更容易;出现仅100年的计算机语言则最简单。

这个问题的答案当然没有定论。不过在这个最终将达万亿美元、改变人类生活的市场里,我很期待看到更多来自华人参与者的身影,不管是创业、投资,还是积极地拥抱生成式AI让生活、工作变得更高效,它将前所未有地改变我们与世界交互的方式。