清华系 AI 创企获近 5 亿元 A 轮融资,15 家新股东跑步进场
昨天,AI赛道,诞生了一个“清华系”当红炸子鸡。
一笔近5亿元A轮融资,背后站着15家新股东,在社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金带头下,联想创投、小米、软通高科等跑步进场。
顺着这笔融资看去,会发现10个月前,成立仅半年这家创企就获得超13家机构“团购”天使轮,百度腾讯智谱AI均位列股东名单。
而成立伊始,这家清华系企业就早被有头有脸的VC盯上,不仅红杉北极光金沙江等悉数登场,原红杉中国合伙人曹曦也带着砺思资本前来押注。
据猎云网不完全统计,仅“16月龄”,这家AI创企就获得了超30家资本助力,融资额累计近10亿元,可谓当之无愧的风投宠儿。
据相关投资人透露,三轮融资下来估值基本完成三连跳、接近百亿。也就是说,此轮融资过后,一家新晋AI独角兽也即将诞生。
而它,就是无问芯穹(),一家由90后清华系博士夏立雪掌舵的算力运营商。
事实上,如果你翻阅过资料,会发现无问芯穹总被直接等同于AI基础设施,但无问芯穹CEO夏立雪更强调“运营商”的角色。
他认为,随着AI领域逐步发展,对于算力的需求形成了更丰富的市场环境,就一定需要有运营商的出现。
在他的勾勒中,运营商,与国内普遍理解的单点优化工具或软件定义的AI基础设施不同,他能做到All in One,把算力像水电煤一样标准化的产品推向市场,供给到智能的生态提供服务或提供应用的所有人去使用。
这一初衷和愿景,亦是无问芯穹的差异化打法所在。
80后清华教授坐镇,超30家VC跑来投
无问芯穹身后,有着一支近百人的清华博士军团,其中夏立雪的老师汪玉为“吸金石”。
据天眼查显示,汪玉为无问芯穹发起人。而80后的他,身上有很多标签。
汪玉于1998年入学清华读完本硕博,自2007年开始留校任教,38岁就成为清华大学电子工程系的系主任,自此他是清华电子工程系首位80后系主任,也是该系创办以来第二年轻系主任。
专注研究硬件、芯片和基础软件方向,汪玉曾多次在顶会拿下最佳论文奖,共发表IEEE/ACM杂志文章50余篇,谷歌学术引用17000余次。
学而优则创,2016年汪玉便走入了一级市场VC的心坎。
当时,以汪玉为负责人的深度学习处理器项目,通过清华大学电子信息学院论证并获得支持。之后,项目团队以研究成果“卷积神经网络的逐层变精度定点化方法及装置”作价入股AI芯片公司深鉴科技,进行产业化运营。
注册成立的同月,深鉴科技便拿下了高榕创投跟金沙江创投的500万美元天使轮,第二年就估值破10亿,随后蚂蚁集团、招商局创投、三星风投等“抢购”了A+轮融资,最终以成立2年被FPGA厂商赛灵思3亿美元收购,画上圆满句号。
由此,深鉴科技一举成为国内最先上岸的AI芯片创业公司,也成为清华大学有科技成果转化制度以来第一家完成转化与回报闭环的企业。
据投中网,一级投资人对汪玉评价颇高:少见的在学术和商业水平都非常高的学者。
从这一点看,深鉴科技就是绝佳的证明。
也正因此,汪玉接下来的动作一直都是创投圈的焦点,也让乘着大模型东风、致力于解决算力焦虑的无问芯穹自成立就身处聚光灯下。
跟在深鉴科技,汪玉携手清华大学电子工程系本科学生姚颂、并由后者担任CEO类似,这一次,无问芯穹也是名师+高徒的搭配,一来还来了三个清华博士。
首先无问芯穹90后联合创始人、CEO夏立雪,是汪玉做博导后带的博士,一毕业就拿到了阿里星offer,曾是阿里云用户增长产品技术负责人,负责过阿里云大语言模型的压缩加速、生成式AI模型芯片的等战略项目。
而2022年末大模型的出现,让夏立雪意识到算法在专用走向通用的质变,将带来足够广阔的应用场景后,便与领导清华NICS-EFC实验室的汪玉一拍即合,成为了无问芯穹的首个联创。
据天眼查股权穿透来看,来自广西南宁的“数学学霸”曾书霖,也为汪玉做博导后带的博士,二人通过持股北京无问启明企业咨询有限公司,间接持股无问芯穹,其中夏立雪持股无问芯穹比例经推算为10.9%,为第一大股东。
而另一个联创首席科学家戴国浩,曾是汪玉研究团队的助理研究员,为清华大学工学博士,持股比例达6.8227%,现任上海交通大学长聘教轨副教授,清源研究院人工智能设计自动化创新实验室负责人。
一教授带三博士,自然让无问芯穹在酷爱清华系的AI VC圈格外耀眼。
老股东近水楼台先得月,尝过深鉴科技甜头的金沙江创投又一次在天使轮抢先占位。随后超30家机构兵分三路,社保中关村基金、上海人工智能产业投资基金等国家队和地方国资、百度、腾讯、联想创投、小米顺为、软通高科、智谱AI等战投方跟达晨财智、德同资本等财务机构“搭配”进场。
据投中网,后两轮均有超过百家机构与无问芯穹进行了接触,认购都实现了超募,更有知情人士透露“都是前半程在谈业务,后半程在婉拒,砍份额”。
据相关投资人回忆,相比纯财务资方,当前阶段战投方(产业方)从业务赋能角度更容易投进去。
做AI基础设施、定位“运营商”,“卖”算力成“隐形”独角兽
一边,一级市场投得火热,另一边,16个月来,无问芯穹也在明确定位、加速狂奔。
时间线再次拨回到2022年末,大模型的兴起,让夏立雪看到了AI行业面临的算力焦虑已成为一个不争的事实。尤其在国内,中国的模型层与芯片层的“百花齐放”,却让大量的异构芯片形成了“生态竖井”,不同硬件生态系统封闭且互不兼容,使得非常多的算力、硬件,没有被很好地发挥出效率、效能。
故而成立初衷,无问芯穹就是要解决国内算力不足的问题。
如何解?无问芯穹选择了“轻资产运营模式”,也就是连接模型和硬件,去做了一个把算力更好用起来的基础设施的工作。
简单来说,就是在中间层做“算力调优”,目标提升用户的使用体验,通过优化易用性和降低成本来不断拓展市场规模。
技术层面上,无问芯穹从两点“啃硬骨头”:
一是通过M种模型×N种芯片的核心技术,把不同的模型在各类硬件上都能够快速完成高效的部署,去让算法和算力之间形成最佳的软硬件联合的优化、软硬协同,把算力价值发挥到最大。
二是做混合训练方式,让不同异构的集群之间能够进行高效配合,让被使用的效率和使用出来的稳定性,集群的效果上都能够达到商业化的水平。
夏立雪表示,从技术角度讲,混训一般被认为是GPU和另外一种GPU,或和另外一种加速卡这样的一个集群的混合,难点在于不同的卡之间有不同的算子库。
目前无问芯穹已经做到了华为昇腾、天数智芯、沐曦、摩尔线程和AMD、共六种芯片“4+2”组合间实现千卡规模的异构算力混合训练,混训整体的效率是95%以上,能够达到97.6%。
也就是说,在理想情况下每一张卡之间都是紧密配合的,能够一个月完成一个训练。非理想情况是无问芯穹能够做到将近一个月多一天不到就能够同样完成一个综合的大模型训练。
而要把不同的模型和硬件直接连接起来,还会包括对GPU性能的预测,把任务拆解分配,从而实现硬件不仅能各司其职,还能够把通信库打通、在通信上很好地协调。
在一个互联网公司大模型推理场景的合作案例中,无问芯穹把客户支撑同样业务所使用的算力“砍掉”90%,从而节省算力资源占用。
这就好比无问芯穹做了一个大模型算力领域的“淘宝”, 其上游主要是跟各地方已经建设成建设完备的智算中心,或者在计划中建设的智算中心合作,把他们的算力更好地给经营起来,而下游的大模型厂商和应用方,一键可以买到来自多元芯片好用、高效的算力。
从这点上看,无问芯穹在朝一个All in one的平台进发,夏立雪也不止一次强调“算力运营商”的定位,而非AI基础设施。
无问芯穹战略运营SVP王梦菲表示,AI基础设施更多在国内会理解成单点优化工具或软件,而无问芯穹是要满足客户真正想要的已经优化完善、即插即用的算力服务,也就是“一步到位”的工作。
“把算力做到足够的标准化,降低客户使用算力的难度和门槛,是我们跟AI基础设施类的企业愿景上的区别。”
正如打开水龙头前,人们不需要知道水是从哪条河里来的。
同理,夏立雪认为,未来人们用各种AI应用时,也不会知道它调用了哪些基座模型,用到了哪种加速卡的算力——这就是最好的AI 基础设施。
角逐“算力优化”,清华系早就“打”起来了
当然,无问芯穹描述的故事虽好,在市场端也并非毫无挑战。
就商业模式来看,无问芯穹是一个完整的云厂商模式,有算力纳管的IasS层,算力运营和调度的PaaS层,以及面向应用厂商的MaaS层,整个产品矩阵比较完整。
公司目前主要来源于算力云模式的收入,即销售算力的收入,算力运营也就是去上游整合资源,通过技术能力把它变为一个标准化的算力产品,进行一个单位化的定价,再拿到市场上售卖,盈利路径清晰。
不过,王梦菲也坦言,商业模式上与云厂商有一定的类似,远期看可能会有一些重合或者竞争。就当下而言,由于所面向的客户层级以及定位、技术储备方向有别,二者还是合大于竞。
“过去云厂商是从CPU到GPU过渡,优势可能是很多客户能复用,但无问芯穹强调GPU异构,会把技术栈做得更加完备、更深入,主要是把没有用好的国产算力更好用起来,目前主要服务做大模型训练的客户,未来在对AI应用场景做技术储备。”
而与云厂商相比,算力调优赛道竞争早已被清华系“打”得硝烟四起,除无问芯穹外,潞晨科技、硅基流动、中科加禾、清程极智、清昴智能等业内玩家,均为清华系代表。