访谈 | 陈彩娴

3Cap 王康曼:我为什么投资 Cerebras Systems?

撰文丨朱可轩、赖文昕

编辑丨陈彩娴

本月初,美国知名AI芯片创业公司Cerebras Systems官宣,其已经向美国证券交易委员会(“SEC”)提交了一份有关其普通股首次公开发行的表格S-1登记声明草案——这一声明,进一步证实了外界对其今年计划上市的猜想。

Cerebras Systems成立于2015年,创始人是Andrew Feldman,是一家以打破英伟达垄断为目标的美国AI芯片创业公司。它们为业内熟知的标签有二:一是研发了世界上更大的芯片,从最初的WSE-1到今年新发布的WSE-3均体量庞大;二是曾在2018年D轮获得OpenAI CEO Sam Altman的注资。

在过去的数年,Sam Altman一共参与投资了3家芯片公司,除了Cerebras Systems,还有Rain Neuromorphics与Atomic Semi。这三家都是英伟达在AI芯片上的有力助手,而其中Cerebras Systems在海内外知名度更高的一个重要原因是:

在一众AI芯片创业公司中,Cerebras Systems是少数商业化比较成功的团队。从 *** 息看到自2023年年底开始,它们的经营现金流已经能持平;也就是说,现在Cerebras Systems这家公司已经不怎么烧钱了——这在创业公司中已属难得,在硬件芯片行业则是难上加难。

因此,Cerebras Systems在资本市场受到热捧,一票难求,除了Open AI的Sam Altman外,硅谷数得出名字的VC包括Benchmark、Sequoia、Coatue,之类都成为股东,但国内的PE却是寥寥无几。

但不久前,Cerebras Systems华丽的投资方阵列中出现了一个崭新的名字——3 Capital Investment(以下简称“3Cap”)。值得注意的是,这是一家由华人创立的AGI投资基金;更令人诧异的是,这家基金的成立时间不超过一年——2023年年底筹备、2024年年初才成立。这是一家开曼注册的纯美元基金,创始人背景相当独特。

3Cap的创始人兼首席投资官王康曼是一位“跨界天才”:

王康曼祖籍上海,幼年迁居香港,本科在瑞士攻读酒店管理专业,后转向美国攻读物理与政治经济学,毕业后在美工作,当过程序员,后进入华尔街投行工作二十年,在嘉诚国际(现摩根大通)、中金公司、巴克莱银行与交银国际担任资本市场部门主管等职务。

2018年,王康曼加入商汤科技,担任战略投资和资本市场负责人,主导了商汤从B轮融资到IPO的融资过程,这段经历为她积累AI技术认知、打磨AI产业经验作出了不可磨灭的贡献。

王康曼

2023年ChatGPT爆火后,王康曼看到AI领域的全球性机会,于是创立了3Cap,立志做“AGI时代的投资者”,并在基金创立之初就拿到了开门红——以跟Sam Altman同样的估值,投资了Cerebras Systems。

王康曼判断,AGI时代的创业与投资机遇主要在数据(Data)、硬件(Hardware)、软件(Software)与反馈循环(Feedback loop)这四块。而据AI科技评论了解,3Cap在起步阶段会首先聚焦于硬件层中AI Infra领域的投资。

围绕AI Infra的创业与投资,AI科技评论与王康曼进行了一次深度访谈。对于AI Infra,王康曼认为,“目前所有的数据中心,其潜在的硬件与软件、尤其是硬件,在未来都需要进行置换。而在这个市场中,玩家肯定不会只有英伟达。”在这一点上,她与Andrew Feldman的观点一致。

以下是AI科技评论与王康曼的对话实录:

投资Cerebras Systems的过程

AI科技评论:能否谈谈您投资Cerebras Systems的契机?

王康曼:Cerebras是一个很有趣的案例。大家可能都听说,它研发制造了世界上更大的芯片。

我对Cerebras的兴趣实际始于六年前。2018年那,我在一次朋友聚会上遇到Cerebras的创始人Andrew Feldman,他跟我展开了深入的交流,让我印象很深刻。他当时跟我说,他的目标是要挑战英伟达,因为他并不认为GPU是用于训练Foundation Model(基础模型)的更佳方案,而他们的方案(当时已经做了两年)才是最可行。

也就是说,在Transformer架构出来之前,他就已经在思考做基础模型训练需要有一个围绕芯片的完整解决方案。Andrew Feldman是之一个跟我提到「Foundation Model」的人。

那时候我就知道Cerebras这个初创企业在做AI芯片相关的事情值得关注。我知道他们发表了很多论文、特别是在提高计算效率方面(的论文),也知道他们逐渐实现商业化,疫情几年他们也没停下来,他们研发的芯片被用于美国国家实验室和GSK的疫苗研发。

后来2023年我自己创立基金时,我就联系了Andrew,询问了他们的商业化进展。当时他非常兴奋地告诉我,他们最近跟中东G42签署了合同,成为世界上更大的人工智能数据中心解决方案提供商之一。在那个项目中,他们的卡与英伟达的卡各占一半,相当于平分市场。

然后我替他高兴之余,也跟Andrew说3Cap了我们基金的背景(开曼美元基金,海外LP)希望加入他们的投资者行列。当时我去面访他,跟他和他们团队都聊了好久。他考虑后同意给我们份额,至于估值,当时宏观原因,大家对于上市还是有很多不确定性,所以同意了一个现在回头看来特别理想的数字,Sam Altman是在2018年投的他们、我也是2018年认识他的,我们估值一样也很合理(笑)。

对创业者来说,他们其实也很看重投资者是否懂他们、懂AI。除了经济利益外,他们其实也希望跟投资人在项目上合作。也是机缘巧合,我们基金成立后的之一个投资项目就是Cerebras Systems。

Cerebras Systems所研发的芯片

AI科技评论:你们大概什么时候开始投的?

王康曼:去年年底,和3Cap的成立几乎同期。

AI科技评论:那这会是你们回报比较高的一个项目。

王康曼:我相信如果半导体二级市场估值没有太大变动,Cerebras的上市将为我们的股东带来非常可观的回报。对于我们这样的新基金来说,能够投资这样有潜力并爆发性强的项目是非常重要的,它可以帮助我们建立声誉、并吸引更多志同道合的LP加入我们。

作为3Cap的之一个投资项目,尤其相对现在私人市场的成交,我们在半年内的浮盈已经好几倍。当然,资本市场变化万千,一切都要等IPO后才能盖棺定论。Cerebras上周宣布会在年内上市,希望一切顺利。

我也希望以后所有的项目都这样:一是很难拿到额度;二是要真正专家才懂,但一般财务投资人不一定太熟悉;三是资本市场将会非常认可,这样3Cap作为AGI时代的一个新基金才能打响名堂。

AI科技评论:3Cap是一家比较新的基金,能投到Cerebras这样的明星项目,给外界的反差感还挺大的。

王康曼:我当时跟LP说我们有Cerebras Systems的额度时,他们也都觉得有点难以置信,之一个反应就是“这样的公司这样的估值,怎么可能拿得到”。但Andrew一直特别支持,后来我的一个LP还在硅谷见了Andrew聊了一个下午,这时候大家才反应过来,原来亚洲真的有这么一家新开张的VC有这些独特资源。

其实我和Andrew认识多年,几乎是见证了他们成长。同时他也很了解我的经历。我们都创过业,都知道创业背后的辛酸与苦楚,他也知道我对AI的算法技术与产业落地有多年的认知积累,在创业初期与创业后期提供的帮助,含金量是不一样的,我很幸运的是我跟Cerebras结缘是在早期。

像Cerebras这样的案例不是个案,只是我们投的之一家。希望以后还有这些独特,有趣的项目带进来我们基金里面。

AI科技评论:Cerebras的投资方里华人背景的机构多吗?

王康曼:有,但正式在Cap Table上面的寥寥可数。

AI科技评论:Cerebras Systems快要上市了,他们的商业化情况如何?

王康曼:Cerebras是少数在AI芯片初创企业中,商业化已经比较成功的。 *** 息里面也提到,他们去年年底已经在经营性现金流层面打平,也就是说基本上不烧钱,这点很少创业公司能做到,更不要说在硬件芯片行业了。

他们落地案例有很多,包括了各地 *** 和企业龙头,除了欧美还有全球。当中最为有代表性应是他们和中东G42的合作,阿联酋要打造全世界更大的AI智算中心,当中一半用的是英伟达,另一半是Cerebras的方案。

他们的集群Condor Galaxy一共6个,加起来36个exaflop,这个是相当可观的。给大家一个概念,中国预计在2024年全年算力大概有230个exaflop,2025年大概300个exaflop。Cerebras的产品已经投入在线而且大量应用,这些都是类似起跑线竞争对手没有具备的。所以它们经常被外媒号称“Nvidia challenger”。

其实美国这几年IPO市场都比较安静,Cerebras作为AI初创芯片公司之一股,也说明了他们的实力。

AI科技评论:G42为什么会选择一半英伟达,一半Cerebras?

王康曼:原因很简单,G42一直对前沿科技特别感兴趣,建立国家级别云的话,也不能只是用单一系统,一定要有后备系统。他们一直和多家芯片公司保持合作,但Cerebras是当中比较突出成功的案例。

我和G42当时做评估的人也有聊过。他们觉得,在性能方面,Cerebras用的方案跟其他几家完全不一样,他们做大的晶圆片,所以从冗余的角度来说更加安全、高效。G42在选择供应商时其实测试了很多其他芯片厂商,最后选择了Cerebras。用下来觉得确实不错,去年他们合作又加深了,这也很能说明Cerebras的技术含量。

AI科技评论:那您看好Cerebras能和英伟达形成竞争的点主要在哪些方面呢?

王康曼:Cerebras的每个组件都针对AI工作进行了优化,对软件框架,如PyTorch 2.0,以及常用的AI大模型和技术,比如Diffusion、多模态、ViT、MoE等,提供原生支持。因此在做AI大型模型训练的时候Cerebras比H100快很多也易用很多。举个例子说明,由于Cerebras不需要进行parallel programming,在它的机器上训练1750亿参数的GPT-3大小的模型,用NVGPU需要20507行综合Python、C/C++、CUDA和其他代码,而一片WSE-3只需565行代码。

图片来自 ***

AI科技评论:Cerebras以芯片“大”而闻名,就您对Cerebras的了解,对于AI的发展而言,这种更“大”的芯片在性能上有什么优势或壁垒吗?

王康曼:我觉得在大模型时代主要有几方面的优势:

一是能进行大规模并行处理,Cerebras晶圆级大尺寸芯片的内核数量相比H100增加了52倍,增强了并行处理能力,非常适合需要大量计算能力的大模型训练场景;二是大芯片尺寸允许更多的片上内存,减少了对外部内存访问的需求,这样可以加快处理速度。

其余的优势还有简单高速的架构、高带宽、在解决Sparsity问题上的表现优异等。

配备WSE-3的CS-3计算机理论上可以处理24万亿参数的大型语言模型,这比OpenAI的GPT-4等顶级生成式AI模型的参数高出一个数量级(据传有1万亿参数),在CS-3上训练1万亿参数模型就像在GPU上训练10亿参数模型一样简单。

Cerebras在AI day上展示了他们的一个4个系统的集群可以在一天内微调Llama 70B,2048个系统的cluster可以在一天内从头开始训练Llama 70B。这个的意义就是大模型的迭代可以非常快,可以快速试错和迭代。

AI科技评论:成本这块Cerebras有优势吗?

王康曼:Cerebras每个系统比英伟达要高,确实是一笔较大的初始投入。但由于效率的提升,随着时间的推移,总拥有成本(TCO)会有竞争力。

数据中心运营商非常重视高效的电力使用,因为这直接影响到总拥有成本。AI硬件由于其巨大的计算密度,特别耗电。CS-3的峰值功耗为23kW,而DGX B200的峰值功耗为14.3kW。然而,CS-3的速度显著更快,可达125 petaflops,而DGX B200则为36 petaflops,每瓦性能提高2.2倍,这样一个CS-3系统的整个生命周期将电力费用减少一半以上。

Cerebras的WSE可以完成多个GPU的工作,能减少所需硬件的总数,那么由于需要管理的单元数量减少,运营成本如电力消耗和冷却也可能降低,更不用提构建集群所需的人力物力成本了。

3Cap如何做AI投资?

AI科技评论:去年12月您创立了3Cap,您为什么会选择在这个时间点创立一个基金?

王康曼:早些年,AI是个新领域,大家都在探索产品如何理论变实践,如何成功落地。而去年是AI 2.0的元年,AI技术开始普及,成为大家都可以使用的工具。

我认为2.0时代存在很多机会,我创立3Cap,其实也是希望通过自己的经验积累,更灵活地捕捉全球AI 2.0时代的机会。我相信亚洲有我这类背景的投资人不算多,我90年代几乎刚毕业就在华尔街,当时比较少华人在front office,所以给到我的机会与挑战都特别多,同时有幸在资本市场很早就接触科技项目,对当地资源有比较深厚积累,同时,在过去六年,也就是AI1.0时代,投资了几十个AI相关项目,并有幸在AI巨头里面见证创业并成功退出。

AI科技评论:现在你们一共投了多少个项目?

王康曼:暂时只投了两个,包括Cerebras在内。另一个是一家运营做得比较好的公司,是华人在西雅图创立的公司,偏应用层,但是这块以后不是3Cap的投资重点,只是因为团队非常出色,所以投了他们。

AI科技评论:在澳门Beyond Expo上,您有谈到3Cap最早是注重AI Infra与硬件上。

王康曼:作为一家美元基金,我们的投资视野不局限于国内项目,而是扩展到东南亚、日本、美国等地。那我们的首要任务就是确保所有投资项目都能存活下来,因为我们基金的结构是4+4模式,即四年投资期加四年退出期。

在互联网周期中,有些公司一开始可能估值很高,但一两年后可能就会迅速衰落。AI领域的周期可能会更加剧烈。在移动互联网时代,比如京东、美团这样的企业,即使十年不盈利,市场也能接受,但在AI时代,投资者可能无法忍受这样的长期不盈利。因此,从我们基金的角度来看,必须投资那些在未来四五年内依然能够存续的公司。

每个赛道都有其投资机会,但从我的角度来看,AI Infra部分的确定性相对较高,因为AI行业真正意义上从2.0开始算,实际上发展才刚刚开始一年半。其实所有的基础设施都还未完全准备好,这就是为什么英伟达的股价能够如此快速上涨。我非常认同这样的观点——目前所有的数据中心,其潜在的硬件和软件,主要是硬件,都需要进行置换,其中肯定不会只是英伟达。

你可以想象,如果在150年前,工业1.0时代到来时,从马车转向蒸汽汽车,我们会考虑投资哪些公司,肯定优先考虑那些制造发动机的公司,因为未来将需要大量的发动机。

那推溯到今天,AI infrastructure这一层应该有一些未来五年一直在的公司,在芯片上会取代英伟达本身的一些设计,可能不会完全吃掉英伟达,但肯定会降低它的市占率。所以,在投资的角度,我会先聚焦在infrastructure这一块。

其实我最近看了一个特别有趣的数据,是说对比过去一两年,今年AI的投资是暴涨,亚洲在AI这块投了挺多Data Center(数据中心)。Data Center在这里的定义是基建,这类投资周期较长,大概十年左右,但比较稳定,所以对很多大基金有吸引力。

因为我们的基金刚刚成立,这些动不动几十亿美金的项目不会是我们这个阶段的重点,所以我们要投Data Center上面有附加值的项目。

AI科技评论:对比来看,海外的AI投资有什么趋势吗?

王康曼:海外市场在AI领域的投资趋势显示,大模型非常受欢迎,例如,OpenAI获得了100亿美元的估值,早阵子xAI种子轮也相当多知名投资人参与。过去几周二级市场对AI板块稍有调整,我觉得这很正常,也健康。整体一级市场还算相对理性,头部效应也比较明显。

此外,海外投资者对能源领域也表现出浓厚兴趣,因为AI的耗电量巨大。中国拥有众多核电站,但美国近年来新增的核电站并不多,AI的耗电量却在急剧上升。因此,海外市场对如何为AI提供绿色能源的项目也表现出了浓厚的兴趣,这块是AI Infra的上游。

AI科技评论:从AI 1.0发展到AI 2.0,您有感受到行业在迅速变快吗?

王康曼:这个问题很好。其实PC时代持续了几十年,移动互联网时代大约十几年,而AI时代可能只有几年。行业的波动变得更加剧烈,高峰和低谷的差距越来越大,这意味着行业的洗牌可能会更快。

从我们投资人角度来看,这有好处也有坏处,好处就在于不好的企业可以更快地被淘汰,而能够在AI 2.0浪潮中生存下来的企业,其最终估值可能会比以前的企业高。如果你错过了之一波,并不一定意味着为时已晚。

但作为风险投资者,我们更关注早期项目,希望这些公司四年后仍然存在。我们认为,能够在快速变化中生存的公司,应该还是在Infra这一块。

AI科技评论:所以您觉得投资的风险会增高吗?3Cap怎么规避风险?

王康曼:会。所以我们就投两种,一种是非常前期的项目,一种是我们知道可以相对比较快商业化落地的项目。投资的话,一定要看能不能够在最快的时间内体现价值,而且能在合理商业条款下退出。

AI科技评论:AI投资需要既懂AI、又懂投融资。您认为您在AI产业的积累对您与AI技术创业者交流有什么帮助?

王康曼:我觉得每一个浪潮都会有一波新的投资人进来。从80年代的PC浪潮到互联网、移动互联网,每个时代的科技背后都有特别懂它的投资人出现,所以我觉得AI 2.0时代也会有一波特别懂AI的人成为投资人,我希望3Cap能成为其中之一。

我年纪大了(笑)经历了三个大周期,包括互联网泡沫、亚洲金融风暴和全球金融危机,对资本市场熟悉之余也有敬畏之心,加上我也亲自参与了AI行业的发展,从企业的成功和失败中学到了很多。有这种经验组合的投资人不多,在这方面,3Cap有自己的优势。

投资其实是很反人性的。所有的投资的热点一开始的时候都是有一窝蜂的人去做,无论是投资人、创业者,还是现有的公司,但真正懂得在里面挑的还是少数。你可以参考一个网页叫AI Graveyard,里面都是去年一窝蜂成立现在不能存活下去的公司。

AI Infra重构正在加速

AI科技评论:您认为是什么在支撑一个AI公司的估值?

王康曼:首先要看是在AI的哪一个领域,因为现在很多事物都能和AI扯上关系。但在AI 2.0时代,我觉得创业与投资的机会是在四个方面:数据、硬件、软件和反馈循环(feedback loop)。

之一个是数据。数据收集和创建是一种艺术和科学的结合,比如OpenAI和Anthropic在数据收集和创建上有不同的 *** ,所以结果不同。还有就是Organic和Synthetic(人类和机器产生)数据的占比,后者可以引致modelcollapse要调动的函数很多。

第二是硬件。GPU本身是用来打游戏而不是做运算的,虽然在训练和推理中很快,但架构需要优化,现在有很多团队在提高GPU效率或开发新的芯片架构。我相信英伟达的市场占有率会被新的创业团队占领、削少,这是很大的一块市场。

第三个就是软件层。每个国家最终可能只需要几个大模型,关键在于找到那些能够存活下来的公司。

反馈循环也很重要,即看产品应用出来后的效果,能否快速知道并改进。

中国在这方面有优势,可以在半周内根据反馈做出新的原型,而国外公司可能需要三个月。就AI这一块而言,首先中国人多,所以试错成本低,其次中国在运营方面比很多国外公司都有优势。

因为投资人爱看如何商业化落地,但如果没有运营、没有反馈循环,商业化是做不好的。

AI科技评论:Feedback loop可以理解为应用吗?还是说要加上运营?

王康曼:应用加运营。比如现在做得很好的抖音、美团,他们有运营的基因,AI是个帮助他们运营得更好的工具,AI本身不是一个产品,如何把AI用在你的产品上面,让大家无论是企业、 *** 还是个人都离不开它,这就是运营,这个是很重要的。我觉得在这一点上,国内会有很多优秀的公司出来。

AI科技评论:像Etched AI现在也很热门,但是有业内观点认为,这种专门基于Transformer设计的ASIC芯片不能make sense,一旦出现新的架构替代Transformer,他们就会失去存在价值。

王康曼:我们首先要思考:Transformer是不是一个可持续的技术浪潮?如果是,这个问题不言自明;如果不是,那么这个团队有没有可持续能力和资源去面对以后新的架构生态?

Etched是ASIC设计,专门针对Transformer架构进行了优化,目前还是会有较好效果的,但是由于缺乏通用性,一旦新的架构出现并替代了Transformer,它们就会失去竞争力。

而我个人认为新的范式出现只是时间问题。纵横历史,每5到10年,人工智能就会有大牛给出新的范式。从专家系统到决策树,到SVM (support vector machine),到神经 *** 、深度学习,都是阶段性的技术。十年后我们还用不用Transformer真的不好说。

而历史上,每一个新的范式出现,之前的范式都会被拍死。我相信新的芯片范式也可能潜在颠覆人工智能算法。这个回复,我们可以十年回头看看对不对。但就目前的模型发展趋势来看,Transformer还是比较难撼动的。

我们在研判是否投资这类公司的时候,同时也需要进一步考察公司的研发团队背景和实力,了解他们是否具备持续创新的能力,以及在其他潜在替代架构上的研究和储备。

AI科技评论:您觉得在AI 2.0时代,硬件计算这块的创业公司有出现什么新的机遇吗?

王康曼:我们接触了解了几十家公司,包括大家可能比较熟悉的Graphcore、Samba Nova、Tenstorrent、Groq、Untether、Mythic等,它们各有特色。

AI 2.0 Act One会有更多训练场景,我们相信Cerebras是很好的标的,而Act Two会有两个大主题,一个是会更看重推理,另一个就是相对训练英伟达垄断,推理会有更多芯片公司,这块会百花齐放。

Groq就是很好的案例,他们在Meta Llama 3.1反馈很好。Samba Nova也很不错,和Groq一样也是ASIC架构,他们存储用了HBM + SRAM混合方案。成本比Groq要低不少,产品成熟度也高,Oracle、Stanford、高盛都在用,也值得关注。当然还有很多,譬如脑机芯片等等,到最后都是一个技术、商业化、回报的平衡。

AI 2.0无论创业,投资专业门槛都比之前要高,我们团队既然有这个背景,那就该利用自己的优势,创造超预期收益。

AI科技评论:从Cerebras Systems的投资来看,感觉您是一个长期主义者。

王康曼:我觉得无论做人做事情都要长期主义,因为信用是需要长年累月积累下来的。真正的长期主义要陪跑,在好的时候要陪跑,在坏的时候更加要陪跑。

投钱是重要的之一步,可以说是马拉松里面的之一公里,但之一公里不是最辛苦的,第二,三十公里才是。对VC来说,之后更加重要的给到创始人怎么样的资源、包括招人、对接潜在客户、投资人,如何退出等等,这些都是不可或缺的过程,当中需要的是耐心,意志力和责任心。这些做好了,给LP的回报才会高。

说到这里,我们基金成立不久,欢迎志同道合的朋友加入我们(有兴趣的读者请添加微信Fiona190913交流对接)。我最希望的素质是有合作精神的人。聪明很重要但不是最重要,当大家的智商或阅历都达到某一个水平后,拼的就是认知与格局,而长期主义在其中扮演很重要的角色。雷峰网雷峰网(公众号:雷峰网)