启明新闻

启明·硬科技 | 启明创投周志峰:生成式AI产业将从超级模型转向超级应用

2024/03/15 | 极客公园

编者按:2024年初,OpenAI发布文生视频大模型Sora。生成式AI亦再度成为创投行业关注和讨论的焦点。启明创投是中国布局人工智能最早、最活跃的创投机构之一,也是国内投资大模型公司数量最多的机构之一。

启明创投合伙人周志峰日前在接受极客公园访谈时,分享了启明创投投资生成式AI和大模型企业的底层逻辑,即绝大多数目前致力于开发大模型的公司,不仅仅是技术提供者,最终将演变为模型应用一体化企业。在技术底座未臻完善且高速发展的阶段,自研模型的公司将构建模型-Agent-应用的后场-中场-前场布阵,展现出更大的竞争力。

启明创投微信公众号经授权转载。


启明创投合伙人周志峰

近年来,通用人工智能(AGI)领域的创业企业正加快创新步伐,融资也成为企业发展的重要一环。账上资金的体量很大程度上影响这些AGI领域初创公司的生存状况。市场上剩余资金的体量很大程度上影响其他AGI领域初创公司可能获得的融资机会。

启明创投已积极在AGI领域进行布局,相关投资项目包括智谱AI、优必选(09880.HK)、无问芯穹、衔远科技、生数科技、自由量级、云知声、梅卡曼德机器人、银河通用、无限光年等。

日前,极客公园访谈了启明创投合伙人周志峰等投资人,探寻当前市场上投资人的普遍看法,还原投资机构是如何思考AGI相关投资的。

周志峰在访谈中指出,模型层的高技术密集型创业团队会产生显著的虹吸效应;绝大多数致力于开发大模型的公司最终将演变为模型应用一体化企业;生成式AI产业的发展正从超级模型向超级应用转型。

以下系经精编整理的访谈实录。

01/
绝大多数致力于开发大模型的公司
最终将演变为模型应用一体化企业

极客公园:2023年有哪些预判被证实或者证伪了?

周志峰:第一,我们把AI生态分成了基础架构层、模型层和应用层,去年投资布局的重点是模型层和基础架构层的企业,这个投资策略被证明是正确的。

其次,我们在AI上继续遵循我们一贯的科技投资方法论,我们觉得是正确的。科技浪潮的发展,会有技术奇点和市场引爆点,技术落地会有几个阶段。我们认为生成式人工智能还处于早期阶段,目前主要由技术创新驱动,尚未进入到产品和商业模式的创新阶段。

第三,2023年初我们预判,模型层的高技术密集型创业团队会产生显著的虹吸效应。越是AI大咖创业,越是专注于前沿模型开发的公司,其“吸金”能力就越强。最后基本上也得到了证实,中国至少有80%甚至更多的资金、资源都投向了少数几家大模型开发公司。

第四,我们当时认为可能会有三类创业者出现:第一类是AI界顶级大咖;第二类是产业界老兵,如腾讯、字节跳动、快手等科技大厂背景的领军者;第三类则是像PC时代的比尔·盖茨、史蒂夫·乔布斯、互联网时代的马克·扎克伯格那样的年轻创业者,他们对新技术有深刻的洞察和极大的热爱。这个观点也经过了一定的验证。

此外,后来的事实也证明了当年我们比较犹豫的一些方向。我们曾经考虑过布局一些利用第三方大语言模型的应用产品,尤其当时美国企业Jasper.ai非常火爆。我们对这类项目的壁垒和可持续增长性有一定的担忧,但仍然认为中国应该会出现很多应用层公司。中国的生成式AI应用公司2023年在中国的成功度远远低于美国的应用公司,也在资本市场上没有达到美国的投资热度。去年美国市场上融资额超过5000万美元的应用公司有二十家以上。我们去年看了大量的应用层的公司,国内大约有300多家,并追踪了国外差不多1000多家公司,但最终出手的并不多。

极客公园:启明创投在AI赛道会有什么特色的投资逻辑?

周志峰:启明创投应该是国内投资大模型公司数量最多的机构之一。这和市场上很多机构的投资策略不同,我们相信这个类别中可以涌现出多家成功的公司。

我们的底层逻辑是,绝大多数致力于开发大模型的公司最终将演变为模型应用一体化企业。在每一轮技术革新中,应用层往往会捕获最大的市场价值。自研模型的公司未来不仅会在模型和算法上有所建树,还将根据自研模型和所掌握数据的特点,深入到特定的应用场景中,从而创造更大的商业价值。

现阶段,我们将模型层的公司分为三类。第一类是基础模型公司,它们类似于建造电厂,旨在让其他企业接入并使用其服务,代表公司如OpenAI和启明创投投资企业智谱AI。第二类是开源模型运营平台,它们提供开源模型、模型优化和托管等服务,如Hugging Face和中国的阿里云魔搭社区。第三类,我们最初称之为垂类模型,但现在更适合称其为模型应用一体化公司,这些公司直接利用自研模型去开发自己的垂直行业类或特定功能类应用。

生成式AI技术还处于发展早期阶段,类似于互联网的早期,各家公司还需要自己参与构建一部分技术基础设施,或不断适应动态发展的底层技术。

短期内,我们认为自研模型的公司将展现出更大的竞争力。它们能够从训练数据、模型优化等多个维度进行差异化竞争。模型层的公司根据自己的技术特点,开发出不同的应用来凸显其自有模型的优势。举例来说,如果一家专注于娱乐领域的模型应用一体化公司,它们在预训练和对齐阶段都使用了大量的爱情小说和电影情节数据,那么其训练出来的模型在对话时具有更加丰富的情绪表达,就会与一些通用的基础模型形成鲜明对比。

另外,从资本体量和试错成本上来看,模型层的公司做应用也具有优势。在2023年,模型层的公司融资额是以数亿美元计算,而应用层的公司融资额在千万美元这个级别,这意味着模型层的公司去探索应用时可以负担足够的试错成本去迭代自己的应用产品。

市场上,一些人可能会看到OpenAI在全球范围内的领跑地位,从而对模型层的其他创业企业比较悲观。我们也观察到一个有趣的现象:一旦OpenAI探索出一个新的技术创新,其他公司往往能够以更低的成本复刻,并缩小与其的差距。我们目前的观察是,包括中国在内的全球第一梯队的近20家模型研发公司,成本上,正在以大约1/5-1/10的成本去实现OpenAI的目前一代先进模型的水平;速度上,追赶的周期越来越短。而在2023年上半年,大家普遍认为追赶者和OpenAI有18个月左右的差距。

在投资策略上,我们今年会更注重早期投资布局。

虽然启明创投管理的资金体量相对较大,但作为一家创投机构,一方面当前很多研发语言模型和多模态模型的企业即使是早期,估值也不便宜,后期就更难投资。另一方面,生成式AI公司需要走过TMF(Technology Market Fit)、PMF(Product Market Fit)阶段,一般来说需要的周期是远长于消费品牌产品等其他领域的公司。一旦生成式AI企业完成了TMF和PMF,过了拐点,其上升趋势的斜率则更为陡峭,那时企业的价值会变得很高。

 

02/
看好以自研模型探索应用的公司
有望在多方面进行差异化竞争

极客公园:启明创投最近有什么对于AI的新思考?

周志峰:我们最近一直在思考,生成式AI产业的发展从超级模型向超级应用转型时,我们从投资角度应该如何应对。

因为我们投资了多家大模型团队,他们与产业链上下游的伙伴之间合作紧密,这些合作为我们揭示了潜在超级应用方向的信号。最近,一些历史上取得成功的创业者和科技大厂高管开始涌入这个领域,有些是选择直接创业,有些是选择加入创业公司,助力产品和应用的开发。

要实现从超级模型到超级应用的转变,我们需要思考三个关键问题:这一转变何时发生?以何种方式发生?以及由谁来驱动发生?

为了更深入地理解这种转变,我们研究了历史上几代科技大浪潮中涌现出的科技巨头的成长史,访谈了很多包括抖音早期团队在内的业界专家,试图找到一些底层规律性的东西。

这个问题是有一定时效性的,技术在不断变化,之前的判断可能在某个时间点后就不再成立了。在投资应用公司时,关键在于明确我们要投什么样的技术能力、背景和策略的团队或企业。

短期内,我们看好自研模型去探索应用的公司,它们可以从数据、算法、系统、算力、模型优化等多个方面进行差异化竞争。

极客公园:这一代大模型相关的AI创投浪潮与上一代会有什么区别?

周志峰:这一次是以预训练模型驱动的生成式AI为主,上一代主要是以感知为主的判别式AI。

判别式AI的核心特点主要有两点:第一,它主要是进行视觉和语音的判断,而无法进行深层推理,它的应用场景较为有限,主要在人脸识别、物体识别、语音识别、基于视觉的智能驾驶等任务上取得了较大的发展。第二,上一代AI模型需要为特定任务定制,其泛化能力有限。

这也是为什么在过去10年中,人工智能企业在技术落地时会遇到较大挑战的原因,因为它们需要为不同场景组建不同的团队。例如,很多人认为酒店入住时的人脸识别系统与公共场所的基于人脸识别的智能安防系统的功能相似,然而,从模型构建、训练到部署,以及芯片和摄像头等配套硬件上,两者存在显著差异。

之前的十年,人工智能技术主要在三个场景取得了规模化应用的成功:第一个是互联网的推荐系统,代表公司是字节跳动;第二是智慧城市,市场体量足够大,只有场景体量大才能形成闭环迭代,不断降低成本和提升性能;第三是智能驾驶,比如特斯拉通过几百万辆车完成了软硬件生态的闭环迭代。

今天的生成式AI,为我们打开了无限的可能性。

对于未来可能出现的大应用场景,目前我们暂时认为有三类:

第一类是使用AI提升生产力效率的场景,如针对特定行业或领域的软件工具,自动化重复性任务、提供决策支持、优化资源分配;第二类是泛娱乐领域,包括游戏和其他创新型人机互动、内容生成的娱乐应用;第三类是变革信息流转方式的创新应用。

极客公园:为什么中国的产品层创业暂时低于预期?

周志峰:美国在应用创业方面做得很好,用户基数及增长的量比国内大。一个侧面的数据是2023年美国头部创投基金投资生成式AI应用公司的比例是非常高的,占到了AI投资的50%甚至更高。

由于OpenAI等企业的先发优势,美国的大模型生态比中国起步早,目前更成熟。更多的应用公司利用这个成熟的生态做出了好产品。而中国的大模型生态还在初期发展中,基本上是从去年年中开始,比美国滞后一些。

美国的这些应用公司中可以分为两类,一类是To B,一类是To C。To B的公司主要是针对中小型企业的,美国的中小企业付费意愿更高,产品型企业更容易找到PMF,做出ARR,并获得融资,形成正向循环。而To C的公司目前主要是陪伴型文字对话AI产品获得了初步的成功。

 

03/
今年中国市场化机构对AI的投资将更活跃

极客公园:这一波大模型的出现,对启明创投本身有什么影响?

周志峰:ChatGPT的出现并获得了巨大的商业成功,这无疑是一个引爆点。在过去的一年中,我们一直在逆势招人,不断补充AI团队成员。我们现在团队中有一部分成员是具有机器学习专业背景的,有实操训练大模型的经验,也补充了对AI应用非常有热情的、正在沉浸式使用AI的同事。在国内机构中,像启明创投一样投入了这么多资源在这个领域上的还不多。

我们回顾2023年发现,启明创投在AI领域的投资占比与美国几个活跃布局AI的顶级VC基金在相同水平上。

2023年,美国创投市场投向AI的资金约为250亿美元,而中国仅为十几亿美元或等值人民币,可以看出两国在AI投资上的差距。今年,我们预计中国市场化机构对AI的投资将比去年更加活跃。去年美国市场大量的资金来自于科技大厂的战投;在中国,去年活跃的投资者主要包括少数头部美元VC,以及美团、腾讯、阿里巴巴、蚂蚁金服、小米、金山、商汤等战投,以及一些政府引导基金。

我们预计,今年投向AI领域的资金会有所增加。这一预测基于多方面的原因:我们与众多机构进行了深入的交流,发现他们对AI的兴趣在不断增加,无论是美元基金还是人民币基金,都在积极寻找AI领域的投资机会。

其他一些积极的信号也包括:随着AI技术的不断发展和应用场景的拓展,越来越多的有经验的“老兵”和有热情的新锐创业者涌入这个领域,为投资者提供了更多的选择;政府层面也开始重视并推动AI产业的发展等,如推动算力基础设施建设、数据共享和开发利用等。

此外,中国在制造业、硬件产品供应链等方面具有显著优势,为具身智能等AI技术的应用提供了广阔的发展空间。

 

来源 | 极客公园