投资企业新闻

启明星 | 与爱为舞张怀亭:在AI应用领域创业,要先有业务闭环、再用模型接管

2025/08/18

由启明创投主办的2025世界人工智能大会(WAIC)“启明创投·创业与投资论坛——创业投资开启AI技术与应用共振周期”于7月28日在上海世博中心蓝厅成功举办。

在本次论坛上,与爱为舞创始人兼首席执行官张怀亭以《关于AI应用创业的思考与实践》为题发表了演讲。


与爱为舞创始人兼首席执行官张怀亭

张怀亭在演讲中表示,AI应用的创业机会在于利用生成式AI技术,将服务业做成制造业,打破大规模(个性化)-高品质-低成本的不可能三角。之所以目前还没看到AI应用的爆发式商业化落地,核心原因是大模型的幻觉、推理的不准确和结果的不确定。这就要求从事AI应用的团队既要懂业务还要懂AI技术,平衡模型的不确定性和业务的容错度,先跑通业务闭环,用业务牵引AI能力逐步落地,同时找到适合自身业务场景的数据飞轮。在智能时代,跨界的人才密度和务实创新的企业文化是组织建设的关键,人机协同的工作范式是企业运营的基础。

以下系张怀亭的演讲内容。

感谢启明创投给我们这样一家成立才两年多的初创企业机会,在这里向大家汇报一下,我们在AI应用领域这两年来创业的实践、总结和认知。

十几年前,我和当时的团队在互联网大厂,第一次用深度机器学习算法,开发了大概率是全中国第一个大规模广告推荐系统。这个系统取得了不错的效果,帮助我们建立了对AI的初步认知。之后,我和一群志同道合的伙伴在教育领域进行了第一次创业,并有幸在纽交所上市,对教育行业也有了一定的认知。当生成式AI出现时,我们发现它可以给“科技向善”和教育普惠更大的空间。于是在2023年,我和我的伙伴们开启了第二次创业。

我们认为教育最重要的是有好老师,做到有教无类。也就是说,无论是男生还是女生,在城市还是乡村,贫穷还是富有,孩子还是成人,每个人都能拥有一位很好的终身陪伴的AI老师,根据个体的兴趣、阶段、效率、潜力、状态、性格等,进行个性化的传道、授业和解惑。当然,实际上今天的教育资源依然非常稀缺,教育成本也比较高昂。当生成式AI技术出现时,基于对科技和教育的认知,我们判断服务个体的教育资源在边际成本上一定会越来越低,理论上应该接近于实时的推理成本,大概率能在现有成本基础上削减90%。随着技术的发展,成本下降幅度也会越来越大。同时我们认为,这样的AI老师应该具备随时随地的特性,不管你在哪里,只要想用就能用。而且它的知识储备将随着智能系统的增强而增强,有可能在所有领域为每个人提供最适配的个性化指导。

今天我并不想过多介绍产品或算法,这几天在这里有很多相关展示,相信大家都已看到。因此想换一个视角,由于我们是连续创业团队,希望从创业的角度和大家做一些浅显的分享。

我们认为在AI应用领域较大的创业机会是把服务业做成制造业。大量现有的服务业是人力密集型行业,这些行业经常会遇到“不可能三角”:既希望用低成本提供高质量服务,又需要大规模覆盖,这基本上是个悖论。以医生为例,生活中我们经常有这样的经历:到医院可能要排两小时队,最后只和医生聊十来分钟;或者医生开了检查单,又要排队做检测,有时能排上,有时排不上,可能还得约下一次。这充分说明对大多数人而言,获得高质量服务很难,同时成本也很高。生成式AI让我们看到了机会,能够规模化地提供个性化服务,实现质与量的兼顾。在虚拟的数字世界里,我们常听到“千人千面”这个词,“千人”代表规模,“千面”代表个性。类似推荐系统,像内容分发这类应用,已经解决了规模化和个性化的并存问题,但在服务行业还未实现,主要受限于推荐系统本身的能力边界。

用生成式AI改造人力密集型行业,首先用算力成本替代人力成本是更合适的。从趋势看,算力成本会越来越低,而人力成本会越来越高。其次,人力密集型企业的人才选拔、使用和培养极其复杂,加上优秀人才流失,管理成本非常高,几乎不可能完全标准化。但如果采用生成式AI技术,标准化服务是可以实现的。一旦用生成式AI技术把服务业做成制造业,未来我们每个人身边都可能拥有专属的AI老师、AI律师和AI家庭医生。

对于AI应用,似乎尚未看到大规模落地与爆发,这是为什么呢?作为对比,我们来回顾十多年前移动应用爆发的前提。首先,当时的5G网络基本成形,智能手机也已普及,基础硬件建设层面已然成熟。手机具备定位、相机和支付功能,为移动应用提供了基础保障。例如高德地图、滴滴打车和美团外卖都依赖手机的定位能力;快手、小红书基于相机功能记录生活,无论是视频还是图文;像高途这样的在线教育公司则依赖音视频直播互动,帮助用户随时随地学习。同时,支付功能的普及使应用商业化成为可能,否则大量商机将被错过。正是有了这样的基础设施,移动互联网的应用公司只需要考虑应用本身,而不需要考虑更底层的体系构建。

而今天,我们会发现模型存在很多幻觉,推理能力依然不够准确,相同上下文场景下的输出结果也不稳定。同时,多模态能力如数字人的实时交互、大幅遮挡下的面部稳定性、实时生成的表情神态、语音语调以及互动延迟等方面都还比较弱。此外,很多企业至今尚未遇到这样的情况:在同一时间面临数百、数千甚至数万的推理并发,这需要优化大量底层架构能力,对如今的创业团队要求较高。一方面需要判断AI发展趋势和迭代速度——实际上从去年到今年,发展速度已超越当年的摩尔定律;另一方面要明确当前模型的能力边界,比如文生图,也许这个图片可以直接用,但文生视频用于短剧制作还达不到要求。应用过程中还需平衡模型不确定性与业务容错度,这一点很关键。比如推荐系统做内容分发,用户不喜欢的短视频划走即可;广告推荐系统推送了用户不感兴趣的广告,略过就行。但如果AI医生要做手术,能否允许它犯错?因此模型输出的不确定性与业务容错度直接相关,如何平衡何时使用模型能力、何时依赖系统能力,就是一个“真问题”。

对于AI应用创业的路径,我们的理解是:先建立业务闭环,验证应用场景的有效性;然后用模型逐步辅助或替换闭环中的某些环节,最终实现业务的AI化变革。这或许是一条比较务实的渐进路径。在此过程中,核心问题是整个闭环数据能否上到云端?是否有系统可以采集所有交互数据和静态特征,形成高质量的特征集合?之后用这些有效数据训练模型,完成AI应用的最终变革。这一思路得益于对互联网创业史的总结——许多颠覆性技术的应用源于成熟业务的倒逼。例如阿里云和亚马逊云,都是因为自身电商产品有集中爆发式的使用压力,才推出了云服务,云服务为内部提供支撑,能力溢出后再为更多的外部机构提供服务。

对于AI应用,还有一个底层思考,关键在于用AI来赋能,还是用AI来替换?我们判断这两种情况都有可能,体现在不同业务或环节中。AI赋能如同将人变成钢铁侠,实现路径是智能辅助、人为决策。由于当前AI尚未达到顶级人类水平,人的顶线更高。通过AI助力实现部分标准化,大概率可以把人做事情的方差变小。因为最终还是由人来决策,我们可以想象,比如一个人一秒钟做一次决策,一天做决策的上限也就是86400个,受限于此,业务的增长只能是线性的。当然通过AI辅助,成本必然会有一定的下降。最终整个团队的组织能力是构建在管理和系统上的。当我们假设有一个工作可以用AI完全替换,也就是无人化,则采用智能系统驱动。鉴于当前AI并非100%准确,仍需人工兜底。长期来看,不受人力限制的算力扩展可能实现指数级增长。就目前AI水平而言,顶线虽不及人类,但均线一定会提升,方差理论上应该为零,成本将呈数量级下降。这种体系下,组织能力仅仅需要构建在全智能系统上,效率更高、成本更低、迭代速度更快。

大家经常会问一个问题,AI应用是否存在数据飞轮?最近谷歌也好,OpenAI也好,都宣布模型在奥林匹克数学竞赛的难题解答上已经做得非常好。类似这样一个有确定性答案的任务,今天的模型能力已经远超绝大部分人类,这时它和人在交互过程中取得的信息,已经不足以再提升它自身的智能。例如询问“英伟达股票还能买吗”,如果信息足够充分,理论上存在标准答案,此时无需通过交互获取更优解,也就不存在数据飞轮。再比如说有一个完整约束条件的任务:“购买北京至上海7时的高铁二等座车票”,Agent只需执行即可,不存在迭代优化的数据飞轮。

什么是数据飞轮?比如你现在要求“中午订一份好吃的外卖”,Agent需要了解用户身份、用餐时间、送餐时效、饮食偏好、地点、价格区间,以及近期点餐记录是否需要避免重复等。这些都需要通过持续使用过程中个性化的交互沉淀用户习惯,形成数据飞轮。更复杂的如“提高英语能力”,这个英语能力指的是听、说、读、写中的哪种?应该怎么提升?当前的水平是怎样的?个人的学习习惯是怎样的?学习效率是怎样的?这些都是与用户的交互过程中持续沉淀下来的静态特征和动态行为,结合长短期的上下文,才能实现个性化交互,逐步形成数据飞轮。

今天AI应用的组织到底应该是什么样的?我们认为最重要的还是人才,且人才密度需高于业务复杂度。如今既需要行业领域人才,也需要AI人才,实际上领域人才和AI人才放到一起融合,难度是非常大的。我们公司曾出现这样的情况:AI人才认为某些工作“不够AI”,没有充分运用模型;而领域人才则指出当前模型能力有限,仍需沿用原来的方法。怎么把他们融到一起,形成合力,这非常关键。第二,需要建立务实与创新并存的企业文化。正如前文所述,先构建业务闭环,再通过AI进行升级或变革。既要有基础业务能力,务实地创造商业价值,还要持续关注全球技术发展,懂得如何把AI能力应用到业务上。第三,硅基生命已成为组织的必要组成部分。例如在代码研发中,可能需要Cursor等的协助;在销售环节,AI可承担某些具体工作。因此,人机协同将成为智能时代企业的基础运营范式。对于难以适应这种转变的资深员工,我们一方面要提供机会,给时间点推动这样的员工做改变;另一方面,我们也会敦促员工:站在未来看现在,不换脑子就换人。

以上就是我的分享,总结我们在AI应用探索中遵循的16个字:“业务牵引、智能驱动、人机协同、务实创新”。公司提倡延迟满足,引导大家不高估短期收益,也不低估长期积累。

 

来源 | IPO早知道