由启明创投主办的2025世界人工智能大会(WAIC)“启明创投·创业与投资论坛——创业投资开启AI技术与应用共振周期”于7月28日在上海世博中心蓝厅成功举办。
在对话环节中,启明创投合伙人王世雨同未来智能首席执行官马啸围绕“AI实用主义:从智能硬件到办公助理,真正解决用户需求”话题展开对话。
启明创投合伙人王世雨(左)和未来智能首席执行官马啸(右)
马啸分享了未来智能从智能硬件切入办公场景的创业历程。他指出,AI硬件的成功关键在于平衡耳机基础硬件能力与AI增值服务,并以讯飞AI耳机为例,强调“5+X”策略——先做好音质、续航、外观、降噪、舒适度等核心体验,再叠加AI录音转写、AI摘要、翻译、AI嘴替等独特功能。他认为,大模型时代的数据积累与垂直场景深耕是创业公司的核心壁垒,未来智能将通过硬件入口构建“感知+工作流闭环”的办公生态,与巨头形成差异化竞争。
以下系对话节选。
01/
先聚焦硬件本身的价值
再增添AI的附加值
王世雨:先请马啸总自我介绍一下。
马啸:大家好,我是马啸,我们的公司是未来智能,主要关注AI+办公硬件垂直领域,目前主要的产品是讯飞AI耳机。我估计在座有些观众正在用我们的产品做记录,它是一款基础硬件非常优秀的耳机,再加上记录、总结、摘要等AI功能。
公司创业也就三年时间,主要聚焦办公和硬件方向。
王世雨:我来补充两句。讯飞AI耳机作为最近两年兴起的耳机硬件,尤其是和AI结合的AI硬件,在今年618期间是天猫、京东AI耳机领域的NO.1。现在千元耳机类目里,包含了苹果、华为这样的核心企业,未来智能已经排名前三,业绩十分不错。
第一个问题,你们研发耳机时还是上一代AI。能不能先讲一下,当时为什么会选择这样一个市场很大,但又“高手林立”的细分领域?
马啸:这是个逐步收敛的过程。我们这个团队的前身是在科大讯飞,做了好多年人工智能助理,安卓手机上的各种智能助理就是我们团队承接开发的。我们从2011年开始做,当时Siri智能助理的火爆程度和今天的生成式AI差不多,诞生了很多创业公司。但做到2013、2014年以后,就发现大家不怎么用了,这是怎么回事?
我们总结了一下,发现了上一代AI的问题:
第一,摊子铺得太大,给用户的期望值过高,最后实际体验和期望落差太大。
第二,其实很多商业环节打不通,号称什么都有用,但什么都做得很平庸。我们这次创业也是吸取了上次的教训,回过头想:既然都是AI,又不能解决那么多问题,怎么办?那就从越细分、越简单,用户能马上体验到实用价值的垂直场景入手。所以我们慢慢摸索到耳机这个方向还不错——一方面,很多用户都有耳机,甚至不止一副;另一方面,耳机除了打电话的通信需求以外,也是我们很重要的随身设备。在这个设备上增加些有用的AI功能,用户会不会买账?于是我们从2018年开始尝试,第一次失败了,2019年又试了一次,直到2022年这次尝试算是比较成功,一下子打开了市场。
王世雨:2022年刚好结合了AI的2.0时代。
您觉得对于耳机这个场景,从用户需求视角来看,他们最在乎什么?2022年之后取得成功最重要的原因是什么?
马啸:这个问题挺好。耳机领域有很多传统大厂,做了很多年,用户也很认可。我们进入后交了很多学费。最关键的点在于平衡用户对耳机的需求和对AI的需求。
这个话题稍微延伸一下,很多消费品乃至具身智能,其实都有类似的问题:AI有多重要?硬件本身又有多重要?最后我们通过“血泪史”总结了一些经验:耳机产品必须符合“5+X”的规律——“5”是耳机必须做好的五个基本属性:音质、续航、外观、降噪、佩戴舒适度。如果这些做不好,就像我们在2019年犯的错误:我们做了AI功能很强的耳机,自认为无敌了,结果推向市场,用户反馈是“这耳机塑料感十足,可能也就值100元,凭什么卖我七八百元?”商业模式就失败了。可能功能跑通了,但你卖多少钱,就必须得和同价位段最好的普通耳机品质一致。
另外是“X”,别人没有而你有的功能。一旦有了,用户就会觉得花1000多元买了款很值的耳机,同时还有AI功能帮我翻译,或在会场录音记录,不用费劲打字,会后大模型还能提供摘要、提炼要点,这样就觉得很值,整个商业模式就成立了。
总结下来,做所有AI硬件,大家千万别只关注AI功能。有时AI功能做得太泛、太碎,过于曲高和寡,反而忽略了硬件本身的价值,这在商业上很难成功。
王世雨:我觉得特别有共鸣。
其实我的团队在投AI和消费硬件领域的项目,也有一部分和应用相关。最近两年有个特别深的体会:在投消费场景与AI结合的项目时,不管是硬件还是软件,有时反而得先把AI抛掉。我们投的是AI赋能的something(某款产品),但得先讨论这个something本身成不成立。就像马总刚才说的,AI耳机的核心是什么?抛掉AI,得先是一副好用的耳机。AI带来的体验革新是一个附加值。
从我们看到的整个中国消费场景的AI投资来讲,确实觉得场景优先。AI功能会在长远时间体现公司差异,但前提是要把握好(硬件和应用本身)。
02/
更多的数据收集
更强大的AI大脑
王世雨:第二个话题,刚才您提到耳机只是切入办公场景的第一个载体,很好承接了媒体工作者、律师、销售人员等会议频繁、记录时长较长的需求,之后还有摘要等场景。除了耳机,在整个办公场景里,你们未来的规划是怎样的?和AI的结合点有哪些?能不能和大家分享一下?
马啸:这其实一直是我们战略思考的方向,也不是创业第一天就想明白了,有点像“跳下悬崖以后再造飞机”。
我们最初想通过AI耳机做记录。后来大模型来了,我们认知升级了,突然觉得原先是大脑(AI)不好用——上一代人工智能大脑效率低,每做一个行业方向都非常费劲,需要大量标注、数据,还要研究很多Skills(技能)、范式。现在大模型让大脑变得极其强大。但这里有个思考误区:觉得它什么都能做。实际上大模型就像人,我们的大脑从小学生升级成博士生,最缺乏的是对这个世界的感知。就像做办公领域,如果相关数据收集不多,就像世雨总有个超级博士生助理,但他第一天工作时,对您的需求不够了解;如果他和您共事三年,会知道您的所有会议信息、开会习惯、发邮件的习惯,这时作用就非常大,哪怕他只是一位中专生。
所以我们秉承的理念是:当AI大脑变得强大时,最重要的还是感知要足够好——这点容易被忽略。比如听得清、看得准。我们研发这款耳机时费了很大劲,因为它不只是传统用来聆听和打电话的耳机,还需要感知周围的声音,且录音需要准确。比如在10米距离、有噪音的情况下怎么录下来?传统耳机只为佩戴者收音,如何让后排听众也能录清楚我说的话?这需要对“听”做很多改造。所以AI的迭代不能光看大脑功能怎么做得垂直,还要让AI更好地感知周围——有点像机器人,只不过机器人原先是没有的,出现机器人后这个行业开始迭代;而耳机是原先已有的产品,大家就会忽略,认为在耳机上做硬件创新没那么有趣,实际上,让“听”和“看”融入产品要做很多工作,使办公的数据维度更立体。数据越立体,就像助理听得多、看得多,结果就越好。
这是我们未来在办公硬件迭代的主要方向:第一是听得清、看得准;第二是像黄仁勋提的概念,AI现在只是做记录,但媒体、金融人士还需要把录音提炼成PPT、报告,形成符合工作习惯的内容,再发给下属或同事,但这需要AI从单点切入,逐步在工作流和任务流的闭环中完成相应的工作。这是公司未来在AI方向上的两条主要路径。
王世雨:一个是数据采集,更多的数据才能更懂你;另一个是用超级大脑串联工作流。
马总还是有所保留,我知道他们下一代产品长什么样。他们下半年应该会推出一款比较划时代的办公场景产品,特别适合平时记录场景多、案头工作重的用户,敬请期待。
03/
硬件将成为下一代AI操作系统不可或缺的入口
王世雨:最后一个问题,在竞争这个环节上,您怎么看大厂?他们的数据不比创业公司少,钱、人更不用说。这问题您肯定被问过很多次,今天能否简洁回答,在这个领域有巨头,你们竞争的优劣在哪里?
马啸:像启明创投这样优秀的投资方肯定明白,如果诺基亚能做好手机,就不会有苹果了。行业永远在滚动发展,核心在于抓住未来可能会发生巨大变化的因素。
好公司针对需要提升的点有敏锐的认知,能提前卡位,就有超越巨头的机会。耳机所在领域是“红海”,巨头林立,我们如何竞争?办公硬件如何竞争?我认为行业正在发生巨大的变化,如果我们以终为始看,未来的硬件是什么样?大模型是否只能在手机和电脑上使用?能否在各类智能终端使用?它能否变成一个OS?若变成OS,什么设备能更好体现其价值?从这个角度看,各类硬件都有机会——不一定是耳机,也可能是眼镜或其他设备。
首先要有这样的认知。其次,我认为我们有发展和超越巨头的能力。
更务实地说,AI如何与巨头竞争?
第一,面对大量电子消费品巨头(如传统耳机厂商),我们更早布局垂直场景。这里有两个“护城河”:传统商业“护城河”,包括品牌、渠道,最终回归到消费者心智方向上的“护城河”;以及AI新增的数据“护城河”,越早为用户服务,用户越信任并把数据托付给你,这将成为未来AI的核心竞争力。与电子消费品巨头竞争,要守住这两道“护城河”,做创新品类,同时守住数据核心资产。
第二,互联网巨头的崛起是用互联网工具改造了商业,用互联网技术的方式改造商业的盈利模式,从而掌握商业盈利模式的核心——信息供给、供需交互的平台。这种情况下,互联网企业强调的是“快”,只有快才能战胜竞争对手,有望成为行业里为数不多的巨头之一,获得相对更高的利润。
但硬件恰恰相反。仅仅图快很难做好。互联网是先将某一功能做到极好,再不断迭代即可。但以耳机为例,音质、外观、续航等功能若有一项没做好就匆忙上线说“可以迭代”,是毁灭性的。因此互联网巨头在硬件方向的耐心可能不如我们足。此外,互联网主要在手机和PC运行,数据间存在壁垒。
我认为硬件有独特的价值“锚定”,比如今天Office的数据和笔记软件的数据无法互通,这是因为从系统上不开接口。怎样才能让两者互通?如果有个视觉设备能看你的屏幕,就完全可以“锚定”它了。所以硬件有其独特价值。基于这些,我对“硬件将成为下一代AI操作系统不可或缺的入口”这点还是非常有信心的。
王世雨:我总结一下,用硬件作为独特入口,沉淀私有的排他性数据,是AI硬件创业公司和巨头竞争非常核心的亮点。
来源 | IPO早知道