用生成式AI技术,将服务业做成制造业。
据IPO早知道消息,由启明创投主办的2025世界人工智能大会(WAIC)“启明创投·创业与投资论坛——创业投资开启AI技术与应用共振周期”于7月28日在上海世博中心蓝厅成功举办。
在本次论坛上,与爱为舞创始人兼首席执行官张怀亭以《关于AI应用创业的思考与实践》为题发表了演讲。
张怀亭在演讲中表示,AI应用的创业机会在于利用生成式AI技术,将服务业做成制造业,打破大规模(个性化)-高品质-低成本的不可能三角。之所以目前还没看到AI应用的爆发式商业化落地,核心原因是大模型的幻觉、推理的不准确和结果的不确定。这就要求从事AI应用的团队既要懂业务还要懂AI技术,平衡模型的不确定性和业务的容错度,先跑通业务闭环,用业务牵引AI能力逐步落地,同时找到适合自身业务场景的数据飞轮。在智能时代,跨界的人才密度和务实创新的企业文化是组织建设的关键,人机协同的工作范式是企业运营的基础。
以下系张怀亭的演讲内容:
感谢启明创投给我们这样一家成立才两年多的初创企业机会,在这里给大家汇报一下,我们在AI应用领域这两年来创业的实践、总结和认知。
十几年前,我和当时的团队在互联网大厂,第一次用深度机器学习算法,做了大概率是全中国第一个大规模广告推荐系统,这个系统取得了不错的效果,帮助我们沉淀了对AI的初步认知。之后我和一群志同道合的小伙伴们在教育领域进行了第一次创业,并且有幸在纽交所上市,对教育行业也算有了一定的认知。当生成式AI出现,我们发现它可以给“科技向善”和教育普惠更大的空间。于是在2023年,我和我的小伙伴们开启了第二次创业。
我们认为教育最重要的是有好老师,做到有教无类,也就是说不管是男生还是女生,不管是在城市还是乡村,不管是贫穷还是富有,也不管是孩子还是成人,每个人都能有一位很好的AI老师终身陪伴,根据个体的兴趣、阶段、效率、潜力、状态、性格等,进行个性化地传道、授业和解惑。当然实际上今天的教育资源依然非常稀缺,教育的成本也比较高昂。当生成式AI技术出现,以过往我们对科技和教育的认知,判断服务个体的教育资源在边际成本上一定是越来越低的,理论上应该接近于实时的推理成本,大概率是在现有成本的基础上削减90%。随着技术的发展,成本下降的幅度也会越来越大。同时我们认为,这样的AI老师应该具备随时随地的特性,不管你在哪里,只要想用就能用起来,而且它的知识储备将随着智能系统的增强而增强,有可能在所有领域为每个人提供最适配的个性化指导。
今天我并不想介绍过多的产品或算法,这几天在这里有很多相关展示,相信大家都已看到。所以想换一个视角,由于我们也算是连续创业团队,希望从创业的角度和大家做一些浅显的分享。
我们认为在AI应用领域比较大的创业机会是把服务业做成制造业,大量现有的服务业是人力密集型的行业,这些行业经常会遇到“不可能三角”,也就是希望用低成本提供高质量服务,而且还能够做到大规模覆盖,这基本上是一个悖论。比如说医生,生活中我们经常有这样的经历,到医院里可能你得排两个小时的队,最后只是和医生聊上十来分钟。或者医生给你开一个单子,你又要去排队做检测,有时能排上,有时排不上,可能又得约下一次,这就充分说明实际上对于大量的个体而言,高质量服务是不太可能的,同时成本也非常高。生成式AI让我们看到了这样的机会,能够规模化地提供个性化服务,量和质可以兼顾。回顾一下在虚拟的数字世界里,我们经常会听到一个词叫“千人千面”,“千人”代表规模,“千面”代表个性,也就是说类似推荐系统,像内容分发这种应用,已经解决了规模化和个性化的并存问题,但是在服务行业还没有做到,主要是局限于推荐系统本身的能力边界。
用生成式AI改造这样的人力密集型行业,首先用算力成本替换人力成本一定是更合适的。从趋势上看,算力成本会越来越低,而人力成本会越来越高。其次,人力密集型企业,人才的选、用、育都是极其复杂的,当然还有优秀人才的流失,从管理成本上也是非常高的,几乎不可能做到完全标准化。但是如果用生成式AI技术,标准化服务应该是能做到的。一旦用生成式AI技术把服务业做成制造业,未来也许我们每个人身边都能有专属的AI老师、AI律师和AI家庭医生。
对于AI应用,好像还没有看到大规模的落地与爆发,为什么呢?作为对比,我们来回顾一下十多年前,移动应用爆发的前提是什么?首先,当年的5G网络基本成形,而智能手机也已普及,在基础硬件建设层面已然成熟。手机有定位功能、相机功能、还有支付能力,给移动应用提供了基础保障。比如高德地图、滴滴打车和美团外卖,都依赖手机的定位能力;快手、小红书能够基于相机,记录美好生活,无论是视频,还是图文;类似于在线教育公司高途,依赖音视频直播互动,帮助用户随时随地参与到学习当中。同时,因为有了支付,应用的商业化能力得以承接,否则,将会有大量的商机被漏掉。因为有了这样的基础设施,移动互联网的应用公司只需要去考虑应用本身,而不需要考虑更底层的体系构建。
而今天,我们会发现,模型有很多幻觉,推理能力依然不够准确,在相同上下文场景下的输出结果也不稳定。同时我们知道多模态,类似数字人的实时交互能力、大幅度遮挡下的面部稳定性,实时生成的表情、神态,包括语音语调以及互动延迟,都还比较弱。同时,我们相信很多企业到今天还没有遇到这样的情况:在同一时间几百、几千,甚至几万的推理并发,这就需要优化很多底层的架构能力,实际上这对于如今的一个创业团队而言要求是比较高的。一方面需要判断整个AI的发展趋势和迭代速度是什么样的,实际上从去年到今年,整个发展趋势已经超越了当年的摩尔定律。另一方面,要明确当前模型本身的能力和应用边界,比如说我们可以用文生图,也许这个图片可以直接用,但文生视频,应用于短剧,可能还达不到预期的要求。同时在应用过程中还需要去平衡模型的不确定性和业务的容错度,这一点也很关键,比如之前提到的推荐系统可以做内容的分发,你拿到了一个短视频,不喜欢划走就可以了。比如广告推荐系统推给你一个不想看的广告,略过就可以了。但如果是一名AI医生要给你做手术,你能不能允许它犯错误?所以模型输出结果的不确定性和业务的容错度直接相关,如何去平衡好什么时候用模型能力,什么时候用系统能力,就是一个“真问题”。
对于AI应用创业的路径,我们是这么理解的,先有一个业务闭环,通过业务闭环验证应用场景的有效性。之后用模型逐步去辅助或者替换闭环里的某些环节,最终达成业务的AI化变革,也许这是一条比较务实的渐进路径。在这个过程中,核心的问题是整个闭环数据能不能上到云端?是不是有系统可以采集所有的交互数据、静态特征,把它变成一个高质量的特征集合。之后用这样的有效数据去训练模型,去做AI应用的最终变革。之所以会有这样的想法,得益于总结了互联网创业史的经验和认知,很多颠覆性技术的应用源于成熟业务的倒逼。比如阿里云,其实和亚马逊云类似,都是因为自身电商产品,有集中爆发式的使用压力,才会去思考做云服务,云服务为内部做了支撑,能力溢出,再服务更多的外部服务。
对于AI应用,还有一个底层思考,到底是用AI来赋能,还是用AI来替换?我们判断这两种情况都有可能,体现在不同的业务或不同的环节。如果是AI赋能,大概率会把人变成钢铁侠,其实现路径是智能辅助、人为决策。很明显,人的顶线比较高,因为今天的AI和最靠谱的人来比,还没有达到顶级人类的水平。因为AI助力,实现了部分标准化,大概率可以把人做事情的方差变小。因为最终还是由人来决策,我们可以想象比如一个人一秒钟做一次决策,一天做决策的上限也就是86400个,受限于此,业务的增长只能是线性的。当然通过AI辅助,成本必然会有一定的下降。最终整个团队的组织能力是构建在管理和系统上的。当我们假设有一个工作可以用AI完全替换,也就是无人化,大概率我们的路径是用智能系统来驱动,但由于今天的AI不是100%准确,所以还需要有人工来兜底。显然,长期来看,因为不受人的约束,通过算力扩展,就有可能做到指数级增长。从目前AI的水平来看,顶线一定没有人高,但均线一定会提升,方差理论上应该为零,并且成本一定是数量级的下降。这样的体系,组织能力仅仅需要构建在全智能系统上,效率更高,成本更低,迭代速度更快。
大家经常会问一个问题,AI应用到底有没有数据飞轮?最近谷歌也好,OpenAI也好,都宣布在奥林匹克数学竞赛的难题解答上,模型已经可以做得非常好。类似这样一个有确定性答案的任务,今天的模型能力已经远超绝大部分人类,这时它和人在交互过程中取得的信息,已经不足以再提升它自身的智能。比如当你问模型:“英伟达的股票还能买吗?”,我们大概率判断,如果信息足够充分,理论上有一个标准答案,这时它不再需要通过和人的交互获得更优解,也就不存在所谓的数据飞轮。再比如说有一个完整约束条件的任务:“我要买北京去上海的高铁二等座车票,早晨7点那一班”,Agent照做就行,没有其他可选项,不存在迭代优化的数据飞轮。什么是数据飞轮?比如你现在要求“中午给订一份好吃的外卖”,这个任务,Agent要了解你是谁,大概率你每天中午吃饭的时间点,它要算好外卖送过来的时间。你喜欢吃什么样的菜?口味是什么样子?地点在哪里?你是喜欢平价一点的,还是更注重生活品质一点的?价格区间是多少?以及最近这段时间,给你点过很多外卖,是不是不能重复?这里面其实大量依赖持续使用过程中个性化的交互所沉淀下来的用户习惯,就会形成数据飞轮。当然还有更复杂的,比如我要提高英语能力,这个英语能力指的是听、说、读、写哪种?应该怎么提升?当前的水平是怎样的?个人的学习习惯是怎样的?学习效率是怎样的?这些都是与用户的交互过程中持续沉淀下来的静态特征和动态行为,根据长短期的上下文,产生相应的个性化交互行为,逐步形成数据飞轮。
今天AI应用的组织到底应该是什么样的?首先我们觉得最重要的还是人才,人才密度要大于业务复杂度。当然今天的人才既要有行业领域人才,又要有AI人才,实际上领域人才和AI人才放到一起融合,难度是非常大的。我们公司原来出现过,AI人才说这件事做得不够AI,没有都用模型去做。领域人才说今天这个模型根本做不到,我们还要用原来的方式做。怎么把他们融到一起,形成合力,这非常关键。第二,要有务实+创新的企业文化,也就是刚才提到的,先有一个业务闭环,再用AI去做升级或者变革。既要有基础的业务能力,务实地创造商业价值,还要时刻关注全球技术的发展,懂得如何把AI能力应用到业务上。第三,今天我们可以看到硅基生命成为组织的必要成员,比如说代码研发,可能很多需要Cursor来帮忙;我们的销售很多都是由AI来做某些具体环节、具体事情,所以人机协同就会成为智能时代公司的基础运营范式。拥有多年经验的员工,可能一下子改不过来,那怎么办?我们一方面要给机会,给时间点推动这样的员工做改变;而另一方面,我们也会敦促员工:站在未来看现在,不换脑子就换人。
以上就是我本次的分享,总结我们在做AI应用的时候遵循如下16个字:“业务牵引、智能驱动、人机协同、务实创新”。公司提倡延迟满足,引导大家不高估短期收益,也不低估长期积累。
本文为IPO早知道原创
作者|Stone Jin
本文来源:IPO早知道
来源:IPO早知道
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】