
灵巧手堪称具身智能产业珠峰级的问题。
本文为IPO早知道原创
作者|苏打
“人工智能到底做什么?我想任何的事情都需要走自己的发展之路。AI发展有两个维度:一是攀登珠峰,追求最大的投入做最强的模型;二是可以修建公路,有更多的人、更多的场景,让模型可规模化的使用。这是两个不同思路”。
据IPO早知道消息,11月22日,IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在2025 IDEA大会上,从算法范式、智能载体、交互范式、计算架构和数据五个维度梳理了智能的演进,希望帮助创新者在这场智能浪潮中,找到技术的、产品的、商业的切口。
从交互角度看创新同样非常重要。他认为,今天作为一个产品开发者,“必须要去理解今天的智能特性,会带来什么样的交互创新机会。”
作为低空经济的“探险者”,今年,IDEA不仅带来《低空经济发展白皮书4.0:通导监网络之路》,还发布了由沈向洋领衔的著作《低空时代》。全书从基础、应用、法规、系统、技术、安全、开放七个篇章,梳理IDEA对低空经济的认知与实践框架。
大会现场,IDEA还宣布了两个新的创新平台:国际先进技术应用推进中心(深圳)与深港高等研究交流中心(SHARE),以及一系列创新项目。
据悉,目前其创新项目包括DataArc(合成数据促小语种模型发展)、DINO-X Grasp(万物抓取赋能具身大脑)、经济超脑、KAIROS决策智能体、Mozi平台(早期药物计算发现Copilot)、脱胎于通用编程语言的开发者平台MoonBit、OpenSILAS 2.0、LIM金融时间序列基座大模型Quant 5.0、GPU原生渲染器SMARAY以及思维实验室。
目前,研究院创新平台已包括福田实验室、国际先进技术应用推进中心(深圳)和深港高等研究交流中心(SHARE)。
以下为沈向洋演讲实录(经编辑):
欢迎大家来到IDEA大会。过去五年,我们得到很多关心和关注,今天非常感慨,也想梳理五年来IDEA研究院做过的工作。
创新有不同的维度,真正大规模的创新最多的钱投入是在工业界,深圳95%的科创投入在企业界和产业界。IDEA有一条自己的创新曲线。
众所周知,AI三大要素是算力、算法、数据,我再加两点——交互和载体。
先看第一个维度,算法架构。从2024年9月前OPENAI o1出来到现在,一年间,DeepSeek改变了中国大模型、世界大模型和开源大模型的发展。
新的算法在哪里?应该做什么?我有一些不成熟的想法,很多智能的东西不是全新的概念,我们应该重新读维纳的《控制论》,真正的智能和控制论是彻底连在一起的。强化学习背后的数学原理也是最优控制的一套理论,其中有很多想象空间。
第二个维度是智能载体。早起的模拟实际上都是从语言模型开始的,然后经历了从抽象到具体、从虚拟到物理的扩展过程。后来大家一直在做多模态,IDEA也做了很多工作。
最近常说的世界模型就是多模态模型的向前一步,加上很多物理规律。世界模型具体到机器人、自动驾驶的车、飞行器就是所谓具身的模型。从载体的维度来看,AI帮我们从理解这个世界到改变这个世界。
第三个维度是交互范式。过去七八十年计算机科学蓬勃发展,很重要的事情是计算机和人类世界交互的方式变化。
在模拟世界阶段,AI是被动响应的工具,就像最初的ChatGPT,问一句答一句,这也非常像传统的搜索。探索世界阶段更像持续迭代、循环的过程,你问他答,答了以后再问再答,帮你做Research。我们期望技术能够强大到,不止能够问一个问题给一个答案,而是更加像人在做科研时的过程。
第四个维度是计算架构。GPU在2006年开始通用的并行计算系统,一开始是用来打游戏的,后来发现可以挖矿,可以做大模型。
今天探索世界的发展,我们需要的芯片不仅仅是做训练,越来越多是推理,并逐渐向端侧、强化学习专用的芯片发展。这样的应用需求是非常不一样的,比如强化学习的芯片要支持快速交互、大规模并行;推理芯片一定要做低功耗、高吞吐专用的需求。我们对整体算力的需求会越来越大,今天的GPU能耗对电力的需求,对整个世界来讲都不堪重负。
未来有没有超越冯·诺依曼的新型计算架构出现?最近量子计算方面就有很多突破性的成果令我们有很多想象空间。
第五个维度是数据。预训练发展得这么好,要感谢互联网把世界上有用的数据存到网上。但到GPT3的时候,网上的数据就开始不够用了,互联网有400多T的数据,洗干净只有几十T的数据可以用,它是静态的数据、静态的教材。
所以AI预训练做得很好的模型,到了探索世界、强化学习的时候,就需要动态的反馈。强化学习需要有系列的动态反馈数据才能真正把探索世界的智能做上去。像骑自行车,光看书不可能学会。未来AI会越来越自主,它要能自己提出假设、收集证据,真正提升智能水平。

数据和智能的演进是互相推动的,但不是数据越大越好,质量同样很重要。IDEA研究院有一个很小的团队最近孵化了一家公司,DataArc团队,做的就是合成数据。最早的方向是在小语种方面突破语料稀缺瓶颈,比如英文互联网网上的语料有不到500T,阿拉伯语言只有4.5T,其中有100倍的差距。
今天我们非常高兴发布DataArc SynData开源框架,帮助做小语种的用户专注业务场景提高研发效率,把过去所需的2000行代码缩小至50行,提升非常大。这个团队从福田IDEA研究院几个小伙子的两篇论文开始,一年内就成为初创企业,接下来还有很多海外拓展机会,比如中东。

我想通过这个案例表达的是,人工智能到底做什么?
我想任何的事情都需要走自己的发展之路。AI发展有两个维度:一是攀登珠峰,追求最大的投入做最强的模型;二是可以修建公路,有更多的人、更多的场景,让模型可规模化的使用。这是两个不同思路。
数据之外,模型层面也有很多大的机会,例如,IDEA的郭健院长一直带领团队在金融方面做了很多的工作,从2021年全球最大的金融行为知识图谱、2022年的Quant4.0,还有2023年的Alphagpt,以及2024年端到端金融预测模型。物流数据的微调提效,还是金融这种垂直场景里摸高,智能的演进中蕴藏无限机会。

另外,Agent是模型落地的一个重要产品载体。今年,我们迎来了Agent创新的爆发,在个体、公司、治理和创新等方面带来了改变。
一个事实是,“个体+AI”已经能够完成过去一个团队才能完成的工作。例如,IDEA思维实验室的一位设计师同事,为一家时尚品牌做的广告片,从市场调研到内容策划和制作,都由他一人利用AI工具完成。
生产力决定生产关系,当生产力发生如此大的跃迁,封装在公司这个组织形态下的生产关系,必然发生根本性变化。这将是一个全方位的演化。
传统公司里,复杂任务需要拆解成多个环节,分配给不同角色,用流程来衔接,用考核质检来保证品质。这个体系的核心前提是,单个人能力的水平必须通过分工协作、规定具体任务来完成复杂任务。
但当个体能力被放大10倍、100倍后,很多原本需要多环节协作的任务,可以由单个超级个体端到端完成。这个时候,公司的核心职能不再是“拆解任务、分配工作”,而变成如何成就超级个体,让他们发挥出最大的生产力。

组织的重心,在某些领域中,会从管控到定义问题、融合超级个体之间的协作。在生产关系的变化之上,将是认知的变化,超级个体不是少数天才的特权,而是普通人的标配。
我们正站在范式转化的临界点。不管是在AI时代从零诞生的公司,还是目前已经成熟运作AI升级的公司,未来都会发生非常大的变化。IDEA的CTO工作室就是是我们研究院对接外部创新需求,在产业中运用顶尖技术的容器。
AI Agent在公司的应用场景是非常丰富的,换个角度,也可以将AI Agent想象成AI员工。其中有很多机会,比如政府、机构。其中政府统计局是一个非常重要的角色,要做很多数据分析,以前几乎都是人工肩挑手扛、找数据、整材料、写报告。去年我们发布了经济超脑1.0,可以看懂数据,AI Agent加入以后,还可以对问题进行规划、亮点提炼和分析。
我们今天也非常高兴和南山区政府达成合作,特别是和南山区统计局合作发布的经济超脑2.0,已经在南山落地,可以做很重要的中间工作,包括提出问题、目标拆解、关联搜索、汇总、结论等。未来我们也希望有更多落地机会。
未来,创新AI Agent将带来巨大机会,而且是影响人类发展的。AI for Science非常重要,科学的发展就是工具的发展。去年我们分享了IDEA研究院的化学大模型,发布了分子、抗体、反应、药物、文献。
今年有更大的突破,可以用作新药的发现。我们的论文已经发布在《CELL》上,也很高兴发布新的药物平台:Mozi平台。它不仅是AI智能体和工具箱,还可以真正解决传统做药物早期计算里面的痛点,比如工具误导、研发黑箱、工作瓶颈。

举个例子,用Mozi平台为帕金森病设置药物,AI Agent可以把这件事情串起来。一是选靶点,通过后台的研究可以锁定靶点;二是做AI的设计和筛选,很快锁定高清合理的分子,同时系统可以帮你做很多AI智能的安全过滤。这个过程中我们又做了一步,输出时可以交付药物分子候选物,甚至可以写一个综合的研究报告。通过简单的输入可以达到现在临床一期分子的质量。
我们还做了渲染器和MoonBit两个项目,5年来获得了IDEA研究院、福田、深圳市政府、耐心资本的支持,希望可以真正转化为生产力。
MoonBit是AI时代的编程语言。在计算机发展历程中,每隔十几、二十年就会出现非常主流、非常重要的语言,比如50年代的科学计算语言,60、70年代的C语言、unix,90年代的JAVA以及90年代后期的python语言。过去十几年,最重要的语言就是NVIDIA推出的CUDA语言对GPU进行编程。今天大模型蓬勃发展实际上是呼唤新语言的诞生。不仅新语言未来会出现,AI编程这件事情也是非常明确的。
2025年大模型落地能赚到钱,市场愿意付钱的就是AI Coding,从OpenAI到谷歌、Gemini对此都推动得非常强。目前国内也已经有很多Coding系统,阿里、字节都有推出来。今天AI编程已经等同于超过1500万程序员。
IDEA做的MoonBit语言由张宏波带领团队,非常期待明年波MoonBit的语言超过100万,真正步入世界主流的编程语言之列。
接下来,我想花点时间讲一讲具身智能和机器人。在福田、在深圳,这是我们巨大的机会。
我经常用Gartner的AI技术成熟度曲线,把现在所有人工智能的技术进行分类,从一开始的量子走到具身智能,再到2025年AI Agent元年,还能活到现在的就是有道理的。
大家都相信一件事情,肯定有商业价值,就是AI云服务。黄仁勋老卖芯片、微软卖云服务都赚钱了。
但这条曲线我想讲的是具身智能带来的庞大机会,很重要的原因是长期的支撑、协同进化、工程系统。机器人是很好的例子,但具身智能不一定是机器人,我觉得大湾区有非凡的机遇,这句话是去年11月份在香港科技大学我跟黄仁勋对谈时讲的。他说粤港澳大湾区是机电一体化技术和人工智能技术同时蓬勃发展的例子,人工智能在这里有非常了不起的机会。因此,我们也一定要抓住这个机会做一些了不起的工作。

具身智能最难的问题就是“灵巧手”,灵巧手是具身智能以后复杂度最高的,堪称珠峰级。马斯克的特斯拉缩减了人形机器人Optimus的生产计划,因为机器人的手和前臂技术占了机器人工程难度的绝大部分。IDEA研究院张磊带领的团队很长一段时间的工作就做一件事情,抓取。
这个动作很困难,机械手现在还不行。人类的一只手,五只手指有27个自由度,一只手上的触觉传感器2.7万个,不仅可以抓还可以感,反应是毫秒级的。
所以在AI面前人类还有最后的尊严,就是灵巧手。不知道什么时候这个技术会被AI攻破,我想攻破的话也是在深圳被攻破。

具身智能方面,过去一年IDEA研究院成立了三个新的中心,第一个新的中心就是福田实验室,聚焦机器人,由我们和腾讯公司合作。今天我们也推出了国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台。
这几年,IDEA大会最后一个环节的演讲都是低空经济。
低空的发展是技术管理经济的螺旋式上升,事实上真正的低空经济要能落地还是需要场景、系统投入、因地制宜。其中有很多制约,可以分成萌芽期、验证期、成长期、成熟期、进化期五个进化的阶段。
一个简单的标准,你的城市能有多少架飞机和无人机飞起来?大多数城市目前可能只有数百架。低空经济发展最好的深圳,每天飞到天上真正产生经济效益的无人机数量大约在1000架,还处于成长期。
推动低空的进化要从可通达做到可计算、可运营,最后做到可进化,帮助大家真正理解进化的过程。过去这些年我们有了一套自己的方法论,把低空这件事稳步的向前推进,也走了一条自己的实践路径,探索、验证、推广。

很多人都在问低空经济是什么?给我们带来什么样的机会?如何改变未来的生活、产业?我们今天也发布了研究院出品的《低空时代》这本书,希望通过这种方式和大家分享过去一年团队技术、产业、经济跨学科的深度思考。
特别感谢过去五年,深圳给了我们包容和耐心投入,这座城市正在率先打开人类通向低空时代的新篇章。
谢谢大家!明年再见。
本文来源:IPO早知道
来源:IPO早知道
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】