四轮驱动破局落地瓶颈,智元构建具身智能 “飞轮体系”。
本文为IPO早知道原创
作者|Stone Jin
据IPO早知道消息,由智元机器人主办,以“全球视角下的具身智能新机遇”为主题的“智启具身论坛”于7月27日在上海世博展览馆举行。
在本次论坛上,智元机器人合伙人&具身业务部总裁姚卯青以《通向具身智能大规模突破之路——智元的本体,数据,算法飞轮》为主题分享。
据姚卯青介绍,智元打通了机器人本体、运动智能、交互智能、作业智能,实现“一体三智”全栈闭环发展,并构建“数据-模型-本体-场景”四轮驱动的具身智能飞轮体系。每一次"数据-模型-本体-场景"飞轮的转动,都让具身智能赋能千行百业更进一步。
目前,智元通过自建专业数采工厂,形成全球最大数据集AgiBot World并开源,姚卯青说:“面对具身智能数据的荒漠,我们选择栽下第一棵树,愿其能成为一片森林”;同时,智元还发布行业首个通用具身基座模型——启元大模型,拥有“一脑多形”能力,可适配其他异构机器人本体,正如姚卯青所言:“当大模型赋予机器人智慧与灵魂,物理智能涌现的命运齿轮就开始转动”。
此外,在场景端,智元机器人凭借“机器人+具身模型”技术重构了智能生产力范式,现已在工业制造、仓储物流、电力巡检、交互引导四大场景实现突破性落地。
“世界模型让一部分机器人先想象起来,不是在梦中数电子羊,而是可以预见未来”。论坛上,姚卯青高度评价了世界模型的价值,并代表智元机器人发布了行业首个真正面向真实世界双臂机器人的世界模型开源平台“Genie Envisioner”(以下简称 GE)。该平台融合了预测、控制、评测三大核心能力,为机器人从“看见”到“行动”提供了端到端、一体化的解决方案,让机器人在数字时空里先彩排、再上岗。
GE平台的核心,多视角视频扩散模型GE-Base以AgiBot-World-Beta数据集为基础,利用超过100万条、近3000小时的头部与双臂腕同步视频流,捕捉机器人操作任务中的空间布局、动作演化与语义意图。160M参数级别的动作解码器GE-Act,可以帮助机器人完成从视觉感知到机器人动作执行的跨模态迁移。
从“固定轨迹”到“自主决策”,智元把柔性产线写进机器人大脑。在真实平台验证中,搭载GE-Act的机器人先后完成“做三明治”“倒茶”“擦桌面”“使用微波炉加热”“流水线装箱”等五项任务,各项成功率均远超行业平均值,展示了前所未有的精度与鲁棒性。
Genie Envisioner的发布,标志着机器人从被动执行向主动“想象—验证—行动”的转变。未来,将扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。
此外,姚卯青预告,精灵系列下一代机器人本体精灵 G2 即将发布,相较于上一代,G2在运动精度、场景适配性上全面升级,具备原生数采能力,可胜任工业、商业、家庭等多元场景,进一步拓宽具身智能的应用边界。
本文来源:IPO早知道
来源:IPO早知道
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】