尤其适用于机器人导航、自动驾驶等需要实时语义解析的空间智能场景。
本文为IPO早知道原创
作者|Stone Jin
据IPO早知道消息,特斯联首席科学家、特斯联国际总裁邵岭博士及其合作团队日前发布最新研究成果,提出了一种名为Laser的高效语言引导分割框架,为3D场景理解提供了轻量化、高精度的开放词汇分割方案,推动了语言模型与神经辐射场融合的实用化进程。该框架尤其适用于机器人导航、自动驾驶等需要实时语义解析的空间智能场景,现已被人工智能领域权威学术期刊IEEE T-PAMI (CCF-A,IF 23.6)收录。
这一研究成果在多个现实场景中具备重要的应用价值,特别是在需要高精度、高效率3D场景语义理解的领域。譬如:
在自动驾驶与机器人导航:
自动驾驶车辆和移动机器人需要实时理解周围环境的3D结构与语义信息(如道路、行人、障碍物),以实现安全导航和决策。Laser的训练时间仅需11分钟(传统方法需158分钟),可快速构建3D语义地图。同时,低秩注意力机制能精准识别道路边缘、车道线等细粒度特征,避免模糊边界导致的误判。
在增强现实(AR)与虚拟现实(VR)领域:
AR/VR应用需将虚拟物体精准叠加到真实场景中,要求对3D空间语义有深刻理解。该方案能够确保虚拟物体在不同视角下与真实场景的标注(如墙面、桌面)对齐,避免视觉穿帮;同时能够区分相似颜色物体(如黑白键盘与黑色鼠标垫),提升虚拟物体放置的合理性。通过与3D高斯渲染技术(如3D-GS)相结合,该方案还能够实现实时语义AR效果。
在城市规划与建筑建模领域:
在城市数字化建模中,需对建筑物、植被、公共设施进行语义标注,辅助规划决策。该研究成果支持对罕见物体(如古建筑装饰、特殊标牌)的开放词汇分割,丰富数据标注的覆盖范围;此外,基于Laser, 无需人工标注3D数据,通过多视图图像即可生成带语义的3D模型。
本文来源:IPO早知道
来源:IPO早知道
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】