天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

蚂蚁灵波科技开源LingBot-Depth模型,为智能终端三维视觉感知带来新突破

2026-01-28来源:快讯编辑:瑞雪

蚂蚁集团旗下具身智能公司灵波科技近日宣布开源高精度空间感知模型LingBot-Depth,标志着三维视觉技术领域迎来突破性进展。该模型基于奥比中光Gemini 330系列双目3D相机的原始数据开发,通过融合光学传感与深度学习技术,显著提升了智能终端在复杂环境中的三维空间理解能力,为机器人、自动驾驶等领域提供更精准的视觉解决方案。

在权威基准测试中,LingBot-Depth展现出显著优势。NYUv2室内场景测试显示,其相对误差(REL)较主流模型PromptDA与PriorDA降低超70%;ETH3D稀疏SfM任务中,RMSE误差减少约47%,刷新行业精度纪录。这一成果源于灵波科技研发的"掩码深度建模"(MDM)技术,该技术通过整合RGB图像的纹理、轮廓及环境上下文信息,可智能补全透明玻璃、反光镜面等材质导致的深度数据缺失,输出边缘清晰的三维深度图。

实验数据显示,搭载LingBot-Depth的奥比中光Gemini 330系列相机,在强逆光、复杂曲面等极端光学场景下,深度图完整性较业界领先的ZED Stereo Depth相机提升显著。其输出的三维图像不仅平滑无噪点,物体轮廓边缘锐利度更达到消费级设备新高度。这意味着现有硬件无需升级,即可通过软件优化实现对高反光、透明物体的精准感知。

支撑模型性能的核心是灵波科技构建的千万级真实场景数据库。研发团队采集近1000万份原始样本,筛选出200万组高价值深度配对数据用于训练,同时整合100万组仿真数据增强模型泛化能力。这套包含200万真实世界深度数据和100万仿真数据的核心资产将随模型同步开源,为全球开发者攻克复杂场景空间感知难题提供关键资源。

据透露,奥比中光已与灵波科技达成战略合作,计划基于LingBot-Depth技术推出新一代深度相机产品。本周内,灵波科技还将陆续开源多款具身智能领域的基础模型,持续推动三维视觉技术的开源生态建设。

AI产业新篇章:大模型竞争转向,智能体时代正式拉开帷幕
答:普通大模型是“你问它答”,智能体是“你说目标,它拆解步骤、调用工具、自主执行”。 -AI行业从大模型军备竞赛转向智能体时代,边际收益递减是核心驱动力 - 智能体=大模型+工具调用+自主决策,不是升…

2026-06-18

高科技设备中的隐形挑战:PCB振动如何影响传感器性能与解决方案
设计师可以比较不同噪声抑制产品和元器件在PCB上布局的效果。 PCB上的振动会导致不必要的噪声和元器件之间的干扰。理解PCB振动需要一种综合的物理学方法,将电磁、结构和振动声学仿真方法集成到电子设计自动化(E…

2026-06-18