天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

苹果发布三项AI新研究 持续深耕空间计算与Vision Pro头显领域

2026-05-12来源:快讯编辑:瑞雪

科技媒体近日披露,苹果公司正通过一系列前沿研究深化空间计算领域布局,三篇最新公开的论文显示其仍在持续投入Vision Pro头显相关技术研发。尽管此前有报道称苹果内部暂停了新款Vision Pro的开发,转而聚焦Siri与AI智能眼镜项目,但新研究成果表明该公司并未放弃这一战略方向。

在机器学习领域,苹果团队开发了名为SFI-Bench的测试框架,用于评估多模态大模型的空间功能理解能力。该基准包含134段室内场景扫描视频,并设计了1555个专家标注问题。与传统测试不同,SFI-Bench不仅要求模型识别物体及其位置,还需回答"如何使用""故障处理"等复杂问题。例如测试场景中,模型需要从柜子中找出同品牌数量最多的瓶子,或理解如何取消洗衣机当前程序。实验结果显示,Google Gemini 3.1 Pro在综合评分中领先,但所有模型在"带条件的全局计数"任务中表现欠佳,空间记忆与功能知识整合能力仍有待提升。

另一项研究聚焦美国手语(ASL)标注自动化。研究人员构建了包含近500条人工标注的英文字词-术语对应库,并扩展出超过300小时的ASL STEM Wiki数据集和7.5小时的FLEURS-ASL数据。通过手指拼写模型训练,该系统在FSBoard测试中达到6.7%的字符错误率(CER),在ASL Citizen数据集上实现74%的top-1准确率。这项技术有望将传统需要数百小时的手工标注工作大幅简化。

第三项研究突破在于3D头部重建技术。苹果提出的HeadsUp方法利用层级建模技术,通过多视角图像采集重建高精度3D高斯头部模型。测试采用包含超万名受试者的内部数据集,其规模较现有同类数据集提升一个数量级。这项技术或与Vision Pro的Persona功能及visionOS系统中的面部捕捉技术存在关联,可能为虚拟化身创建提供更自然的表情渲染方案。

苹果全球营销高级副总裁格雷格·乔斯维亚克曾公开表示,Vision Pro代表了数字与物理世界融合的必然趋势。虽然他拒绝预测"空间计算"成为主流的具体时间表,但强调这一技术发展方向具有不可逆转性。三篇论文的集中发布,恰逢苹果被传调整头显研发策略之际,显示出该公司在空间计算领域的持续技术积累。

谷歌Android XR智能眼镜2026年或售200万台,Gemini助力能否跻身销量前列?
即便如此,谷歌智能眼镜市场占比预计仅为整体销量的五分之一。 IT之家注意到,该分析机构预测,2026 年全球智能眼镜总出货量将高达 1500万台。 目前市面带内置显示屏的人工智能眼镜款式有限,报告指出,20…

2026-05-22

用友YonClaw获权威认证:以安全为基,开启企业级超级智能体数智化新篇
随着大模型技术与自动化能力的快速发展,Claw类智能体在企业业务处理、流程推进及系统联动等场景中应用日益广泛并发挥重要作用,但随之而来的潜在安全风险也开始显现。 中国信通院“企业级类Claw智能体安全能力评…

2026-05-22