天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择

2026-04-03来源:快讯编辑:瑞雪

在人工智能领域,能够自主浏览网页并完成任务的智能体正成为研究热点。近日,Allen人工智能研究所(Ai2)推出了名为MolmoWeb的开源视觉网络智能体,这一成果为该领域带来了新的突破。作为Molmo 2模型家族的新成员,MolmoWeb以其独特的技术路径和开源特性引发了广泛关注。

MolmoWeb的最大亮点在于其开源属性。该模型提供了40亿和80亿参数两种版本,这种轻量化设计使其能够在本地设备上运行,大大降低了使用门槛。与市场上许多依赖专有技术的同类产品不同,Ai2团队选择了完全开放的道路,不仅公开了模型权重,还同步发布了训练数据、代码(即将上线)和评估工具,为研究人员提供了完整的研究框架。

在技术实现上,MolmoWeb采用了与众不同的训练方法。研究团队没有借助专有视觉智能体的知识蒸馏,而是通过两种途径构建训练数据:一是收集了30,000个人类操作轨迹,覆盖1,100多个网站的近600,000个子任务;二是利用可访问性树技术生成合成轨迹。这种组合方式既保证了数据的多样性,又解决了单纯依赖人工标注成本高昂的问题。训练数据中还包含了220多万个问答对,帮助模型理解网页内容。

实际性能测试显示,MolmoWeb在多个基准测试中表现优异。在浏览器操作任务中,它的表现超过了OpenAI的旧版GPT-4o模型,在开放权重模型中更是领先于Fara-7B和GLM-4.1V-9B等竞争对手。尽管与Anthropic、谷歌等公司的专有模型相比仍有差距,但MolmoWeb的开源特性使其成为研究社区的重要参考。

Ai2团队强调,他们的目标不是与商业巨头竞争,而是为学术界提供可复现的研究基础。当前网络智能体领域面临的一个关键问题是缺乏公开资源,这限制了研究的透明度和进展速度。MolmoWeb的发布,包括其庞大的训练数据集(包含带注释的网页截图和操作轨迹),为解决这一问题提供了重要资源。

目前,MolmoWeb的相关资源已在Hugging Face和GitHub平台开放下载。研究人员可以获取完整的模型架构、训练数据集以及评估工具包,这为深入理解网络智能体的工作原理和改进方向提供了宝贵机会。随着更多研究者基于这一开源框架开展工作,网络智能体技术有望迎来新的发展阶段。

阿里云携手近百家伙伴启动“超级智能体计划” 赋能金融行业智能化升级
阿里云及伙伴服务了大量金融客户,从飞轮阶段积累的数据治理、模型调优经验,到信贷、理赔、投研等领域沉淀的行业skill,逐步形成了可复用的解决方案包。 阿里云智能集团资深副总裁、公共云事业部总裁刘伟光:“千问大…

2026-04-03

AI生成内容频现“幻觉” 开发者担责边界何在?法律这样界定
杭州互联网法院跨境贸易法庭庭长肖芄认为,AI生成的不准确信息本身并不构成侵权,需要考查的是提供服务的开发者是否存在过错。 肖芄表示,如何认定生成式人工智能的侵权责任,是一个少有成例的司法前沿问题,希望通…

2026-04-03

火山引擎开放Seedance 2.0:日均120万亿Token背后,AI价值付费时代来了?
这不,4月2日,雷科技(ID:leitech)收到了字节的活动邀请,还没等小雷反应过来,我人又在武汉光谷的希尔顿酒店坐着,跑来参加他们今年第一次AI创新巡展了。 要知道,最近整个科技圈都在争论一个话题,面对…

2026-04-03