天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

通义实验室开源MAI-UI模型:可跨应用执行复杂任务 提升交互效率

2025-12-29来源:快讯编辑:瑞雪

通义实验室多模态交互团队近日宣布,其研发的通用GUI智能体基座模型MAI-UI正式开源。这一模型专注于屏幕界面理解与操作执行,能够跨应用完成多步骤复杂任务,例如查询车票信息、在通讯群组中同步内容,或调整会议安排等日常高频场景。

据团队介绍,MAI-UI的核心优势在于其主动交互能力。当用户指令模糊时,模型会通过提问澄清需求,避免因理解偏差导致任务失败。模型支持调用结构化工具,例如地图搜索或路线规划API,直接替代繁琐的界面点击操作,显著提升任务执行效率与成功率。目前,该模型已推出2B和8B两种参数规模的版本,其中2B与8B版本均已开源,供开发者自由使用。

在性能验证方面,MAI-UI在ScreenSpot-Pro、AndroidWorld等多个GUI理解与任务执行基准测试中表现优异,成绩位居当前领先水平。其应用场景覆盖手机、电脑等主流操作系统,能够适应不同设备的界面交互需求。这一特性使其在跨平台任务自动化领域具有广泛潜力。

开源后,MAI-UI有望推动智能体技术在终端设备上的落地应用。开发者可基于其基座模型,快速构建定制化解决方案,例如自动化办公助手、智能客服系统等。团队表示,未来将持续优化模型性能,并探索更多场景下的交互可能性。

Meta双管齐下:采购芯片保障当下AI业务,自研定制芯片拓展未来布局
【环球网科技综合报道】3月6日消息,据彭博社报道,Meta公司首席财务官苏珊·李近日在摩根士丹利举办的科技会议上透露,公司已与全球顶尖芯片制造商达成重要合作协议,在采购芯片满足当下人工智能业务需求的同时,正…

2026-03-07

小米Xiaomi miclaw启动小范围封测 智能交互新体验即将来袭
据介绍,Xiaomimiclaw是基于小米MiMo大模型构建的AI交互测试产品,它的能力来自四个层次:系统底层能力、个人上下文理解、生态互联、自进化。 官方表示,它能让手机成为AI的工具,在理解你的意图和…

2026-03-07