天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

马斯克Grok 4.2测试版上线!4大Agent协作,解锁至尊版享16个“智囊”

2026-02-18来源:天脉网编辑:瑞雪

马斯克旗下xAI公司推出的最新大模型Grok 4.2测试版,自上线以来引发科技圈热议。这款模型不仅在参数规模上达到500亿级别,更通过多智能体协作架构实现推理能力的突破性升级。根据开发者披露的信息,该系统由四个专业Agent组成核心团队,分别负责策略制定、实时搜索、严谨计算和创意优化,在应对复杂任务时展现出独特优势。

在加密货币交易场景中,Grok 4.2测试版展现出惊人的实战能力。Alpha Arena竞赛数据显示,该模型在初始资金1万美元的条件下,通过自主决策实现3084美元净收益,最终权益达13459美元。这种优异表现得益于其与X平台的深度数据集成,能够实时处理每日6800万条英文推文,将市场情绪转化为毫秒级价格信号。工程师透露,解锁SuperGrok Heavy服务后,系统可调用16个智能体协同工作,但每月300美元的订阅费用引发市场讨论。

实际测试显示,该模型在处理逻辑陷阱问题时呈现鲜明个性。当被问及"洗车场离家100米该步行还是开车"时,系统不仅给出实用建议,还以幽默口吻吐槽提问方式。面对"父母结婚未邀请我"的经典难题,模型先以笑声化解尴尬,随即从时间逻辑角度给出合理解释,并提供多种亲子互动方案。不过在视觉识别测试中,系统将七边形误判为六边形,暴露出基础几何能力的不足。

编程能力测试带来意外惊喜。在生成Java塔防游戏的挑战中,系统仅用17秒就完成可运行代码,实现炮塔放置、怪物移动和攻击判定等核心功能。开发者社区涌现出更多创新案例:有人用41秒构建出赛博朋克风格的贪吃蛇游戏,另有开发者在单个HTML文件中创建出包含数百个发光粒子的人工生命模拟器。这些成果展示出模型在快速原型开发领域的巨大潜力。

多智能体协作架构的创新性在复杂任务处理中尤为突出。当用户提出设计全新通用人工智能架构的挑战时,四个Agent通过多轮辩论验证,最终提出HELIX-AEGIS双螺旋架构方案。这种能力与安全协同进化的设计理念,展现出系统处理前沿科技问题的独特思路。不过也有用户反馈,在生成骑自行车的鹈鹕SVG代码时,系统未能准确把握物理比例,反映出创意可视化领域的改进空间。

目前网页端和移动端均已开放测试,但使用频率受限——普通用户提问7次后需等待4小时刷新额度。这种限制策略既保证服务质量,也为系统优化留出调整空间。随着中型和大型版本的陆续推出,Grok系列模型在实时信息处理和多维度分析领域的表现值得持续关注。

苹果加速布局AI可穿戴领域,智能眼镜等多款新品或2026年起陆续登场
IT之家 2 月 18 日消息,据彭博社报道,苹果正在加速研发三款 AI 可穿戴设备,包括 AI 智能眼镜、AI 穿戴式胸针 / 吊坠,以及AI 版 AirPods。 尽管 Siri 相关功能有所延期,Ap…

2026-02-18