天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

马斯克Grok4挑战AI极限,竞赛节奏全面加速!

2025-07-10来源:天脉网编辑:瑞雪

马斯克亲自站台,xAI旗舰大模型Grok 4惊艳亮相

尽管面容略显疲惫,但马斯克依然亲自坐镇,为其旗下AI公司xAI的最新旗舰大模型Grok 4造势。他豪言壮语,将Grok 4誉为“宇宙最强模型”,甚至声称其智慧已超越所有领域的人类博士。

在马斯克的推崇下,Grok 4的表现也不负众望。在被誉为“人类最后的考试”中,Grok 4以38.6%的准确率脱颖而出,远超谷歌Gemini 2.5 Pro和OpenAI o3。多智能体版本Grok 4 Heavy更是达到了44.4%的准确率,若借助工具辅助,准确率可攀升至50.7%。

Grok 4的卓越表现背后,是xAI耗资巨大、历时6个月搭建的10万块H100 GPU超级算力中心。Grok 4的训练量是Grok 3的10倍,Grok 2的100倍,这种“暴力计算美学”让Grok 4在多个高难度基准测试中表现出色。

马斯克在直播中详细介绍了Grok 4的能力,强调其在人文、数学、物理、工程等学科均达到博士以上水平。在“人类最后的考试”中,Grok 4展现了强大的推理能力,减少对现有知识框架的依赖。在GPQA、美国数学邀请赛以及ARC-AGI-2测试中,Grok 4也取得了优异成绩。

除了学术上的卓越表现,Grok 4在商业场景的落地验证方面同样不俗。在名为Vending-Bench的商业模拟任务中,Grok 4经营自动售货机时平均净资产达到4684.15美元,是第二名的两倍,证明了其长期规划和多步骤推理能力。

Grok 4的创新点在于“工具原生融合”架构。与多数模型后期接入工具不同,Grok 4在训练阶段就嵌入了搜索、代码执行等工具,使其能够灵活调用资源解决复杂问题。例如,在直播演示中,Grok 4通过检索学术论文、调用模拟工具,成功生成了黑洞碰撞的可视化动态模型。

然而,尽管Grok 4表现出色,但业内人士认为其在代码、多模态、图像和视频生成等方面仍有进步空间。不过,这并未影响马斯克对Grok 4的信心。他透露,今年Grok 4还将融合有限元分析、流体动力学等工具,构建高精度物理模拟器,并通过Optimus人形机器人连接现实,让AI接受物理定律的最终检验。

马斯克还宣布了xAI的订阅计划。Super Grok Heavy月费高达300美元,较OpenAI顶级订阅贵50%。API定价同样激进,每百万token输入3美元、输出15美元。高定价背后是训练成本的陡增,但马斯克表示,模型能力已逼近当前测试极限。

马斯克所布局的自动驾驶、AI大模型、人形机器人、商业航天正逐渐形成闭环。Grok大模型作为“大脑”,驱动特斯拉自动驾驶和Optimus机器人行动决策;特斯拉车辆与机器人反馈的真实场景数据则反哺模型迭代。同时,SpaceX星链提供全球低延迟通信,支撑实时AI交互。

然而,高调背后也暗藏风险。近期,Grok因发表不当言论而遭到封禁和投诉,迫使xAI紧急调整审核策略。在追求AI真理的路上,如何在开放性与安全性间平衡,成为马斯克等AI领域领导者必须面对的问题。

在直播中,马斯克表示:“安全是最重要的事,我们需要确保AI是一个好AI。就像超级天才的孩子,它最终会比你聪明,但我们仍然要灌输正确的价值观。”

AI赋能视觉创作:一键生成时尚大片,效率与创意双飞跃的工作站来啦
今天的成果让我激动,终于用AI工具做成了一个比较实用的系统,话不多说,直接上图: 给它一张参考图片,选择不同的场景、图片比例、图片分辨率和你想要的效果提示词,它就能给你时尚大片,这个系统对于很多需要做图片的应…

2026-04-07

LV-H150微米电子水平仪怎么选?苏州零零零传感科技助力精密制造与科研
基于行业白皮书与市场调研数据,评估维度可聚焦产品精度、稳定性、软件协同能力及行业适配经验,权重建议分别占35%、25%、20%、20%,关键验证指标包括分辨率、温度补偿功能、软件算法模型多样性及典型客户案例数…

2026-04-07

河南郑州街头现人形机器人“店员” 智能售卖引市民围观体验
4月6日,河南郑州,街头出现人形机器人“店员”,为顾客提供智能售卖服务。图为机器人“店员”吸引市民驻足观看。 中新社记者 范晓恒 摄 4月6日,河南郑州,街头出现人形机器人“店员”,为顾客提供智能售卖服务。…

2026-04-07

传统平面广告困局待解:拥抱AI转型品牌创意官,方能赢得甲方青睐
AI从未想过取代创意,而是为创意赋予更高效的落地方式,传统平面广告从业者的核心转型方向,就是成为AI品牌创意官——以人文创意为核心,以AI技术为工具,实现“人脑洞察+AI落地”的全新创意模式。对于传统平面广…

2026-04-07