马斯克Grok 3模型问世，能否超越DeepSeek成AI新霸主？-天脉财经

在人工智能领域，一场前所未有的竞赛正在激烈上演。就在近日，备受瞩目的“地球上最聪明的人工智能”——Grok 3，终于由特斯拉创始人马斯克携手xAI团队正式发布。

这场发布会，一如既往地秉承了马斯克的风格，虽然预告十二点准时开始，但最终还是让等待的观众多等了近二十分钟。然而，当发布会正式拉开帷幕，近一个小时的直播内容瞬间点燃了整个AI界。

马斯克携xAI天团，全方位展示了Grok 3的强大实力。据官方数据，Grok 3在多项测试中均超越了谷歌、OpenAI和DeepSeek等明星公司的招牌模型，引发了业内外的广泛关注。

国内外关于Grok 3的报道铺天盖地，“首个突破1400分（模型在Imarena.ai竞技场的得分）的模型”、“首个十万卡集群训练出来的模型”等头衔让人眼前一亮。在知危编辑部看来，Grok 3虽不至于“炸裂”，但至少从直播内容来看，它再次延续了AI领域“大力出奇迹”的神话。

目前，Grok 3仅对部分X的Premium+会员开放。马斯克在发布会上，将Grok与GPT的模型迭代速度进行了对比，针对性十足。他强调，Grok 3实际上是一个模型家族，包括非推理模型和推理模型两种。

在非推理模型方面，Grok 3和Grok 3 mini在AIME’24美国数学竞赛、GPQA（研究生水平科学知识问答能力的基准测试）和代码三项测试中，成绩远超其他模型。而mini版本则可以通过牺牲一定程度的准确性，来换取更快的回答速度。在Chatbot Arena的盲测中，Grok 3的早期版本“巧克力”更是以史无前例的1400分登顶，整体风格控制、编码、数学和创意写作等多个方面均获第一。

在推理模型方面，Grok 3 Reasoning Beta和Grok 3 mini Reasoning同样表现出色。尽管在测试中，如果不算上加时赛（即给模型更多思考时间），Grok 3的推理模型与其他模型的差距并不明显，但一旦加上时长，其优势便立即显现。这似乎说明，Grok 3的推理能力可以随着时间线性增长，具有巨大的成长空间。

现场演示中，马斯克团队展示了Grok 3推理模型在2025年AIME数学竞赛上的测试结果，并直接让Grok 3生成3D动画代码和结合俄罗斯方块与宝石迷阵的新游戏。这不仅让人联想到马斯克此前实锤的xAI将成立AI游戏工作室的消息，更预示着Grok 3在游戏制作方面的巨大潜力。

马斯克还透露，Grok 3在未来的两到三年内，可能参与到特斯拉的生产和火箭发射过程中。同时，基于Grok 3构建的Deepsearch智能搜索引擎也正式发布，为用户提供了更加智能、高效的搜索体验。