天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

马斯克Grok 3模型问世,能否超越DeepSeek成AI新霸主?

2025-02-19来源:天脉网编辑:瑞雪

在人工智能领域,一场前所未有的竞赛正在激烈上演。就在近日,备受瞩目的“地球上最聪明的人工智能”——Grok 3,终于由特斯拉创始人马斯克携手xAI团队正式发布。

这场发布会,一如既往地秉承了马斯克的风格,虽然预告十二点准时开始,但最终还是让等待的观众多等了近二十分钟。然而,当发布会正式拉开帷幕,近一个小时的直播内容瞬间点燃了整个AI界。

马斯克携xAI天团,全方位展示了Grok 3的强大实力。据官方数据,Grok 3在多项测试中均超越了谷歌、OpenAI和DeepSeek等明星公司的招牌模型,引发了业内外的广泛关注。

国内外关于Grok 3的报道铺天盖地,“首个突破1400分(模型在Imarena.ai竞技场的得分)的模型”、“首个十万卡集群训练出来的模型”等头衔让人眼前一亮。在知危编辑部看来,Grok 3虽不至于“炸裂”,但至少从直播内容来看,它再次延续了AI领域“大力出奇迹”的神话。

目前,Grok 3仅对部分X的Premium+会员开放。马斯克在发布会上,将Grok与GPT的模型迭代速度进行了对比,针对性十足。他强调,Grok 3实际上是一个模型家族,包括非推理模型和推理模型两种。

在非推理模型方面,Grok 3和Grok 3 mini在AIME’24美国数学竞赛、GPQA(研究生水平科学知识问答能力的基准测试)和代码三项测试中,成绩远超其他模型。而mini版本则可以通过牺牲一定程度的准确性,来换取更快的回答速度。在Chatbot Arena的盲测中,Grok 3的早期版本“巧克力”更是以史无前例的1400分登顶,整体风格控制、编码、数学和创意写作等多个方面均获第一。

在推理模型方面,Grok 3 Reasoning Beta和Grok 3 mini Reasoning同样表现出色。尽管在测试中,如果不算上加时赛(即给模型更多思考时间),Grok 3的推理模型与其他模型的差距并不明显,但一旦加上时长,其优势便立即显现。这似乎说明,Grok 3的推理能力可以随着时间线性增长,具有巨大的成长空间。

现场演示中,马斯克团队展示了Grok 3推理模型在2025年AIME数学竞赛上的测试结果,并直接让Grok 3生成3D动画代码和结合俄罗斯方块与宝石迷阵的新游戏。这不仅让人联想到马斯克此前实锤的xAI将成立AI游戏工作室的消息,更预示着Grok 3在游戏制作方面的巨大潜力。

马斯克还透露,Grok 3在未来的两到三年内,可能参与到特斯拉的生产和火箭发射过程中。同时,基于Grok 3构建的Deepsearch智能搜索引擎也正式发布,为用户提供了更加智能、高效的搜索体验。

中坚科技割草机器人H3 Pro登陆Kickstarter:低价、贴边、交付稳成三大爆点
放在当下的海外庭院机器人市场里,这次动作之所以值得关注,不只是因为它“又发了一台新机”,而是因为它把三个最容易被用户感知、也最容易形成传播的点,几乎同时摆上了台面:599美元,主打贴边修剪的割草机器人,交付能…

2026-04-04

MOVA硅谷新品亮相:AI眼镜双剑合璧,引领智慧生活新交互浪潮
MOVA AI智慧生活业务于美国硅谷举办新品发布会,正式推出曜目G2AI眼镜与ARS8AR眼镜,以轻量化、常态化佩戴设计,推动AI从工具化调用转向场景化伴随,重构人与信息的交互方式。 MOVA将两款眼镜定…

2026-04-04