天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

Grok 4实测:马斯克最贵AI能力几何?网友直呼“2万块不值”

2025-07-11来源:天脉网编辑:瑞雪

在人工智能领域,新星的崛起总是伴随着无尽的期待与争议。近期,马斯克力捧的Grok 4模型正式登场,一时间,关于其是否真能问鼎“地球上最聪明的AI”的讨论沸沸扬扬。

尽管Grok系列模型在跑分上从未落于下风,但用户体验上的表现却时常令人诟病。此次Grok 4发布24小时后,网友们纷纷晒出了自己的实测案例,让我们一窥其真实实力。

在编程领域,Grok 4的表现可谓喜忧参半。博主@mckaywrigley让其用three.js创建一个动画,Grok 4不仅成功完成任务,还主动调用3D模型资源,展现了在three.js和Blender等领域的显著升级。然而,在UI设计方面,Grok 4依旧短板明显,网友戏称其“不是最好的设计师”。

博主@tetsuoai则直接将Grok 4拉入“职场”,扮演一名有15年经验的C语言老程序员,要求其编写一个CLI工具来分类整理文件夹里的文件。Grok 4的表现令人惊喜,代码严谨且专业,连大小写转换都使用了ctype.h标准库。

但在另一些测试中,Grok 4也暴露出了不少问题。博主@karminski3的经典测试项目——20个小球在七边形中弹跳的三维物理测试,Grok 4三次尝试中有两次出现语法错误,唯一成功的一次也仅算“勉强可用”。

在写作方面,Grok 4的表现同样毁誉参半。其在192k上下文窗口中的表现仅次于Gemini,但在短篇小说创意写作上,虽然能产出结构清晰的故事,但情节套路化、结尾寡淡,语言过于炫技。

在SVG图像生成测试中,Grok 4的表现也各有千秋。在还原线条漫画为纯SVG的任务中,Grok 4表现拔尖,人物动作自然。但在绘制Radiohead的《In Rainbows》封面时,构图稍显单薄,层次感不足。

尽管Grok 4在三维生成、逻辑建模等方面展现出不俗实力,但在UI设计、图像理解等基础任务上仍有待提升。不少网友直呼“2万块就这”,质疑其性价比。然而,正如微软CEO纳德拉所言,许多大模型正陷入“Benchmark Hacking”的陷阱,专注于刷分而非解决实际问题。Grok 4或许并非完美无缺,但只要它仍是话题度最高的AI,总有人愿意为其买单。

中坚科技割草机器人H3 Pro登陆Kickstarter:低价、贴边、交付稳成三大爆点
放在当下的海外庭院机器人市场里,这次动作之所以值得关注,不只是因为它“又发了一台新机”,而是因为它把三个最容易被用户感知、也最容易形成传播的点,几乎同时摆上了台面:599美元,主打贴边修剪的割草机器人,交付能…

2026-04-04

MOVA硅谷新品亮相:AI眼镜双剑合璧,引领智慧生活新交互浪潮
MOVA AI智慧生活业务于美国硅谷举办新品发布会,正式推出曜目G2AI眼镜与ARS8AR眼镜,以轻量化、常态化佩戴设计,推动AI从工具化调用转向场景化伴随,重构人与信息的交互方式。 MOVA将两款眼镜定…

2026-04-04