天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

Grok 4跑分曝光,马斯克新宠在“人类最后考试”中斩获45%高分!

2025-07-05来源:天脉网编辑:瑞雪

标题:马斯克揭秘Grok 4:以“第一性原理”重塑LLM格局,跑分震惊业界

近日,AI界迎来了一场震撼人心的消息泄露——备受瞩目的Grok 4模型在“人类最后考试”(HLF)中取得了高达45%的惊人得分,这一成绩远超当前顶尖模型如Gemini与Claude,预示着AI领域即将迎来重大变革。

据知情人士透露,Grok 4的卓越表现得益于其独特的推理机制,该机制基于“第一性原理”构建,这一理念由特斯拉创始人马斯克亲自提出。马斯克曾在多个场合强调,Grok 4将不再拘泥于传统的AI训练方法,而是像物理学家一样,从最基本、最核心的公理出发,进行深度推理与分析。

此次泄露的跑分数据不仅证实了马斯克的预言,还进一步展示了Grok 4在多个关键基准评测上的全面领先。在GPQA(研究生级物理和天文学问题)、AIME 25(2025美国数学邀请赛)以及SWE-bench(真实软件工程问题)等评测中,Grok 4均取得了远超竞争对手的优异成绩。

尤为引人注目的是,在被誉为“AI基准测试领域最难关卡”的HLF考试中,Grok 4以默认35%、最高45%的得分,将现任榜首Gemini 2.5 Pro远远甩在身后,其得分甚至达到了Gemini的两倍之多。这一成绩无疑是对Grok 4强大世界知识掌握能力的最佳证明。

面对如此耀眼的成绩,网友们纷纷表示期待Grok 4的正式发布。有网友甚至调侃道:“Grok 4源代码泄露了吗?我们已经迫不及待想要体验这款万能模型了!”而马斯克也不负众望,多次在社交媒体上透露Grok 4的研发进展,并表示将在近期内发布这一革命性产品。

Grok 4不仅在自然语言处理、数学推理等领域展现出无与伦比的性能,其编码能力同样令人瞩目。马斯克特别强调了Grok 4在编码方面的突破,这一举措无疑是对当前AI编码能力竞争趋势的积极响应。

然而,尽管Grok 4的跑分数据令人振奋,但仍有部分网友持谨慎态度。他们担心此次泄露的数据可能经过“针对性训练”,从而影响了评测结果的公正性。不过,这些质疑并未能阻挡Grok 4成为业界关注的焦点。

随着Grok 4发布日期的临近,AI界正翘首以待这款革命性产品的正式亮相。马斯克能否以Grok 4改写LLM格局,让我们拭目以待。

2026智能电销机器人选型指南:标杆企业能力解析与场景适配全对比
上海言通科技的电销机器人可覆盖全部主流场景,针对不同行业的专属需求提供定制化话术与解决方案,比如在保险金融行业可实现合规电销的全流程支撑,在教培行业可高效完成线索初筛与意向分类;北京智齿科技的电销机器人在产品…

2026-04-11

中科智云SIEA-CORE发布:工业装备“智慧觉醒”,开启自主智能新篇章
东方网记者程琦4月11日报道:重型塔吊能像熟练工一样精准避障,港口装卸船机实现24小时无人化干预……这些曾经科幻的场景,正随着工业具身智能技术的突破变为现实。中科智云将继续深耕工业场景,推动更多大国重器实现自…

2026-04-11

龙胜龙城新材料科技获滑石洗选机刮料装置专利 高效拦截杂石有新招
国家知识产权局信息显示,龙胜县龙城新材料科技有限公司取得一项名为“一种滑石洗选机用刮料装置”的专利,授权公告号CN224100897U,申请日期为2025年2月。企业注册资本100万人民币。 声明:市场有风险…

2026-04-11

浙江天台九川新材料获前端模块冷却器水室专利 优化散热提升能量交换
国家知识产权局信息显示,浙江天台九川新材料股份有限公司取得一项名为“一种便于散热的前端模块冷却器水室”的专利,授权公告号CN224108681U,申请日期为2025年3月。 专利摘要显示,本实用新型公开了一种…

2026-04-11

重庆江津:大载重无人机“上岗” 电力跨江放线安全高效双提升
4月11日下午,在位于重庆市江津区珞璜镇的新玉500千伏输变电工程(线路部分)跨长江放线作业现场,国网重庆电力的工作人员使用大载重无人机搭载四段投掷器,牵拉导引绳顺利跨越长江。 4月11日,在重庆市江津区珞璜…

2026-04-11

元宇宙平台公司Muse Spark模型亮相:强化多模态感知,新功能即将全球铺开
新华社旧金山4月8日电(记者吴晓凌)美国元宇宙平台公司8日宣布推出新一代人工智能模型Muse Spark,称这是其“超级智能实验室”推出的首个模型,也是该公司目前功能最强的模型,现已为该公司旗下的人工智能应用…

2026-04-11