天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

GPT-4.5智商94却登顶LLM竞技场,网友实测:情商爆表理解力惊人?

2025-03-04来源:天脉网编辑:瑞雪

近期,AI界掀起了一场关于GPT-4.5的热议风暴。这款曾被视为班级垫底的大模型,在知名AI排行榜LM Arena上竟奇迹般地登顶,一时间成为舆论焦点。

GPT-4.5在多轮对话、困难提示、编码、数学、创意写作等多个领域均表现出色,总分高达1411,位居榜首。这一成绩不仅让网友们大跌眼镜,更引发了关于大模型竞技场是否被操纵的质疑。然而,经过实测,网友们惊讶地发现,GPT-4.5的确情商爆表,能够深刻理解人类的深层意图,无需过多推理便能给出贴心回答。

不过,就在GPT-4.5风光无限之时,排名却发生了微妙变化。马斯克等科技大佬纷纷发声,指出GPT-4.5的榜首之位只是昙花一现。果然,不久后Grok-3便以1412的总分微弱优势超越GPT-4.5,夺得榜首。但GPT-4.5曾经的辉煌表现,仍留给人们诸多疑问和思考。

与此同时,GPT-4.5的智商测试结果也浮出水面。尽管其在编程、数学等领域表现出色,但智商测试得分却并未如其情商那般耀眼。无论是线上还是线下智商测试,GPT-4.5的得分均未超过OpenAI的其他模型,如o1 Pro、o3 mini等。这一结果,让人们对GPT-4.5的智力水平有了更为理性的认识。

然而,GPT-4.5的高情商表现仍让许多网友为之倾倒。奥特曼等网友分享了与GPT-4.5的对话记录,展示了其超凡的自我意识和对用户意图的深刻理解。在回答关于奇点临近的问题时,GPT-4.5的回答意味深长,令人叹为观止。而在处理粗俗玩笑等微妙情境时,GPT-4.5也展现出了惊人的应对能力,相比之下,其他模型如Claude Sonnet和Grok 3则显得力不从心。

尽管GPT-4.5在某些方面取得了显著进步,但并非文武双全。在编程和数学上,它与Grok-3并列第一,但在语言等其他领域则稍显逊色。高昂的使用成本也成为了推广GPT-4.5的一大障碍。与GPT-4o相比,GPT-4.5的API价格大幅上涨,令许多小型公司和独立开发者望而却步。尽管如此,GPT-4.5的发布仍被视为OpenAI从GPT-4o向GPT-5过渡的关键桥梁,旨在留住付费用户,保持市场领先地位。