近日,一款名为Optimus Alpha的神秘模型在OpenRouter大模型聚合平台上横空出世,迅速引发了广泛关注。这款模型自上线以来,仅用三天时间便处理了惊人的772亿个Token,日均处理量超过200亿,并且这一数字仍在持续攀升。截至目前,其日Token处理量已突破340亿,位居第二,并在Trending榜单上独占鳌头。
Optimus Alpha的表现令人瞩目。有网友尝试使用它挑战MC-Bench,生成《我的世界》风格的场景,并将其与4o-mini进行对比,结果Optimus Alpha的表现明显更胜一筹。还有人在编程方面对Optimus Alpha进行了系统测试,发现它在Ruby语言上的表现尤为出色,被誉为当前最好的模型之一。
Optimus Alpha不仅支持百万上下文窗口,最大输出位达32K,而且响应速度极快,首个Token延迟中位数仅为0.81秒,输出速度中位数为每秒24.8个Token。这款模型主要面向现实世界中的任务,特别是在编程方面有着卓越的表现。有博主尝试让它设计一个带购物车功能的电商网站,结果Optimus Alpha不仅设计出了合理的UI界面,而且购物车功能也能正常工作,跨文件操作也毫无问题。它还能编写出功能完善的贪吃蛇游戏,并加入了蛇头部颜色变化、蛇身颜色渐变等巧妙设计。
在各项性能测试中,Optimus Alpha同样表现出色。其Elo分数为1338,在榜单中排名第二,仅次于Claude 3.7 Sonnet,领先于DeepSeek-R1以及疑似其前身的Quasar Alpha。特别是在SQL数据库查询任务上,Optimus Alpha取得了最高的平均成绩。在Aider榜单上,它的编程能力与Quasar Alpha、Grok 3和中号o3-mini接近,略胜GPT-4.5-preview一筹。在创意写作方面,Optimus Alpha也表现出色,Elo分数排名第四,仅次于DeepSeek-V3。
关于Optimus Alpha的真实身份,引发了广泛猜测。有网友直接让模型自己交代,结果Optimus Alpha毫不犹豫地称自己是ChatGPT,并声称基于GPT-4,知识截止时间为2024年6月。还有网友根据Optimus这个名字联想到特斯拉的擎天柱机器人,认为神秘模型来自马斯克。然而,也有人认为这是奥特曼的障眼法。更有说服力的证据来自已经下线的Quasar Alpha,有网友发现其拒绝方式与OpenAI非常相似,并且存在与GPT-4o同款的Tokenizer bug。AI研究员Sam Paech通过信息学方法试图建立模型之间的关联,发现Quasar Alpha与OpenAI的模型极为相近,特别是GPT-4.5-preview。奥特曼也在推文中暗示了Quasar Alpha的身份。而Optimus Alpha同样存在ChatGPT和Quasar Alpha中的同款bug,进一步证实了其与OpenAI的关联。