天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

GPT-5.2发布引热议:性能表现不一,清北华人团队成幕后关键力量

2025-12-13来源:快讯编辑:瑞雪

OpenAI最新发布的GPT-5.2模型引发了科技圈的广泛关注。这款被寄予厚望的AI系统在基准测试中展现出惊人实力,几乎全面超越了Gemini 3 Pro,尤其在处理电子表格、PPT制作、代码编写与审查等经济价值任务方面表现突出。官方数据显示,该模型在GDPval等专业基准测试中,有70.9%的场景能达到或超越人类专家水平。

然而产品上线初期却出现意外状况。有用户在社交平台X上发帖称,当询问"garlic"中包含多少个字母"R"时,系统错误地返回"0个"的结果。这一现象被指与大语言模型的token化处理机制有关,属于底层技术局限。不过当用户强制切换至Thinking版本后,模型立即给出了正确答案。更有趣的是,部分用户反映模型性能在发布数小时后出现波动,有人调侃"喝完咖啡回来就变笨了",这种异常表现引发了对OpenAI技术策略的猜测。

技术社区的深度测试进一步验证了模型的进步。开发者构建的智能体系统显示,GPT-5.2能无缝调用多种工具且不会迷失方向,其多步骤任务处理能力获得特别称赞。在ARC Prize的评估中,Pro版本(X-High)取得90.5%的SOTA得分,意味着AI效率在一年内提升了近390倍。有用户尝试用ASCII字符描绘内心世界,模型生成的复杂图案令人震撼。

这款现象级产品的背后,活跃着多位华人科学家的身影。最早预告该模型的OpenAI研究员Yu Bai本科就读于北京大学数学系,后在斯坦福取得统计学博士学位;负责后训练的Yun Dai拥有清华大学本科和加州大学尔湾分校计算机硕士学位;推理模型团队成员Zuxin Liu则毕业于北京航空航天大学,并在卡内基梅隆大学完成硕博学业。这些技术精英的贡献,为OpenAI在AI竞赛中保持领先提供了重要支撑。

OpenAI 4人小队28天打造安卓版Sora,Codex助力85%代码自动生成
IT之家在此援引博文,回到 10 月,Sora iOS 版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时OpenAI 内部只有安卓端 Sora 的原型版本,因此这项开发任务可…

2025-12-13

从“笨拙”到“灵巧”:看年轻人如何助力机器人“进化”成长
更让小郑有收获的是,她觉得在陪伴、训练机器人的过程中,自己也在飞速成长。“去年,我们还主要在探索通过视觉和文本的判断来调用不同模型,构建一个‘大脑控制小脑’的简易系统;而到了今年,我们已经能够在多种异构机器…

2025-12-13

宇树智元争春晚赞助席位?智元否认,两大机器人巨头资本动作引关注
智元机器人率先开价6000万元,而宇树科技直接将报价拉升至1亿元。宇树方面暂无公开表态。今年11月15日,宇树科技披露IPO辅导工作完成报告。 公开资料显示,宇树科技是一家专注于消费级、行业级高性能四足机器人…

2025-12-13