天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

Claude 3.7 Sonnet:全球首个混合推理模型,网友盛赞其编程与游戏能力

2025-02-25来源:天脉网编辑:瑞雪

近日,人工智能领域迎来了一项重大突破,Anthropic公司正式推出了其最新的AI模型——Claude 3.7 Sonnet。据官方介绍,该模型不仅是Anthropic迄今为止最智能的版本,还是市场上首个混合推理模型。

Claude 3.7 Sonnet的最大亮点在于其独特的“思考”能力。用户可以根据需求,选择标准模式获得即时响应,或者切换到扩展思考模式,让模型在更长时间内逐步推导答案。这一创新设计让用户能够精确控制模型的思考时长,这在以往是前所未有的。

价格方面,Claude 3.7 Sonnet延续了Anthropic一贯的亲民路线。无论是标准模式还是扩展思考模式,都保持与之前版本相同的定价:每百万输入token收费3美元,每百万输出token收费15美元,且该费用已包含思考token的消耗。

Anthropic强调,Claude 3.7 Sonnet的开发理念与市场上的其他推理模型截然不同。公司认为,推理能力应是前沿模型的集成功能,而非独立存在。正如人类使用同一大脑进行快速反应和深度思考,Claude 3.7 Sonnet也集普通大型语言模型与推理模型于一体,为用户提供无缝体验。

在具体应用上,Claude 3.7 Sonnet展现了显著的改进。在标准模式下,它代表了Claude 3.5 Sonnet的升级;而在扩展思考模式下,模型会进行自我反思,从而在数学、物理、指令遵循、编程等多个领域表现更佳。值得注意的是,两种模式下的提示方式基本通用。

通过API使用Claude 3.7 Sonnet时,用户还可以自主控制模型的“思考预算”。这意味着用户可以指定Claude的思考过程不超过一定数量的token,从而在回答质量和推理速度(及成本)之间找到最佳平衡。

Anthropic在开发Claude 3.7 Sonnet时,还战略性地调整了对数学和计算机科学竞赛类题目的专项优化,转而更加注重解决企业实际需求的任务。这些任务更能真实反映大模型在业务场景中的应用方式。

特别是在编码和前端网页开发领域,Claude 3.7 Sonnet展现了突出改进。同时,Anthropic还推出了专为代理式编码设计的命令行工具Claude Code,开发者可以直接在终端界面上将大量工程任务委派给Claude完成。

Claude 3.7 Sonnet的扩展思考模式并非通过切换不同策略模型实现,而是让同一个模型拥有更多思考时间和计算资源。受益于Anthropic的“动作扩展”能力,Claude能够迭代式调用函数、响应环境变化,并持续执行直到完成开放式任务。

以运行Game Boy经典游戏《Pokémon Red》为例,Claude 3.7 Sonnet在配置基础记忆模块、屏幕像素输入接口及按钮操作函数调用后,成功突破了常规上下文限制,通过数万次交互维持游戏进程,展现了其强大的推理和执行能力。

在与各大主流模型的对比中,Claude 3.7 Sonnet也毫不逊色。在扩展思考模式下,它在研究生级推理任务上实现了78.2%的准确率,挑战了OpenAI的最新模型,并超越了DeepSeek-R1。

特别是在编程领域,Claude 3.7 Sonnet的表现尤为突出。在SWE-bench Verified编程测试中,无论是正常测试还是使用优化方法后,其成绩都优于其他模型,显示了其处理软件工程项目相关编程任务的强大能力。

Claude 3.7 Sonnet的发布在Hacker News上引发了热议。用户纷纷赞扬其简洁易用,特别是在学习和工作中提供了巨大帮助。尽管有用户提到服务稳定性有待提高,但总体评价积极。

巧合的是,就在Claude 3.7 Sonnet发布的同时,阿里云Qwen团队也推出了全新推理模型系统“深度思考(QwQ)”。该系统同样在数学解析、代码生成和智能体开发等领域展现出显著提升,引发了社区广泛关注。

这一系列的创新发布,无疑为人工智能领域注入了新的活力。业界和用户都在期待,未来这些先进的AI模型将如何进一步改变我们的生活和工作方式。

《旅行青蛙·中国之旅》vivo渠道将停运,其他平台玩家不受影响?
近日,《旅行青蛙》手游官网发布一则停运公告称,由于运营策略调整,《旅行青蛙·中国之旅》vivo服务器将在4月19日终止运营,玩家可申请退款。 对此,vivo客服确认了这一消息。客服表示,本次停服原因主要是是游…

2025-02-25

网易业绩稳健,浦银国际力挺“买入”,目标价上调至185港元
报告显示,网易2024年第四季度收入为人民币267.5亿元,同比下降1.4%,主要受非游戏业务下滑影响。其中,手游收入同比下降10.5%,端游收入则同比大幅增长56.6%,占游戏收入比例提升至34.7%,主要…

2025-02-25