Claude Opus 4.8发布：性能提升显著，Anthropic估值飙升至9650亿美元-天脉财经

Anthropic 正式推出新一代大模型 Claude Opus 4.8，标志着人工智能领域又迎来重要突破。作为 Claude 系列中参数规模最大的旗舰产品，该模型在多项基准测试中展现出显著进步，尤其在判断力、诚实度和独立工作能力方面实现提升。新模型不仅延续了前代版本的技术优势，更通过架构优化实现了更长时间的无监督运行能力。

在性能提升方面，Opus 4.8 展现出多维度突破。编程测试显示其代码生成质量较前代提升显著，逻辑推理能力在复杂问题解决场景中表现突出。特别值得注意的是，模型在诚实性训练方面取得重大进展——通过强化证据验证机制，其自信断言的准确率提高四倍，代码缺陷主动提示率达到行业领先水平。这种改进源于Anthropic独创的"渐进式验证"算法，使模型能够动态评估输出可靠性。

伴随新模型发布的动态工作流功能引发行业关注。该功能允许用户启动数百个并行运行的子智能体，实现代码库级迁移等复杂任务。在Javascript运行时Bun的迁移案例中，系统仅用11天就完成75万行Rust代码转换，测试通过率高达99.8%。这种突破性能力得益于模型对工作流的自主规划能力，以及持续运行时间延长至数天的技术突破。

定价策略方面，Anthropic维持了原有API价格体系：输入Token每百万5美元，输出Token每百万25美元。快速模式实现成本优化，输入价格降至每百万10美元，输出价格降至每百万50美元，同时运行速度提升至常规模式的2.5倍。这种分层定价模式为不同需求用户提供灵活选择，企业版用户还可享受速率限制提升等专属权益。

用户体验创新体现在投入度控制功能的引入。用户现在可以通过滑块调节模型响应质量，在"高投入"模式下获得深度思考后的优质回答，或在"低投入"模式下实现快速响应。这种设计平衡了质量与效率需求，经测试显示编程任务在默认设置下的Token消耗与前代持平，但性能表现更优。

技术安全领域同样取得进展。对齐性评估显示，新模型在亲社会特质指标上创下新高，未对齐行为发生率较前代降低60%，达到Claude Mythos Preview的同等安全水平。这得益于Anthropic开发的"价值对齐强化学习"框架，通过多维度评估体系确保模型行为符合人类价值观。

商业发展方面，Anthropic完成H轮650亿美元融资，投后估值达9650亿美元。本轮融资由多家顶级投资机构领投，内存巨头美光、三星、SK海力士的加入凸显产业界对AI基础设施的重视。公司透露，当前Claude企业客户年化收入已突破470亿美元，较年初增长显著。融资资金将用于扩大研究团队和算力基础设施，为即将发布的Mythos系列超智能模型做准备。