人工智能公司 Anthropic 于2025年11月24日正式发布其最新旗舰基础模型 Claude Opus 4.5,并已在亚马逊 Bedrock 平台上线。该模型旨在显著提升AI系统在编码、智能代理、计算机使用及日常办公任务方面的性能。
Anthropic 官方表示,Claude Opus 4.5 是目前在编码、代理和计算机使用方面表现最佳的模型,并在日常任务如深度研究、处理幻灯片和电子表格方面也有显著改进。 该模型专为开发复杂的AI代理而设计,能够独立进行推理、规划并执行复杂任务。
在软件工程领域,Claude Opus 4.5 表现尤为突出,在 SWE-bench Verified 测试中取得了80.9%的高分,相较于之前的模型,其在解决多系统复杂错误方面的能力有所增强,有望大幅缩短开发周期。 该模型还提升了多语言编码能力,能高效生成代码、改善测试覆盖率,并在架构设计中做出更优选择。
针对办公效率,Claude Opus 4.5 能够自动化创建专业的 PowerPoint 演示文稿、Excel 电子表格和 Word 文档,在处理复杂项目时展现出卓越的连贯性和准确性,特别适用于金融等对精确度要求极高的行业。
为开发者,新模型引入了两项重要改进:工具搜索功能,允许代理动态发现和加载所需工具,从而节省资源并避免混乱;以及工具使用示例,使复杂的工具调用更加准确。
用户现在可以通过亚马逊 Bedrock 控制台访问 Claude Opus 4.5,并通过 Bedrock 的 AgentCore 轻松在生产环境中部署和监控该模型,实现高效的工作流管理。 在定价方面,Claude Opus 4.5 的使用成本为每百万输入令牌5美元,每百万输出令牌25美元,相较于之前的 Opus 系列模型,成本降低了三分之二,提供了更高的性价比。
该模型已支持跨区域推理,确保在高峰时段的高吞吐量。