anthropic 推出了其最新一代 ai 模型 claude sonnet 4.5,宣称该模型在代码生成、构建高阶 ai agent 以及操作系统级任务执行方面处于全球领先地位。

Claude Sonnet 4.5 在多项核心评估基准上取得了突破性进展。其在 SWE-bench Verified 测试中斩获 77.2% 的高分,创下当前行业新纪录;而在 OSWorld 的实际任务完成率方面,性能从此前的 42.2% 大幅提升至 61.4%。
不仅如此,在逻辑推理、数学运算以及金融、法律、医疗等专业垂直领域,Sonnet 4.5 的表现也全面超越了包括 Opus 4.1 在内的早期版本。该模型已具备持续运行超过 30 小时以完成复杂软件开发任务的能力。为充分发挥其编程潜力,Anthropic 建议用户启用“扩展思考”模式。

在安全性和价值观对齐方面,公司表示 Sonnet 4.5 是截至目前最符合安全规范的前沿模型,显著降低了诱导性响应、欺骗性行为和过度迎合用户的倾向。
API 层面也同步迎来升级,新增上下文编辑功能与记忆存储工具。前者可在接近 token 上限时动态清理无效历史内容,后者则支持将关键信息暂存于上下文窗口之外,从而让智能体能够处理更长周期、更高复杂度的任务流程。
目前,Claude Sonnet 4.5 已全面上线 Anthropic 官方平台及配套工具,开发者可通过调用 claude-sonnet-4-5 接口使用该模型。定价策略维持不变,延续 Sonnet 4 的标准:每百万输入 Token 收费 3 美元,每百万输出 Token 收费 15 美元。此外,该模型还已接入 Cursor、Augment、Windsurf、GitHub Copilot、JetBrains、Perplexity 等多个主流第三方平台。
源码地址:点击下载
以上就是Claude Sonnet 4.5 发布,全球最强的代码模型的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号