Claude Sonnet 4.5出来了,在SWE-bench Verified 上达到77.2%,可以自主连续执行30小时复杂编程任务
规模比Opus 4.1小,但在金融、法律、医学和STEM(科学、技术、工程和数学)等专业领域的知识和推理能力强
这次还开放了其内部用于构建Claude Code产品的软件开发工具包:Claude Agent SDK
目前,网站、iOS/Android应用以及API的默认模型已是Claude Sonnet 4.5
价格与Sonnet 4一样
另外,Claude Code做了升级,全新界面,原生VS Code扩展插件,新增了检查点功能,可以保存进度并即时回滚
API新增上下文编辑功能+记忆工具,可自动清除陈旧的上下文,可在上下文窗口之外存储和查阅信息
Claude App里直接跑代码、生成Excel/幻灯片/文档,功能被直接整合到对话里了
Chrome 扩展已推送给排队的Max用户,浏览器里指挥 Claude干活
还有一个Imagine with Claude的临时研究预览功能,可以实时动态生成软件
博客:https://www.anthropic.com/news/claude-sonnet-4-5

