二月份,我们在SuperNinja上发布了Opus 4.6,并称其为我们有史以来最大的情报升级。Anthropic 刚刚让我们修改了那句话。
Opus 4.7 现已在 SuperNinja 的 Complex Plus 模式下上线。它更快、更敏锐,更擅长代理人谋生的实际工作——在漫长、混乱、多步骤的工作中继续执行任务。
Opus 4.7 的新增功能
这不是一个小版本的改进。Opus 4.7 是一次重点突出、目标明确的升级,适用于对实际工作最重要的领域:编码、多步推理和长时间运行的代理任务。
软件工程中的 #1
SWE-Bench Verified 从 80.8% 跃升至 87.6%,使 Opus 4.7 领先于 GPT-5.4 和 Gemini 3.1 Pro。在更难的多语言基准测试SWE-Bench Pro上,Opus 4.7达到64.3%,超越GPT-5.4的57.7%,双子座的54.2%。
#1 在工具使用中
Opus 4.7领先MCP-Atlas的77.3%,领先于GPT-5.4(68.1%)和Gemini 3.1 Pro(73.9%)。对于在复杂的多步骤工作流程中调用工具的代理来说,这个数字很重要。
知识工作中的 #1
在测试金融、法律和其他专业领域的现实任务的GDPval-AA上,Opus 4.6的表现比GPT-5.2高出144个Elo积分。这是一个巨大的差距。
更清晰的视野
Opus 4.7引入了高达375万像素的高分辨率视觉支持,比其前身增加了3倍。现在,它可以精确地读取和推理密集的图表、详细的用户界面屏幕截图和复杂的可视化文档。
更长、更可靠的代理工作
由于三分之一的工具错误,多步代理推理提高了14%。新的代理循环任务预算让 SuperNinja 可以运行更长、更复杂的工作流程,而不会偏离正轨。以前在各个步骤中丢失上下文的会话现在可以保留上下文。
这在 SuperNinja 里面意味着什么
SuperNinja 的 Complex Plus 模式是你发送硬东西的地方。多文件重构。研究任务包括十五次工具调用。长达一百页的深入分析。
Opus 4.7使该模式在根本上做得更好。
代码和应用程序构建。 改善多文件项目的架构。更简洁的代码。漏掉的边缘案例更少。第一次运行而不是第三次运行时发布的全栈应用程序。
深度研究。 这里的工具使用收益复杂。更好的导航,更好的源代码提取,更好的长时间研究会话中的综合效果。
幻灯片和演示文稿。 Agentic 幻灯片制作器获得了推理升级和更清晰的视野。更好的叙事结构。更聪明的图表选择。减少来回交流。
文件和数据工作。 PDF、电子表格、仪表板。视觉升级在这里最重要——Opus 4.7实际上可以读取它正在分析的图表。
长时间运行的自动化。 不受干扰地运行的计划任务。这是多步推理改进14%和工具错误减少三分之一最快的地方。
如何在 SuperNinja 上使用 Opus 4.7
- 打开 super.myninja.ai。
- 点击模型选择器。
- 选择 复杂 → 复杂 Plus。
- 提交您的任务。
Complex Plus 使用比标准模式更多的计算能力。在任务需要时使用它——构建完整的应用程序、长时间的研究、复杂的编码、可视化分析,以及过去需要一个人一天完成的任何事情。
可用性
Opus 4.7 现已在 Complex Plus 模式下面向所有 SuperNinja 用户上线。没有候补名单。无需单独注册。
如果你已经使用了 SuperNinja,它现在在模型选择器中。
如果你不是,那么免费套餐足以尝试一下。



