体验市场上由下一代芯片提供支持的最快的专有和旗舰人工智能模型。
与其他 LLM API 相比,以低廉的成本实现高质量的性能。
Ninja 的模型根据领先的人工智能基准测试进行了严格测试,在不同领域表现出近乎最先进的性能。
忍者的复合 AI 模型
对于寻求最佳性能的开发人员来说,Ninja 的专有 LLM 是不二之选。我们的复合人工智能模型结合了来自OpenAI、Anthropic、谷歌、DeepSeek等公司的多个旗舰LLM,并进行了尖端的推理级别优化。
模式
输入价格/ 每 M 个代币
产出价格/ 每 M 个代币
价格/ 任务
Qwen 3 Coder 480B (Cerebras)
—
—
1.50 美元
标准模式
—
—
1.00 美元
复杂模式
—
—
1.50 美元
快速模式
—
—
1.50 美元
模式
输入价格/ 每 M 个代币
产出价格/ 每 M 个代币
价格/ 任务
Qwen 3 Coder 480B (Cerebras)
3.75 美元
3.75 美元
—
标准模式
1.50 美元
1.50 美元
—
复杂模式
4.50 美元
22.50 美元
—
快速模式
3.75 美元
3.75 美元
—
模型
输入价格/ 每 M 个代币
产出价格/ 每 M 个代币
涡轮 1.0
0.11 美元
0.42 美元
Apex 1.0
0.88 美元
7.00 美元
推理 2.0
0.38 美元
1.53 美元
深度研究 2.0
1.40 美元
5.60 美元
速率限制
Ninja AI 对每个模型的推理请求实施速率限制,以确保开发人员能够尝试最快的推理。
模型
每分钟请求次数 (转速)
涡轮 1.0
50
Apex 1.0
20
推理 2.0
30
深度研究 2.0
5
忍者 API 性能
旗舰车型:Turbo 1.0 和 Apex 1.0
Apex 1.0在行业标准的Arena-Hard-Auto(聊天)测试中得分最高。它衡量了人工智能处理复杂现实对话的能力,重点是其驾驭需要细致理解和情境感知的场景的能力。
这些模型在其他基准测试中也表现出色:Math-500、AIME2024-推理、GPQA-推理、LiveCodeBench-编码,以及LiveCodeBench-编程-困难。

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日
推理 2.0
在AIME测试的竞争数学中,Reasoning 2.0的表现优于OpenAI O1和Sonnet 3.7。它评估了人工智能处理需要逻辑和高级推理的问题的能力。
在GPQA测试中,推理2.0的准确度也超过了人类博士级别的准确性。它通过复杂的多步骤问题来评估一般推理,这些问题需要回忆事实、推断和解决问题。
.avif)
上次更新时间:2025 年 4 月 15 日
.avif)
上次更新时间:2025 年 4 月 15 日
.avif)
上次更新时间:2025 年 4 月 15 日
深度研究 2.0
Deep Research 在 SimpleQA 测试中实现了 91.2% 的准确率。它是检测模型幻觉水平的最佳代理之一。这凸显了Deep Research在准确识别事实信息方面的卓越能力,超过了该领域的领先模型。
在GAIA测试中,Deep Research得分为57.64%,这表明在浏览现实世界信息环境、合成来自多个来源的数据以及得出真实而简洁的答案方面表现出色。
Deep Research还在人工智能领域取得了重大突破,在HLE测试中得分为17.47%。它被广泛认为是评估 100 多个学科的人工智能系统的严格基准。深度研究的表现明显高于其他几种领先的人工智能模型,包括o3-mini、o1和DeepSeek-R1。

上次更新时间:2025 年 4 月 15 日

上次更新时间:2025 年 4 月 15 日
提供商(Pass @1)
第 1 级
第 2 级
第 3 级
平均值
OpenAI 的深度研究
74.29
69.06
47.6
67.36
忍者的深度研究
69.81
56.97
46.15
57.64
数据来源:OpenAI 博客文章 —阅读更多
%20Benchmark.avif)
上次更新时间:2025 年 4 月 15 日
您可以免费注册或订阅 Ultra 或 Business 套餐。Ultra 和 Business 允许你进入游乐场尝试旗舰模型、推理模型和深度研究模型。








