詳細な調査が 1 回限りの作業になることはめったにありません。計画の概要、洞察の発見、情報源の評価、フォローアップの精緻化、分析の統合、成果物の作成など、多段階のプロセスです。GPU ベースのシステムでは、これらのサイクルの 1 段階を完了するのに 10 分かかることがあります。また、新しい質問を繰り返し行うと 10 分以上かかることがあります。その摩擦によってイテレーションが抑えられてしまいます。

本日、NinjaTech AIが発表できることを誇りに思います スーパーニンジャ・ファスト・ディープリサーチとの戦略的パートナーシップを原動力としています セレブラ — 以上のものを提供 5倍速いリサーチループ 従来のモデルよりも。今では、反復的な複数ステップの探索を、数十分ではなく数分で行うことが可能になっただけでなく、手間もかかりません。

なぜこれが今重要なのか

スーパーニンジャ・ファスト・ディープリサーチ 速いだけじゃないこれは動きの中の変容です

  • 妥協のないスピード: 以前は10分以上かかっていた推論、ソース評価、合成の複雑なシーケンスが、今ではわずか1〜2分で完了します。
  • インタラクティブインテリジェンス: リアルタイムイテレーションにより、AI のディープリサーチは静的なレポートから動的なオンデマンドパートナーへと移行します。
  • 品質を犠牲にしない: すべての回答は、引用された情報源、構造化された推論、および徹底的な分析に基づいています。深度や正確さを犠牲にしても、速度の向上を実現できます。

ベンチマーク:同等の精度、画期的なスピード

品質とパフォーマンスの両方を評価するために、テストしました スーパーニンジャ・ファスト・ディープリサーチ、CerebrasハードウェアのQwen3-235Bモデルを搭載し、 ガイアベンチマーク—多段階の推論とツールの使用に関するやりがいのある現実世界でのテスト(axIV リンク)。

GAIAのタスクは意図的に難しいものです。466問の質問と検証可能な回答は、事実の想起だけでなく、計画力、情報源の収集、複雑性の中での推理能力、正確な結果の提供能力を測定するために設計されています。

精度の結果 — 最適な結果とのマッチング

「スーパーニンジャ・ファスト・ディープリサーチ」達成 58.9% の精度、アンソロピックのソネット4のような一流モデルを綿密に追跡しています(62.1%) とジェミニ 2.5 プロ (62.6%)、そしてOpenAIのGPT-O3を上回っている (54.5%)。

Ninja Deep Research Accuracy on GAIA

スピード結果 — 他とは一味違います

セレブラスのQwen3-235Bが本当に分離したのは 速度:

  • 平均完了時間: 57.4 秒 GAIA タスクごと
  • 3.9倍高速 ジェミニ2.5プロより (225.3)
  • 4.1倍高速 ソネット 4 より (237.7)
  • 5.5倍高速 GPT-O3 よりも (316.7s)

Ninja Deep Research speed on GAIA

これがあなたにとって何を意味するか

あなたが手に入れるのは 主要なフロンティアモデルと同等の精度—しかし、回答が劇的に速くなります。反復を伴うディープ・リサーチのワークフローでは、このスピードによって、これまで遅すぎたフォローアップ、ピボット、より深い掘り下げなど、まったく新しい可能性が開かれます。

現実世界の例:スピードが戦略を決定するとき

あなたがグローバルな消費財企業にアドバイスをしているブランドストラテジストだと想像してみてください。CMO は、来週のリーダーシップサミットで、ハイステークスの企業リブランドに向けた議論を始めたいと考えています。意見だけでなく、データに基づいたインサイトを持って会議室に足を踏み入れる必要があります。

まず、この詳細な調査プロンプトから始めます。

2010年から2025年にかけて、複数の業界にわたる最も注目すべき企業リブランディング10件を明確な基準を用いて調査し、「注目すべき」を定義し、売上、市場シェア、顧客センチメント、ブランド・エクイティにおける測定可能な変化について、信頼でき、引用され、リンクされた情報源を集めます。結果を標準化して比較できるようにし、最も成功したものから最も成功しなかったものの順にランク付けして表にまとめます。これには、すべての主要な指標、各ブランドの簡単なケースの要約、およびリブランド戦略の議論の指針となる実用的でエビデンスに裏打ちされた少なくとも5つの洞察が含まれます。

他の AI リサーチツールでは、最初の報告まで 10 ~ 15 分待つ場合があります。さらに調査が必要なフォローアップの質問がある場合は、反復するたびに時間が長くなります。

スーパーニンジャ・ファスト・ディープリサーチ、各サイクルは 1 ~ 2 分で完了するため、基準の調整、エッジケースの調査、新しいデータの追加、インサイトのストレステストをリアルタイムで行い、迅速に反復処理を行うことができます。1 つの静的なレポートを作成する代わりに、リンクされたソース、比較可能な指標、およびエビデンスに裏付けられた簡潔な教訓を含むインタラクティブな表を作成し、会議室でライブで発表して適応させることができます。

スピードは速くなるだけではありません。より多くの角度から探求し、より多くの仮定を検証し、他の方法では明らかにできなかったであろう戦略的洞察を明らかにすることができます。

仕組み

オープンソースの大規模言語モデルにおける大きな進歩にもかかわらず、これらのモデルと、複雑で長期的な情報検索タスクを実行するトッププロプライエタリシステムとの間には、依然としてパフォーマンスのギャップが残っています。この課題は、GAIAのようなベンチマークでよく取り上げられています。このギャップを埋めるには、より大きなモデルだけでなく、よりスマートな推論が必要です。

SuperNinjaのディープリサーチシステムは プラン&CodeActスキャフォールディングフレームワーク これにより、Qwen3-Instruct 235bなどの基本的なオープンソースモデルが目標主導型の研究者に変わります。このフレームワークは反復的に実行されます。 検証、検証、再計画 ループ。標準的な推論と比較して約2倍の数の推論トークンを生成します。その余分な思考時間は正確さの面で報われ、特徴的なモデルエラーを体系的に減らし、最先端の独自モデルにマッチするようにパフォーマンスを向上させることができます。

これにより、精度をさらに向上させます データ駆動型最適化レイヤー 顧客のドメインとデータに基づいて、ツールの定義、パラメーター、検索方法をカスタマイズします。このようにカスタマイズした設定により、専門的でリスクの高いリサーチタスクにおいてモデルの信頼性が高まります。そのトレードオフは?このように豊富で厳密な推論プロセスでは、従来の GPU システムでは計算上のオーバーヘッドが増え、トークンの生成や GPU 間の通信に時間がかかるため、反復処理が遅くなります。

そこで、Cerebrasのウェーハスケールの推論がパフォーマンスを大幅に向上させるのに役立ちました。モデル全体を完全にオンチップSRAMで実行し、GPU間のボトルネックなしに推論を超高速化することで、スキャフォールディングループ全体を次のように加速します。 4—6 倍 従来のシステムと比較して。つまり、スピードを犠牲にすることなく、トップクラスの独自モデルの精度を得ることができるため、反復的で複数ラウンドのリサーチサイクルがリアルタイムで実用的になります。

SuperNinjaのファスト・ディープリサーチを今すぐお試しください

SuperNinja Fast Deep Researchは、単に高速なツールであるだけでなく、ディープ・リサーチのワークフローがどのように行われるのかを再定義したものです。質問にリアルタイムで適応する、迅速で厳密な洞察を重視するなら、すぐに違いを実感できるでしょう。

エージェント AI が次世代のスピードと出会うとどうなるかを体験してください。