التفكير الفعال من حيث التكلفة هو مفتاح سير عمل الوكيل
في Ninja AI، نعتقد أن الذكاء الاصطناعي المتطور يجب أن يكون قويًا ويمكن الوصول إليه، مما يساعد المستخدمين على زيادة الإنتاجية دون إفلاس. على مدار العامين الماضيين، ركزنا على بناء نظام إنتاجي فعال، وإضافة أحدث تطورات الذكاء الاصطناعي باستمرار إلى Ninja AI لجعله أكثر ذكاءً وأسرع وأكثر قدرة.
على طول الطريق، قدمنا ميزات تتطلب عمليات سير عمل معقدة للوكالات، مثل البحث العميق و تحليل الملفات متعددة الأدوار. أطلقنا أيضًا إصدارًا تجريبيًا من جدولة سير العمل، مما يسمح لـ Ninja بالتفاوض على أوقات الاجتماعات مع العديد من المشاركين عبر البريد الإلكتروني.
بينما نعمل باستمرار على تحسين هذه المهارات، ندرك الحاجة الماسة - لتعزيز ذكاء النينجا واتخاذ القرار. يتطلب تقليل الأخطاء في المهام عالية الخطورة (مثل تعديل أحداث التقويم) وتمكين المزيد من عمليات سير العمل المستقلة (على سبيل المثال، تنفيذ المهام المركبة التي تتفاعل مع واجهات برمجة التطبيقات والأشخاص) من وكلائنا اتخاذ قرارات وتنبؤات أكثر دقة في العديد من أنواع المواقف المختلفة.
لقد اكتشفنا أن دمج «التفكير خطوة بخطوة» في عمليات سير العمل لدينا يعزز بشكل كبير دقتها وقدرتها على التعميم. التفكير خطوة بخطوة هو عملية تتضمن: التخطيط، وتقسيم المهام، والتراجع، والتحقق والتفكير قبل تنفيذ المهام عن طريق استدعاء الوظائف الذكي. نجحت نماذج التفكير الحديثة في تطبيق «التفكير خطوة بخطوة» لحل مشاكل الرياضيات والعلوم والترميز المعقدة. ومع ذلك، نظرًا للقيود التالية، فإن هذه النماذج ليست مناسبة لسير عمل Ninja Agentic الخاص بنا:
أولاً، معظم نماذج التفكير الحالية مكلفة للغاية. على سبيل المثال، مهمة وكيل معقدة واحدة باستخدام واجهة برمجة تطبيقات O1 من OpenAI يمكن أن تكلف ما بين 0.75 دولار إلى 2.25 دولار1 - هذه هي تكلفة «لكل مهمة» وهو سعر غير مستدام اقتصاديًا بالنسبة لنا كشركة وأيضًا غير قابل للتطبيق للعملاء إذا أردنا تمرير التكاليف إليهم لكل مهمة.
1بافتراض أن كل مهمة وكيل تتطلب ما يقدر بـ 5,000 إلى 10,000 رمز إدخال و 10,000 إلى 30,000 رمز إخراج
ثانيًا، لا تحتوي نماذج التفكير ذات الأسعار المعقولة على الميزات الضرورية لتشغيل تدفقات عمل الوكلاء. على سبيل المثال، يعد DeepSeek R1 نموذجًا للتفكير الحر - ولكنه محدود. يتطلب R1، نظرًا لحجمه، وحدات معالجة الرسومات Nvidia H200s (أو أفضل) لوقت استجابة مرتفع وإنتاجية منخفضة للنموذج؛ مما يجعل من الصعب استخدامه في نظام الدردشة الموجه نحو المهام في الوقت الفعلي. استخدام H200s يجعل تشغيله مكلفًا أيضًا. بالإضافة إلى ذلك، يواجه R1 تحديات في التعامل مع القدرات العامة ومهام هندسة البرمجيات - يتم تأكيد هذه القيود من خلال القسم الأخير من ورقة R1.
علاوة على ذلك، تفتقر نماذج التفكير الحالية إلى التخصيصات. في Ninja، نطمح إلى بناء نظام الوكيل الأكثر تقدمًا للإنتاجية. على هذا النحو، نحتاج إلى القدرة على ضبط النماذج لتناسب احتياجاتنا بشكل أفضل. هذا غير ممكن عند الوصول إلى نماذج التفكير الحالية عبر API أو استخدام نماذج التفكير الكبيرة مفتوحة المصدر الحالية (مثل 671B param R1).
نظرًا لهذه العيوب، قررنا تصميم نظام التفكير الخاص بنا - Superagent-R 2.0 - لمساعدتنا على تمكين نظام وكيل مستدام سريع وميسور التكلفة وقابل للضبط بشكل جيد للعملاء.






