एजेंटिक वर्कफ़्लो के लिए लागत-कुशल तर्क महत्वपूर्ण है
Ninja AI में, हम मानते हैं कि अत्याधुनिक AI शक्तिशाली और सुलभ दोनों होनी चाहिए, जिससे उपयोगकर्ताओं को बैंक को तोड़े बिना उत्पादकता बढ़ाने में मदद मिले। पिछले दो वर्षों से हम एक एजेंटिक उत्पादकता प्रणाली बनाने पर ध्यान केंद्रित कर रहे हैं, निंजा एआई को स्मार्ट, तेज और अधिक सक्षम बनाने के लिए इसमें नवीनतम AI प्रगति को लगातार शामिल कर रहे हैं।
साथ ही हमने ऐसी सुविधाएँ पेश की हैं जिनके लिए परिष्कृत एजेंटिक वर्कफ़्लो की आवश्यकता होती है, जैसे कि डीप रिसर्च और मल्टी-टर्न फाइल विश्लेषण। हमने a. का बीटा संस्करण भी लॉन्च किया शेड्यूलिंग वर्कफ़्लो, निंजा को ईमेल के माध्यम से कई प्रतिभागियों के साथ बैठक के समय पर बातचीत करने की अनुमति देता है।
जैसे-जैसे हम इन कौशलों को लगातार परिष्कृत करते हैं, हम निंजा की बुद्धिमत्ता और निर्णय लेने को बढ़ाने के लिए एक महत्वपूर्ण आवश्यकता को पहचानते हैं। उच्च जोखिम वाले कार्यों में त्रुटियों को कम करना (उदाहरण के लिए, कैलेंडर ईवेंट को संशोधित करना) और अधिक स्वायत्त वर्कफ़्लो को सक्षम करना (उदाहरण के लिए, API और लोगों के साथ इंटरैक्ट करने वाले समग्र कार्यों को निष्पादित करना) के लिए हमारे एजेंटों को कई अलग-अलग प्रकार की स्थितियों में अधिक सटीक निर्णय और पूर्वानुमान लगाने की आवश्यकता होती है।
हमने पाया है कि हमारे वर्कफ़्लो में “चरण-दर-चरण सोच” को शामिल करने से उनकी सटीकता और सामान्यीकरण करने की क्षमता में काफी वृद्धि होती है। चरण-दर-चरण सोच एक ऐसी प्रक्रिया है जिसमें शामिल हैं: इंटेलिजेंट फ़ंक्शन-कॉलिंग द्वारा कार्यों को निष्पादित करने से पहले योजना बनाना, कार्यों को तोड़ना, पीछे हटना, सत्यापित करना और प्रतिबिंबित करना। हाल के रीज़निंग मॉडल ने जटिल गणित, विज्ञान और कोडिंग समस्याओं को हल करने के लिए 'चरण-दर-चरण सोच' को सफलतापूर्वक लागू किया है। हालांकि, निम्न सीमाओं के कारण, ये मॉडल हमारे निंजा एजेंटिक वर्कफ़्लो के लिए उपयुक्त नहीं हैं:
सबसे पहले, अधिकांश मौजूदा तर्क मॉडल बहुत महंगे हैं। उदाहरण के लिए, किसी एकल जटिल एजेंट कार्य का उपयोग OpenAI का O1 API $0.75 से $2.25 के बीच कहीं भी खर्च हो सकता है1 - यह “प्रति कार्य” लागत है जो एक ऐसी कीमत है जो एक व्यवसाय के रूप में हमारे लिए आर्थिक रूप से अस्थिर है और ग्राहकों के लिए भी अव्यवहार्य है यदि हम उन्हें प्रति कार्य लागत देते हैं।
1मान लें कि प्रत्येक एजेंटिक कार्य के लिए अनुमानित 5,000 से 10,000 इनपुट टोकन और 10,000 से 30,000 आउटपुट टोकन की आवश्यकता होती है
दूसरा, अधिक किफायती रीज़निंग मॉडल में एजेंट वर्कफ़्लो को पावर देने के लिए आवश्यक सुविधाएँ नहीं होती हैं। उदाहरण के लिए, DeepSeek R1 एक फ्री रीजनिंग मॉडल है - लेकिन यह सीमित है। R1, अपने आकार के कारण, मॉडल के लिए उच्च विलंबता और कम थ्रूपुट के लिए Nvidia H200s GPU (या बेहतर) की आवश्यकता होती है; इसलिए, रीयल-टाइम टास्क-ओरिएंटेड चैट सिस्टम में इसका उपयोग करना मुश्किल हो जाता है। H200s का उपयोग करने से इसे चलाना भी महंगा हो जाता है। इसके अतिरिक्त, R1 में सामान्य क्षमता और सॉफ़्टवेयर इंजीनियरिंग कार्यों को संभालने में चुनौतियां हैं - इन सीमाओं की पुष्टि इसके अंतिम भाग द्वारा की जाती है R1 पेपर।
इसके अलावा, मौजूदा रीज़निंग मॉडल में कस्टमाइज़ेशन की कमी है। निंजा में, हम उत्पादकता के लिए सबसे उन्नत एजेंट सिस्टम बनाने की आकांक्षा रखते हैं। इस तरह, हमें अपनी ज़रूरतों के हिसाब से मॉडल को बेहतर ढंग से ट्यून करने की क्षमता चाहिए। API के माध्यम से मौजूदा रीज़निंग मॉडल को एक्सेस करते समय या मौजूदा बड़े ओपन-सोर्स रीज़निंग मॉडल (जैसे कि 671B परम R1) का उपयोग करते समय यह संभव नहीं है।
इन कमियों को देखते हुए, हमने अपनी खुद की रीज़निंग सिस्टम - SuperAgent-R 2.0 - डिज़ाइन करने का निर्णय लिया, ताकि हमें एक स्थायी एजेंट सिस्टम को सक्षम करने में मदद मिल सके, जो ग्राहकों के लिए तेज़, सस्ती और बढ़िया ट्यून करने योग्य हो।






