El razonamiento rentable es clave para los flujos de trabajo de Agentic
En Ninja AI, creemos que la IA de vanguardia debe ser potente y accesible, y ayudar a los usuarios a aumentar la productividad sin arruinarse. Durante los últimos dos años, nos hemos centrado en crear un sistema de productividad para las agencias, añadiendo continuamente los últimos avances de la IA a Ninja AI para que sea más inteligente, rápida y capaz.
A lo largo del camino, hemos introducido funciones que requieren flujos de trabajo de agencia sofisticados, como Investigación profunda y Análisis de archivos de varios turnos. También lanzamos una versión beta de un programar flujo de trabajo, lo que permite a Ninja negociar los horarios de las reuniones con varios participantes por correo electrónico.
A medida que perfeccionamos continuamente estas habilidades, reconocemos una necesidad fundamental: mejorar la inteligencia y la toma de decisiones de los Ninja. Reducir los errores en las tareas de alto riesgo (por ejemplo, modificar los eventos del calendario) y habilitar flujos de trabajo más autónomos (por ejemplo, ejecutar tareas compuestas que interactúen con las API y las personas) requieren que nuestros agentes tomen decisiones y predicciones más precisas en muchos tipos de situaciones diferentes.
Hemos descubierto que la incorporación del «pensamiento paso a paso» en nuestros flujos de trabajo aumenta considerablemente su precisión y su capacidad de generalización. El pensamiento paso a paso es un proceso que implica: planificar, desglosar las tareas, dar marcha atrás, verificar y reflexionar antes de ejecutar las tareas mediante llamadas inteligentes a funciones. Los modelos de razonamiento recientes han aplicado con éxito el «pensamiento paso a paso» para resolver problemas matemáticos, científicos y de codificación complejos. Sin embargo, debido a las siguientes limitaciones, estos modelos no son adecuados para nuestros flujos de trabajo de Ninja Agentic:
En primer lugar, la mayoría de los modelos de razonamiento actuales son muy caros. Por ejemplo, una única tarea agencial compleja que utilice API O1 de OpenAI podría costar entre 0,75 y 2,25 dólares1 - es decir, el coste «por tarea», que es un precio que es económicamente insostenible para nosotros como empresa y también inviable para los clientes si les repercutiéramos los costes por tarea.
1Suponiendo que cada tarea de agencia requiere aproximadamente entre 5000 y 10 000 tokens de entrada y entre 10 000 y 30 000 tokens de salida
En segundo lugar, los modelos de razonamiento más asequibles no tienen las funciones necesarias para impulsar los flujos de trabajo de las agencias. Por ejemplo, DeepSeek R1 es un modelo de razonamiento libre, pero es limitado. El R1, debido a su tamaño, requiere las GPU Nvidia H200 (o superiores) para obtener una alta latencia y un bajo rendimiento para el modelo, lo que dificulta su uso en un sistema de chat orientado a tareas en tiempo real. El uso de los H200 también hace que su funcionamiento sea caro. Además, R1 tiene dificultades para gestionar las tareas generales de ingeniería de software y capacidad; estas limitaciones se confirman en la última sección del Papel R1.
Además, los modelos de razonamiento existentes carecen de personalizaciones. En Ninja, aspiramos a construir el sistema de agencia más avanzado para la productividad. Por ello, necesitamos la capacidad de ajustar los modelos para que se adapten mejor a nuestras necesidades. Esto no es posible cuando se accede a los modelos de razonamiento actuales a través de una API o cuando se utilizan grandes modelos de razonamiento de código abierto existentes (como el parámetro R1 del 671B).
Dados estos inconvenientes, decidimos diseñar nuestro propio sistema de razonamiento, SuperAgent-R 2.0, para ayudarnos a crear un sistema de agentes sostenible que sea rápido, asequible y que los clientes puedan ajustar con precisión.






