Hoje, estamos extremamente empolgados com o lançamento do Ninja's SuperAgent. O SuperAgent é uma nova forma de criar um sistema mais inteligente usando os melhores modelos de IA da atualidade. Nesta postagem do blog, discutiremos como aumentamos a inteligência do Ninja AI usando Otimização do nível de inferência (não se preocupe, explicaremos o que é isso mais tarde). Também veremos alguns exemplos da vida real para explicar como o SuperNinja pode ajudá-lo a obter a melhor resposta, mais rapidamente.
Melhorando o Ninja com otimização do nível de inferência
A otimização em nível de inferência se concentra no ajuste fino do sistema geral de IA para aumentar sua eficiência e eficácia. Na Ninja, implementamos duas técnicas principais para elevar o desempenho geral do sistema: mistura de agentes e otimização baseada em críticas.
O Mistura de agentes A abordagem utiliza vários modelos de IA para produzir resultados superiores de forma colaborativa. A otimização baseada em críticas refina ainda mais esses resultados, aplicando uma camada adicional de avaliação e melhoria para garantir precisão e relevância. Juntas, essas técnicas permitem que o Ninja forneça respostas que não são apenas mais rápidas, mas também mais ponderadas e precisas.

Esse processo de usar vários modelos de IA e um modelo crítico é o que chamamos de SuperAgent. Vamos nos aprofundar em cada técnica de otimização para saber mais.
Usando vários modelos para gerar uma resposta melhor
Normalmente, quando você usa um sistema como o ChatGPT ou o Gemini, você envia uma solicitação e o sistema responde com uma resposta. A resposta será muito influenciada pela forma como esse modelo foi treinado, pelo tamanho do modelo e por outras configurações do sistema.
Imagine que você está planejando o lançamento de um produto. Se você consultar três modelos de IA para obter ajuda, poderá obter três respostas diferentes devido ao treinamento e às características de cada modelo.
- O modelo 1 pode analisar as tendências do mercado e sugerir o cronograma de lançamento ideal.
- O modelo 2 pode criar uma estratégia de marketing convincente para maximizar o impacto.
- O Modelo 3 pode se concentrar na logística, oferecendo conselhos sobre como otimizar a produção ou a distribuição.
Ao combinar os insights desses três modelos, você obtém uma resposta muito mais rica e útil do que a que qualquer modelo único poderia ter fornecido. Essa abordagem é chamada de mistura de agentes.
Como diz o ditado: se você fizer uma pergunta a 10 pessoas, receberá 10 respostas diferentes.:)
Mas e se você pudesse perguntar a essas 10 pessoas o que pensam sobre sua pergunta e depois combinar os insights de cada resposta na melhor resposta possível? É isso que o SuperAgent faz por você — tudo em uma única etapa.
Otimização baseada em críticas
Outra parte importante do SuperAgent é criticar e refinar a resposta antes de responder a você. É aqui que entra o modelo crítico.
O modelo de crítica funciona como um editor. Ele avalia todas as respostas geradas pelos vários modelos, analisando fatores como:
- Precisão: As informações estão corretas? Os fatos são atualizados e confiáveis?
- Relevância: A resposta responde diretamente à sua pergunta ou sai do tópico?
- Clareza: A resposta é fácil de entender ou está cheia de jargões confusos?
- Completude: A resposta abrange todos os pontos importantes ou está faltando alguma coisa?
Esse processo garante que a resposta final obtida seja precisa e completa. Essencialmente, é como ter um editor de IA que garante que tudo esteja polido antes de chegar até você.
Inovando com mais rapidez e eficiência
Você pode estar se perguntando: “Por que a Ninja simplesmente não constrói um modelo maior e mais robusto que é mais inteligente do que todos os outros modelos existentes?” Treinar um único modelo de IA para se tornar mais inteligente e sofisticado exige muito tempo, recursos e poder computacional. Tudo isso resulta em mais dinheiro.
Embora o desenvolvimento de modelos fundamentais seja caro e consuma muitos recursos, a otimização do nível de inferência é uma maneira mais rápida e econômica de obter um desempenho superior. Usando técnicas como mistura de agentes e otimização baseada em críticas, o Ninja combina os modelos existentes em um sistema que oferece respostas de alta qualidade sem a despesa de criar novas.
Podemos então passar o economias para o nosso você, o usuário.
Exemplo da vida real: lançamento de uma campanha de marketing
Vamos pensar em planejar uma campanha de marketing para o lançamento de um novo produto. Você pode perguntar à IA: “Como posso criar uma estratégia de marketing eficaz para meu novo produto?” Veja como todo esse processo pode se desenrolar:
- Modelo 1 concentra-se na análise do público, identificando seu público-alvo e sugerindo quais plataformas, como mídias sociais, e-mail marketing ou anúncios pagos, os alcançariam de forma mais eficaz.
- Modelo 2 é especializada em estratégia de conteúdo, fornecendo ideias para campanhas envolventes, mensagens atraentes e recursos visuais criativos para se conectar com seu público.
- Modelo 3 lida com a logística, oferecendo um cronograma detalhado para a execução da campanha, otimizando os gastos com anúncios e monitorando as métricas de desempenho.
O SuperAgent combina todas essas informações em um plano coeso, oferecendo uma estratégia de marketing passo a passo adaptada às suas metas. Quando a resposta chega até você, é como um manual completo, personalizado de acordo com as necessidades da sua empresa. Você obtém os melhores insights da experiência de cada modelo, com refinamento que torna o plano claro, acionável e pronto para ser executado.
Várias versões do SuperAgent para atender às suas necessidades
Sempre priorizamos o fornecimento acesso a vários modelos de IA de empresas líderes, o que nos permite oferecer ferramentas versáteis e poderosas para nossos usuários. Essa base nos permitiu avançar rapidamente no desenvolvimento do SuperAgent. Para garantir que o SuperAgent atenda às diversas necessidades de nossos usuários, desenvolvemos três versões que alcançam um equilíbrio entre velocidade e desempenho:

SuperAgent Turbo: Para respostas ultrarrápidas. O Turbo oferece respostas instantâneas usando nossos modelos personalizados e ajustados internamente e está disponível para todos os assinantes.
SuperAgent Apex: A versão mais robusta do SuperAgent, ela oferece respostas exaustivamente pesquisadas e abrangentes. Ele combina vários modelos emblemáticos de IA para obter insights de nível especializado e está disponível para assinantes Ultra e Business.
SuperAgente-R 2.0: Para problemas complexos que exigem raciocínio avançado. O SuperAgent-R é baseado no DeepSeek R1 destilado no Llama 70B e está disponível para assinantes Ultra e Business.
Estamos testando todas as versões do SuperAgent em comparação com outros modelos usando benchmarks de última geração (SoTA), como o arena-hard, para validar seu desempenho. Com base nos resultados iniciais, estamos muito entusiasmados com seu desempenho em relação a muitos modelos fundamentais conhecidos, como GPT-4o, Gemini 1.5 pro e Claude Sonnet 3.5. Fique ligado, pois planejamos publicar nossos resultados em breve!
O SuperAgent, e nosso trabalho na otimização do nível de inferência foi projetado para tornar o Ninja mais útil, preciso e responsivo. Em vez de simplesmente responder às perguntas, o Ninja fornece respostas mais ricas e diferenciadas que parecem a ajuda que você receberia de um grupo de especialistas. Compreender essas técnicas nos ajuda a avaliar a complexidade por trás dessas interações simples e nos dá uma ideia de como a IA continua melhorando na compreensão e na ajuda.



