Hoje, estamos extremamente empolgados com o lançamento do Ninja's SuperAgent. O SuperAgent é uma nova forma de criar um sistema mais inteligente usando os melhores modelos de IA da atualidade. Nesta postagem do blog, discutiremos como aumentamos a inteligência do Ninja AI usando Otimização do nível de inferência (não se preocupe, explicaremos o que é isso mais tarde). Também veremos alguns exemplos da vida real para explicar como o SuperNinja pode ajudá-lo a obter a melhor resposta, mais rapidamente.

Melhorando o Ninja com otimização do nível de inferência

A otimização em nível de inferência se concentra no ajuste fino do sistema geral de IA para aumentar sua eficiência e eficácia. Na Ninja, implementamos duas técnicas principais para elevar o desempenho geral do sistema: mistura de agentes e otimização baseada em críticas.

O Mistura de agentes A abordagem utiliza vários modelos de IA para produzir resultados superiores de forma colaborativa. A otimização baseada em críticas refina ainda mais esses resultados, aplicando uma camada adicional de avaliação e melhoria para garantir precisão e relevância. Juntas, essas técnicas permitem que o Ninja forneça respostas que não são apenas mais rápidas, mas também mais ponderadas e precisas.

Flow chart of how SuperAgent is architeted
O SuperAgent é uma combinação de vários modelos de IA e um modelo crítico.

Esse processo de usar vários modelos de IA e um modelo crítico é o que chamamos de SuperAgent. Vamos nos aprofundar em cada técnica de otimização para saber mais.

Usando vários modelos para gerar uma resposta melhor

Normalmente, quando você usa um sistema como o ChatGPT ou o Gemini, você envia uma solicitação e o sistema responde com uma resposta. A resposta será muito influenciada pela forma como esse modelo foi treinado, pelo tamanho do modelo e por outras configurações do sistema.

Imagine que você está planejando o lançamento de um produto. Se você consultar três modelos de IA para obter ajuda, poderá obter três respostas diferentes devido ao treinamento e às características de cada modelo.

  • O modelo 1 pode analisar as tendências do mercado e sugerir o cronograma de lançamento ideal.
  • O modelo 2 pode criar uma estratégia de marketing convincente para maximizar o impacto.
  • O Modelo 3 pode se concentrar na logística, oferecendo conselhos sobre como otimizar a produção ou a distribuição.

Ao combinar os insights desses três modelos, você obtém uma resposta muito mais rica e útil do que a que qualquer modelo único poderia ter fornecido. Essa abordagem é chamada de mistura de agentes.

Como diz o ditado: se você fizer uma pergunta a 10 pessoas, receberá 10 respostas diferentes.:)

Mas e se você pudesse perguntar a essas 10 pessoas o que pensam sobre sua pergunta e depois combinar os insights de cada resposta na melhor resposta possível? É isso que o SuperAgent faz por você — tudo em uma única etapa.

Otimização baseada em críticas

Outra parte importante do SuperAgent é criticar e refinar a resposta antes de responder a você. É aqui que entra o modelo crítico.

O modelo de crítica funciona como um editor. Ele avalia todas as respostas geradas pelos vários modelos, analisando fatores como:

  • Precisão: As informações estão corretas? Os fatos são atualizados e confiáveis?
  • Relevância: A resposta responde diretamente à sua pergunta ou sai do tópico?
  • Clareza: A resposta é fácil de entender ou está cheia de jargões confusos?
  • Completude: A resposta abrange todos os pontos importantes ou está faltando alguma coisa?

Esse processo garante que a resposta final obtida seja precisa e completa. Essencialmente, é como ter um editor de IA que garante que tudo esteja polido antes de chegar até você.

Inovando com mais rapidez e eficiência

Você pode estar se perguntando: “Por que a Ninja simplesmente não constrói um modelo maior e mais robusto que é mais inteligente do que todos os outros modelos existentes?” Treinar um único modelo de IA para se tornar mais inteligente e sofisticado exige muito tempo, recursos e poder computacional. Tudo isso resulta em mais dinheiro.

Embora o desenvolvimento de modelos fundamentais seja caro e consuma muitos recursos, a otimização do nível de inferência é uma maneira mais rápida e econômica de obter um desempenho superior. Usando técnicas como mistura de agentes e otimização baseada em críticas, o Ninja combina os modelos existentes em um sistema que oferece respostas de alta qualidade sem a despesa de criar novas.

Podemos então passar o economias para o nosso você, o usuário.

Exemplo da vida real: lançamento de uma campanha de marketing

Vamos pensar em planejar uma campanha de marketing para o lançamento de um novo produto. Você pode perguntar à IA: “Como posso criar uma estratégia de marketing eficaz para meu novo produto?” Veja como todo esse processo pode se desenrolar:

  • Modelo 1 concentra-se na análise do público, identificando seu público-alvo e sugerindo quais plataformas, como mídias sociais, e-mail marketing ou anúncios pagos, os alcançariam de forma mais eficaz.
  • Modelo 2 é especializada em estratégia de conteúdo, fornecendo ideias para campanhas envolventes, mensagens atraentes e recursos visuais criativos para se conectar com seu público.
  • Modelo 3 lida com a logística, oferecendo um cronograma detalhado para a execução da campanha, otimizando os gastos com anúncios e monitorando as métricas de desempenho.

O SuperAgent combina todas essas informações em um plano coeso, oferecendo uma estratégia de marketing passo a passo adaptada às suas metas. Quando a resposta chega até você, é como um manual completo, personalizado de acordo com as necessidades da sua empresa. Você obtém os melhores insights da experiência de cada modelo, com refinamento que torna o plano claro, acionável e pronto para ser executado.

Várias versões do SuperAgent para atender às suas necessidades

Sempre priorizamos o fornecimento acesso a vários modelos de IA de empresas líderes, o que nos permite oferecer ferramentas versáteis e poderosas para nossos usuários. Essa base nos permitiu avançar rapidamente no desenvolvimento do SuperAgent. Para garantir que o SuperAgent atenda às diversas necessidades de nossos usuários, desenvolvemos três versões que alcançam um equilíbrio entre velocidade e desempenho:

Different versions of SuperAgent available

SuperAgent Turbo: Para respostas ultrarrápidas. O Turbo oferece respostas instantâneas usando nossos modelos personalizados e ajustados internamente e está disponível para todos os assinantes.

SuperAgent Apex: A versão mais robusta do SuperAgent, ela oferece respostas exaustivamente pesquisadas e abrangentes. Ele combina vários modelos emblemáticos de IA para obter insights de nível especializado e está disponível para assinantes Ultra e Business.

SuperAgente-R 2.0: Para problemas complexos que exigem raciocínio avançado. O SuperAgent-R é baseado no DeepSeek R1 destilado no Llama 70B e está disponível para assinantes Ultra e Business.

Estamos testando todas as versões do SuperAgent em comparação com outros modelos usando benchmarks de última geração (SoTA), como o arena-hard, para validar seu desempenho. Com base nos resultados iniciais, estamos muito entusiasmados com seu desempenho em relação a muitos modelos fundamentais conhecidos, como GPT-4o, Gemini 1.5 pro e Claude Sonnet 3.5. Fique ligado, pois planejamos publicar nossos resultados em breve!

O SuperAgent, e nosso trabalho na otimização do nível de inferência foi projetado para tornar o Ninja mais útil, preciso e responsivo. Em vez de simplesmente responder às perguntas, o Ninja fornece respostas mais ricas e diferenciadas que parecem a ajuda que você receberia de um grupo de especialistas. Compreender essas técnicas nos ajuda a avaliar a complexidade por trás dessas interações simples e nos dá uma ideia de como a IA continua melhorando na compreensão e na ajuda.