As IAs continuam mostrando que o Hype é mais adiante.

As IAs continuam mostrando que o Hype é mais adiante.


Depois de algum tempo sem postar por absoluta falta de espaço na agenda, acabei decidindo montar um material mais completo durante o fim de semana. E já faço o disclaimer de que o texto é meu, e não de uma das novas IA anabolizadas sobre as quais falo aqui.

As últimas semanas tem sido incríveis para quem gosta do assunto IA, tanto filosoficamente, quanto tecnicamente. Os agentes de IA vieram com tudo, e se há poucos meses já estava relativamente fácil criá-los, mesmo para quem não conhece programação, penso que rompemos alguns limites de acessibilidade, de forma que queira você ou não, terá que incorporá-los em sua vida e em sua empresa já.

Manus.AI: O Agente Autônomo Multifuncional

Lançado em março de 2025, para acessá-lo você precisa entrar em uma fila de espera. O Manus.AI tem sido descrito como "a IA mais humana até hoje". Este agente autônomo chinês vai além de responder perguntas ou gerar conteúdo – ele navega na internet, analisa informações e executa tarefas complexas com mínima supervisão humana.

O diferencial do Manus está na sua capacidade de realizar atividades que normalmente exigiriam intervenção constante, desde a criação de sites completos até análises jurídicas especializadas. Sua arquitetura permite uma compreensão contextual profunda e tomada de decisões mais independente que a maioria dos sistemas atuais. Eu tinha dúvidas, mas vale o estímulo para registrar seu lugar na fila.

Depois de usá-lo uma vez, as IAs mais convencionais vão perder muito a graça.

A Openai cada vez mais viva e pulsante

A OpenAI acaba de anunciar o Codex, um agente de engenharia de software baseado em nuvem que representa um salto evolutivo na automação do desenvolvimento. Diferente de simples assistentes de código, o Codex trabalha em múltiplas tarefas simultaneamente, resolvendo bugs, implementando features e executando testes de forma autônoma. E para quem assina o PRO, que é a versão mais cara, além do uso expandido do Deep Research, você ainda tem acesso ao Operator, um agente capaz de navegar na web e executar tarefas como um assistente humano faria. Ele preenche formulários, realiza compras online, organiza agendas e executa comandos complexos sem necessidade de APIs específicas.

Mas para quem já utilizou o Manus, o Operator parece um assistente júnior, ainda com receio de realizar algumas ações sem sua intervenção. Ainda tem que evoluir um pouco, mas creio que isso virá rápido.

Além disso, em abril a Openai, lançou a família GPT-4.1, incluindo as versões mini e nano, com melhorias significativas em codificação, seguimento de instruções e processamento de contexto longo. Duas semanas depois, apresentou os modelos o3 e o4-mini, treinados para "pensar por mais tempo antes de responder", priorizando a qualidade do raciocínio.

Mais recentemente, o GPT-4o trouxe capacidades multimodais avançadas, especialmente para interações por voz, com processamento de "fala entra, fala sai" de baixa latência e melhor eficiência em múltiplos idiomas. Está valendo muito a pena ter pelo menos a assinatura Plus.

Mas nem tudo está resolvido ainda

Embora os agentes estejam cada vez mais versáteis e poderosos, um estudo recente publicado no arXiv, "Towards a Deeper Understanding of Reasoning Capabilities in Large Language Models", revela insights importantes sobre o potencial e as limitações dos LLMs como agentes de raciocínio.

A pesquisa demonstra que, embora modelos maiores geralmente superem os menores, técnicas estratégicas de prompting podem reduzir essa diferença. Isso aliás, qualquer um que tenha dedicado algum tempo a desenvolver-se nessa arte já havia percebido intuitivamente.

No entanto, o estudo também aponta limitações persistentes em áreas cruciais como planejamento, raciocínio e coordenação espacial, sugerindo que os atuais LLMs ainda enfrentam obstáculos fundamentais que podem não ser superados apenas com prompting auto-reflexivo. Não chegamos na IA Geral ainda. Mas estamos perto.

E daí? O que faço com isso?

A pergunta mais comum para o não iniciado, além de tentar entender qual o melhor modelo de LLM (large language model) para adotar, é o que fazer com ele.

Coloco abaixo algumas dicas úteis, pensando exclusivamente em agentes (Codex, Manus, Operator):

  • Mapeie processos administrativos que consomem tempo e áreas de gargalo operacional.
  • Implemente gradualmente, começando com tarefas de menor risco
  • Implemente em departamentos com alto volume de tarefas repetitivas
  • Crie fluxos de trabalho híbridos humano-IA e políticas claras de segurança e privacidade
  • Desenvolva métricas claras para avaliar impacto e ROI
  • Treine colaboradores para supervisionar e direcionar o agente
  • Considere o equilíbrio entre custo, desempenho e latência
  • Implemente sistemas de feedback para melhoria contínua
  • Desenvolva prompts específicos para o contexto da empresa

 Espero que eu tenha gerado aquele momento “A-há” para você que chegou até aqui e que o tempo que você usou tenha sido útil.

O desafio agora não é apenas adotar essas tecnologias, mas fazê-lo de forma estratégica e consciente. Isso exige um equilíbrio entre automação e supervisão humana, entre eficiência e ética, entre inovação e responsabilidade.

E você, já está implementando alguma dessas inovações? Compartilhe suas experiências nos comentários! Adoraria aprender sobre como cada um está utilizando esses avanços, que até pouco tempo eram ficção científica.

#InteligênciaArtificial #Inovação #FuturodoTrabalho #IA #Tecnologia #ManusAI #OpenAI #Codex #Operator

Entre para ver ou adicionar um comentário

Outras pessoas também visualizaram

Conferir tópicos