Estamos a entrar na terceira fase da IA generativa. Primeiro dominaram os chatbots, depois chegaram os assistentes. Agora começam a ganhar forma os agentes: sistemas que ambicionam mais autonomia e conseguem trabalhar em “equipas” ou recorrer a ferramentas para executar tarefas complexas.
O produto mais falado neste momento é o ChatGPT agent da OpenAI. Trata-se da junção de dois produtos já existentes (Operator e Deep Research) num único sistema mais robusto que, segundo a empresa, “pensa e age”.
Face a esta evolução, estas ferramentas já não são apenas mais uma novidade: perceber como funcionam, o que conseguem fazer - e também onde falham, quais os limites e que riscos trazem - está rapidamente a tornar-se indispensável.
De chatbots a agentes
O ChatGPT inaugurou a era dos chatbots em novembro de 2022. No entanto, apesar de uma popularidade enorme, a interface conversacional acabou por restringir o que era possível fazer com a tecnologia.
Entretanto surgiram os assistentes de IA, também conhecidos como copilot. São sistemas construídos sobre os mesmos grandes modelos de linguagem que alimentam os chatbots de IA generativa, mas agora orientados para executar tarefas com instruções e supervisão humana.
Os agentes vão um passo além. Em vez de se limitarem a concluir tarefas, procuram atingir objectivos, com diferentes níveis de autonomia, apoiando-se em capacidades mais avançadas como raciocínio e memória.
Em alguns cenários, vários sistemas de agentes de IA podem actuar em conjunto: comunicam entre si para planear, calendarizar, decidir e coordenar a resolução de problemas complexos.
Além disso, os agentes são “utilizadores de ferramentas”, porque conseguem chamar software especializado para tarefas específicas - por exemplo, navegadores web, folhas de cálculo, sistemas de pagamento, entre outros.
Um ano de desenvolvimento acelerado
Desde o final do ano passado, a IA agentiva tem parecido estar mesmo “à porta”. Um marco importante aconteceu em outubro passado, quando a Anthropic deu ao chatbot Claude a capacidade de interagir com um computador de forma muito semelhante à de um humano. O sistema passou a conseguir pesquisar em várias fontes de dados, localizar informação relevante e submeter formulários online.
Outros actores avançaram rapidamente na mesma direcção. A OpenAI lançou um agente de navegação na web chamado Operator, a Microsoft anunciou agentes do Copilot, e assistiu-se ao lançamento do Vertex AI da Google e dos agentes Llama da Meta.
No início deste ano, a startup chinesa Monica mostrou o seu agente Manus a comprar imobiliário e a transformar gravações de aulas em notas de síntese. Outra startup chinesa, a Genspark, lançou um agente de motor de pesquisa que devolve uma visão geral numa única página (semelhante ao que a Google faz actualmente), com ligações integradas para tarefas online, como encontrar as melhores promoções.
Há também a startup Cluely, que disponibiliza um agente algo descontrolado, descrito como “trapacear em tudo”, e que tem atraído atenções, embora ainda não tenha apresentado resultados realmente relevantes.
Importa notar que nem todos os agentes são concebidos para uso geral. Muitos são desenhados para áreas específicas.
A programação e a engenharia de software estão na linha da frente, com o agente de programação do Copilot da Microsoft e o Codex da OpenAI entre os nomes mais fortes. Estes agentes conseguem escrever, avaliar e submeter código de forma independente, ao mesmo tempo que analisam código escrito por humanos à procura de erros e quebras de desempenho.
Pesquisa, síntese e mais
Uma das grandes vantagens dos modelos de IA generativa é a pesquisa e a sumarização. Os agentes podem aproveitar essa capacidade para executar tarefas de investigação que, a um especialista humano, poderiam exigir dias.
O Deep Research da OpenAI aborda tarefas complexas com pesquisa online em várias etapas. Já o “co-cientista” de IA da Google é um sistema multiagente mais sofisticado, pensado para ajudar cientistas a gerar novas ideias e propostas de investigação.
Os agentes fazem mais - e também erram mais
Apesar do entusiasmo, os agentes de IA vêm acompanhados de muitas ressalvas. A Anthropic e a OpenAI, por exemplo, recomendam supervisão humana activa para reduzir erros e mitigar riscos.
A OpenAI afirma ainda que o seu ChatGPT agent é “alto risco”, devido ao potencial de apoiar a criação de armas biológicas e químicas. Contudo, a empresa não divulgou os dados que sustentam esta afirmação, pelo que é difícil avaliá-la.
Ainda assim, os riscos em contexto real ficam ilustrados por situações como a do Project Vend, da Anthropic. Nesse projecto, foi atribuído a um agente de IA o objectivo de gerir uma máquina de venda automática para funcionários como se fosse um pequeno negócio - e tudo descambou em alucinações tão cómicas quanto alarmantes, culminando num frigorífico cheio de cubos de tungsténio em vez de comida.
Noutro episódio de aviso, um agente de programação apagou toda a base de dados de um programador e, mais tarde, justificou-se dizendo que tinha “entrado em pânico”.
Agentes no escritório
Apesar de tudo, os agentes já estão a ser usados de forma prática.
Em 2024, a Telstra expandiu de forma significativa as subscrições do Microsoft Copilot. A empresa afirma que os resumos de reuniões gerados por IA e os rascunhos de conteúdos fazem poupar, em média, 1–2 horas por semana a cada colaborador.
Muitas grandes organizações seguem estratégias semelhantes. Também empresas mais pequenas estão a experimentar agentes - por exemplo, a construtora Geocon, com sede em Camberra, que recorre a um agente de IA interactivo para gerir defeitos nos seus projectos de apartamentos.
Custos humanos e outros
Neste momento, o principal risco associado aos agentes é a substituição tecnológica. À medida que se tornarem melhores, poderão substituir trabalhadores humanos em muitos sectores e funções. Em paralelo, a adopção de agentes pode acelerar a redução de empregos administrativos de entrada (white-collar) para quem está a começar.
Também existem riscos para quem usa agentes de IA. É possível depender em excesso do sistema e transferir para a máquina tarefas cognitivas importantes. E, sem supervisão adequada e sem salvaguardas, alucinações, ciberataques e erros cumulativos podem rapidamente desviar um agente das suas tarefas e objectivos, levando a danos, perdas e lesões.
Os custos reais também permanecem pouco claros. Todos os sistemas de IA generativa consomem muita energia, o que afectará o preço de utilização de agentes - sobretudo quando se trata de tarefas mais complexas.
Aprenda sobre agentes - e crie o seu
Apesar destas preocupações persistentes, é expectável que os agentes de IA se tornem mais capazes e mais presentes no trabalho e no quotidiano. Por isso, faz sentido começar a utilizá-los (e talvez até a desenvolvê-los), compreendendo o que fazem bem, onde falham e que riscos e limitações trazem.
Para a maioria das pessoas, a via mais acessível para usar agentes passa pelo Microsoft Copilot Studio. A ferramenta inclui salvaguardas integradas, governação e uma loja de agentes para tarefas comuns.
Para quem quer ir mais longe, é possível criar um agente de IA próprio com apenas cinco linhas de código, usando a framework LangChain.
Daswin de Silva, Professor de IA e Analítica, Director de Estratégia de IA, La Trobe University
Este artigo é republicado de The Conversation ao abrigo de uma licença Creative Commons. Leia o artigo original.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário