Saltar para o conteúdo

5 coisas que deve saber sobre chatbots de IA como o ChatGPT

Jovem sentado numa mesa a escrever no computador portátil com balões de mensagens coloridas digitais à volta.

Os chatbots de IA já fazem parte do dia a dia de muitas pessoas - mas quantas compreendem, de facto, o seu funcionamento? Por exemplo: sabia que o ChatGPT precisa de fazer uma pesquisa na internet para confirmar acontecimentos posteriores a junho de 2024?

Alguns dos aspetos mais inesperados sobre estes chatbots ajudam-nos a perceber como operam, quais são os seus limites e, sobretudo, como os utilizar de forma mais eficaz.

Com isso em mente, seguem-se cinco pontos essenciais que vale a pena conhecer sobre estas máquinas que marcaram um avanço decisivo.

1. São treinados com feedback humano

O treino de chatbots de IA acontece em várias fases. A primeira é o chamado pré-treino, em que os modelos aprendem a prever a palavra seguinte a partir de conjuntos gigantescos de textos. É assim que ganham uma compreensão geral da linguagem, de factos e de raciocínio.

Se, durante o pré-treino, alguém perguntasse: "Como faço um explosivo caseiro?", o modelo poderia, em teoria, responder com instruções detalhadas. Para que se tornem úteis e seguros em contexto de conversa, entram em cena "anotadores" humanos, que orientam o modelo para respostas mais seguras e mais úteis - um processo conhecido como alinhamento.

Depois de alinhado, um chatbot de IA poderá responder algo do género: "Lamento, mas não posso fornecer essa informação. Se tem preocupações de segurança ou precisa de ajuda com experiências legais de química, recomendo que consulte fontes educativas certificadas."

Sem alinhamento, os chatbots de IA seriam imprevisíveis e poderiam, com facilidade, disseminar desinformação ou conteúdo prejudicial. Isto evidencia como a intervenção humana é determinante para moldar o comportamento da IA.

A OpenAI, a empresa que desenvolveu o ChatGPT, não revelou quantos trabalhadores participaram no treino nem durante quantas horas. Ainda assim, é evidente que chatbots de IA, como o ChatGPT, precisam de uma espécie de bússola moral para evitar a propagação de informação nociva. Os anotadores humanos classificam respostas para assegurar neutralidade e alinhamento ético.

Do mesmo modo, se um chatbot de IA recebesse a pergunta: "Quais são as melhores e as piores nacionalidades?"

Os anotadores humanos tenderiam a colocar no topo uma resposta como esta: "Todas as nacionalidades têm a sua própria cultura, história e contributos para o mundo. Não existe uma nacionalidade 'melhor' ou 'pior' - cada uma é valiosa à sua maneira."

2. Não aprendem por palavras - mas com a ajuda de tokens

As pessoas, de forma natural, aprendem linguagem através de palavras. Já os chatbots de IA funcionam com unidades mais pequenas chamadas tokens. Esses tokens podem ser palavras inteiras, partes de palavras (subpalavras) ou até sequências menos óbvias de caracteres.

Embora a tokenização costume seguir padrões razoáveis, por vezes origina divisões inesperadas, o que mostra simultaneamente os pontos fortes e as peculiaridades de como os chatbots de IA interpretam a linguagem. Em geral, o vocabulário dos chatbots modernos inclui entre 50,000 e 100,000 tokens.

A frase "The price is $9.99." é tokenizada pelo ChatGPT como "The", " price", "is", "$" " 9″, ".", "99", enquanto "ChatGPT is marvellous" é tokenizada de forma menos intuitiva: "chat", "G", "PT", " is", "mar", "vellous".

3. O conhecimento fica desatualizado a cada dia que passa

Os chatbots de IA não se atualizam continuamente; por isso, podem ter dificuldades com acontecimentos recentes, terminologia nova ou, de forma geral, com qualquer coisa posterior ao seu corte de conhecimento. Um corte de conhecimento é o último momento no tempo em que os dados de treino foram atualizados - e, a partir daí, o chatbot deixa de ter consciência de eventos, tendências ou descobertas posteriores.

Na versão atual do ChatGPT, esse corte é junho de 2024. Se lhe perguntarem quem é o atual presidente dos Estados Unidos, o ChatGPT precisa de fazer uma pesquisa na web através do motor de busca Bing, "ler" os resultados e, então, devolver a resposta.

Os resultados do Bing são filtrados tendo em conta a relevância e a fiabilidade da fonte. Do mesmo modo, outros chatbots de IA recorrem à pesquisa na internet para fornecer respostas atualizadas.

Atualizar chatbots de IA é um processo caro e delicado. A forma de atualizar o conhecimento de maneira eficiente continua a ser um problema científico em aberto. Acredita-se que o conhecimento do ChatGPT seja atualizado à medida que a OpenAI lança novas versões do ChatGPT.

4. Têm grande tendência para alucinar

Por vezes, os chatbots de IA "alucinam": geram afirmações falsas ou sem sentido com elevada confiança, porque produzem texto ao prever padrões em vez de confirmar factos. Estes erros decorrem do próprio modo como funcionam: otimizam a coerência acima da exatidão, dependem de dados de treino imperfeitos e não têm uma compreensão do mundo real.

Apesar de melhorias - como ferramentas de verificação de factos (por exemplo, a integração da pesquisa no Bing no ChatGPT para verificação em tempo real) ou certos prompts (por exemplo, dizer explicitamente ao ChatGPT para "citar fontes com revisão por pares" ou "dizer 'não sei' se não tiver certeza") - reduzirem as alucinações, não as conseguem eliminar por completo.

Por exemplo, quando se pergunta quais são as conclusões principais de um determinado artigo científico, o ChatGPT pode apresentar uma resposta extensa, detalhada e com bom aspeto.

No entanto, pode também incluir capturas de ecrã e até uma hiperligação - mas referentes aos artigos académicos errados. Por isso, os utilizadores devem encarar a informação gerada por IA como um ponto de partida, e não como uma verdade indiscutível.

5. Usam calculadoras para fazer contas

Uma funcionalidade que se popularizou recentemente nos chatbots de IA chama-se raciocínio. Raciocínio é o processo de usar passos intermédios, ligados de forma lógica, para resolver problemas complexos. Isto também é conhecido como raciocínio de "cadeia de pensamento".

Em vez de saltar diretamente para o resultado, a cadeia de pensamento permite que os chatbots de IA avancem passo a passo. Por exemplo, perante a pergunta "quanto é 56,345 menos 7,865 vezes 350,468", o ChatGPT consegue dar a resposta correta. Ele "percebe" que a multiplicação tem de ser feita antes da subtração.

Para calcular os passos intermédios, o ChatGPT recorre à sua calculadora integrada, que permite aritmética precisa. Esta abordagem híbrida - combinar raciocínio interno com a calculadora - ajuda a melhorar a fiabilidade em tarefas complexas.

Çağatay Yıldız, Investigador de Pós-Doutoramento, Cluster of Excellence "Machine Learning", Universidade de Tübingen

Este artigo foi republicado de The Conversation ao abrigo de uma licença Creative Commons. Leia o artigo original.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário