Usar IA no dia a dia não basta para detectar imagens deepfakes: a ciência já provou

Hélder Miguel Martins • April 16, 2026 03:35

Um comboio é travado de emergência em Inglaterra.

A imagem de um alegado desastre espalha-se e torna-se viral. Só mais tarde alguém se dá conta: aquela cena nunca aconteceu.

À medida que a inteligência artificial (IA) produz imagens cada vez mais verosímeis, governos, empresas e utilizadores comuns procuram formas de distinguir o que é autêntico do que foi fabricado. Um estudo recente, no entanto, arrefece a expectativa de que “educar o olhar” - ou usar IA todos os dias - seja, por si só, solução para o problema dos deepfakes.

Quando uma foto falsa faz parar comboios reais

Na madrugada de 3 de dezembro de 2025, um sismo atinge Lancaster, no noroeste de Inglaterra. Pouco depois, começa a circular nas redes sociais uma fotografia de uma ponte ferroviária alegadamente destruída. A imagem é tão credível que a operadora britânica opta por suspender a circulação por precaução.

O resultado é imediato: 32 comboios ficam parados. Passageiros aguardam retidos em estações. As perdas financeiras acumulam-se em milhares de libras. Horas depois, chega a confirmação: a ponte está intacta. A fotografia era sintética, gerada por inteligência artificial.

O caso poderia ser classificado como um simples equívoco operacional. Ainda assim, revela algo mais sério: uma imagem falsa, com pormenor suficiente, bastou para influenciar decisões críticas em tempo real.

As fronteiras entre o real e a simulação tornaram-se tão ténues que uma única imagem convincente já consegue alterar rotas, orçamentos e decisões de segurança.

Deteção de deepfakes: o que a ciência apurou sobre rostos falsos

Perante situações deste género, investigadores do Departamento de Psicologia da Universidade Vanderbilt, nos Estados Unidos, quiseram perceber porque é que algumas pessoas parecem identificar deepfakes com facilidade, enquanto outras são enganadas repetidamente por armadilhas visuais.

Para isso, desenvolveram um teste próprio, o AI Face Test. A ideia foi direta: avaliar a capacidade de voluntários para distinguir rostos reais de rostos gerados por IA e relacionar esse desempenho com outras competências cognitivas.

Usar IA no quotidiano não aumenta, por si só, a sua proteção

Os resultados contrariaram o senso comum. A utilização frequente de ferramentas de IA não tornou os participantes mais eficazes a reconhecer imagens falsas. Um QI elevado também não foi decisivo. E nem a experiência profissional em reconhecimento facial se destacou como fator determinante.

O melhor preditor de um bom desempenho foi outro: a capacidade de reconhecimento de objetos em geral. Quem é particularmente competente a identificar e discriminar objetos tende a detetar microincoerências em imagens sintéticas - pequenos “ruídos visuais” que raramente aparecem em fotografias autênticas.

De acordo com o estudo, a aptidão para notar diferenças subtis em qualquer tipo de objeto está fortemente associada à capacidade de identificar rostos gerados por IA.

Na prática, os investigadores sublinharam três pontos:

A aptidão geral em reconhecimento de objetos antecipou melhor o desempenho na identificação de faces falsas.
Quem teve bons resultados manteve-os em avaliações posteriores, sugerindo uma característica relativamente estável.
Treinos técnicos curtos não produziram melhorias significativas na performance média.

Uma competência mais próxima de “talento visual” do que de formação técnica

Os autores descrevem esta aptidão como uma competência visual abrangente e, em grande medida, inata. Não se trata de algo que se obtenha apenas com cursos de tecnologia, nem de uma capacidade que surja só por “habituar o olho” a ver deepfakes.

Trabalhos anteriores já tinham associado esta competência visual a tarefas bastante diferentes entre si:

Tarefa	Como a habilidade visual pesa
Identificação de nódulos em radiografias ao tórax	Distinguir padrões muito subtis nos tecidos pulmonares
Classificação de células sanguíneas como cancerígenas	Detetar alterações mínimas em formas e texturas celulares
Leitura de notação musical complexa	Reconhecer rapidamente símbolos diversos e as suas relações
Determinar o sexo a partir de imagens da retina	Interpretar pormenores visuais pouco evidentes para leigos

Em todos estes cenários, quem consegue discriminar objetos com elevada precisão tende a destacar-se. O estudo sobre deepfakes faciais encaixa no mesmo padrão.

Nem todos enfrentam o mesmo risco de desinformação

Os investigadores chamam a atenção para uma questão delicada: as capacidades visuais variam muito na população. Há pessoas quase incapazes de distinguir um rosto real de um rosto sintético. Outras acertam com regularidade surpreendente. E existe uma ampla zona intermédia que acerta muitas vezes, mas falha noutras.

Isto conduz a uma consequência desconfortável: duas pessoas com o mesmo nível de escolaridade, acesso às mesmas notícias e às mesmas aplicações podem ter vulnerabilidades muito diferentes perante a desinformação visual.

Uma parte da população, mesmo bem informada, tenderá a confiar repetidamente em imagens falsas, simplesmente por limitações na perceção de detalhes.

Para políticas públicas e para plataformas digitais, isto sugere que campanhas genéricas de “literacia mediática” podem ter eficácia limitada se ignorarem diferenças individuais de perceção.

IA não é um antídoto automático contra IA

É comum apostar-se numa solução essencialmente tecnológica: filtros automáticos, detetores de deepfake, sistemas de verificação em grande escala. Estas ferramentas são úteis, mas o estudo aponta para um limite importante desta abordagem.

Mesmo quem trabalha com IA diariamente não é, por definição, melhor a identificar imagens enganadoras. A familiaridade com aplicações de geração de imagens, por exemplo, não se revelou um “escudo” fiável.

Isto levanta um alerta: delegar toda a triagem em utilizadores “muito tecnológicos” pode ser frágil. Existem especialistas em dados brilhantes que, ainda assim, não têm o mesmo “olho” que um bom patologista ou um músico treinado, por exemplo.

Riscos práticos: da política à medicina

Se uma fatia da população é mais vulnerável do ponto de vista visual, alguns setores ficam sob pressão acrescida. Em períodos eleitorais, fotografias inventadas de candidatos em situações comprometedoras podem circular com força em grupos onde a maioria não identifica sinais de manipulação. Em crises climáticas ou desastres, imagens de pontes a colapsar ou edifícios em chamas podem provocar pânico e desencadear decisões precipitadas.

Na saúde, o tema torna-se ainda mais sensível. A IA já é usada para gerar imagens médicas sintéticas com o objetivo de treinar algoritmos. Misturar, por engano ou por má-fé, imagens reais e artificiais em contextos clínicos abre caminho a diagnósticos confusos. Profissionais com maior acuidade visual tendem a notar incongruências; outros, não.

Conceitos que convém dominar

Dois termos aparecem frequentemente nestas discussões e costumam gerar dúvidas.

O que é, na prática, um deepfake de imagem

Um deepfake é conteúdo visual ou áudio criado ou alterado com técnicas avançadas de inteligência artificial, geralmente com redes neuronais profundas. No caso de fotografias, o objetivo é construir rostos e cenas que parecem captados por uma câmara, embora nunca tenham ocorrido. Atualmente, geradores conseguem produzir expressões faciais plausíveis, textura de pele realista e cenários com iluminação coerente.

Os sinais de falsificação tornaram-se mais discretos: falhas em reflexos, pormenores em joias, transições estranhas entre cabelo e fundo, artefactos em áreas pouco óbvias da imagem. Quem tem elevada capacidade de reconhecimento de objetos tende a detetar estes deslizes com mais rapidez.

O que significa “reconhecimento de objetos” neste contexto

No estudo, reconhecimento de objetos não é uma função de uma aplicação: é uma capacidade humana. Trata-se de identificar rapidamente formas, padrões, texturas e relações espaciais em imagens variadas. Um exemplo simples seria distinguir várias espécies de aves com base em fotografias rápidas, ou detetar pequenos defeitos em placas eletrónicas.

Esta competência combina perceção visual fina, atenção ao detalhe e rapidez de análise. Pessoas com desempenho elevado neste tipo de tarefas frequentemente “sentem” que há algo errado numa imagem, mesmo antes de conseguirem explicar exatamente o quê.

Cenários futuros: testes de visão digital, equipas mistas e prova de proveniência

Com a proliferação de deepfakes, é plausível que empresas e entidades públicas adotem algo semelhante a um “teste de visão digital”. Se determinadas funções dependem de avaliar imagens ou vídeos suspeitos, pode fazer sentido criar equipas com pessoas cuja aptidão seja medida objetivamente - por exemplo, com instrumentos como o AI Face Test.

Em paralelo, uma via promissora passa por transformar o que estes bons avaliadores humanos conseguem ver em critérios para ferramentas automáticas: compreender que padrões os melhores detetores percecionam e tentar traduzi-los para detetores computacionais mais robustos.

Há ainda um eixo complementar que tende a ganhar importância: proveniência e autenticidade de conteúdos. Em vez de depender apenas do “olho” humano (ou de um detetor), cresce o interesse por mecanismos que registem a origem e o histórico de edição - desde metadados assinados a iniciativas de marcação e cadeias de custódia digitais (por exemplo, padrões de proveniência de conteúdos). Não elimina o risco, mas acrescenta uma camada verificável quando a imagem circula fora do contexto.

Para o público em geral, a abordagem mais realista continua a ser uma combinação de hábitos: desconfiar de imagens “perfeitas” e demasiado convenientes, procurar confirmação em múltiplas fontes, valorizar conteúdos com contexto verificável e, sempre que possível, evitar que uma única fotografia “bombástica” determine decisões. Num mundo em que nem todos detetam as mesmas falhas, criar camadas de verificação tornou-se rotina - não paranoia.