Saltar para o conteúdo

Google I/O 2026: Gemini leva a IA a todo o lado e estreia óculos com áudio

Mulher com óculos a trabalhar no computador portátil ao ar livre, com pessoas ao fundo num café.

A segunda parte de 2026 promete dar um primeiro olhar sobre o futuro hiperinteligente que a Google imagina, com a ambição de se afirmar como referência máxima em Inteligência Artificial em praticamente todas as áreas do quotidiano. No Google I/O, a empresa apresentou hoje um conjunto de novidades de hardware e software destinadas a colocar IA em tudo o que as pessoas fazem no dia a dia - incluindo os seus primeiros óculos com áudio.

Criados em parceria com as marcas Gentle Monster e Warby Parker e suportados por tecnologia da Samsung e da Qualcomm, estes óculos existirão em versões de sol e também com lentes transparentes, sem qualquer tipo de informação apresentada nas lentes. “São desenhados para proporcionar ajuda do Gemini o dia todo, falada de forma discreta ao ouvido”, explicou no palco do I/O Shahram Izadi, diretor da Android XR. “Estes óculos permitem que se mantenha com as mãos livres e a cabeça levantada para fazer coisas como ouvir música, tirar fotos, fazer chamadas ou usar aplicações móveis, tudo sem precisar de ir ao bolso”, acrescentou.

A ligação será feita a smartphones Android ou iOS e a chegada às lojas está prevista para depois do verão. Ainda não foram divulgados o nome do produto nem o preço, mas o anúncio é significativo por marcar a estreia da Google nesta categoria e por surgir antes dos óculos Android XR com lentes inteligentes. No fundo, será também um teste à capacidade da empresa para conquistar consumidores com o apelo do Gemini, a sua plataforma tudo-em-um de IA, em concorrência direta com o ChatGPT.

A evolução do Gemini

No início da apresentação, Sundar Pichai, CEO da Google, sublinhou a importância da família de modelos: “Os nossos modelos Gemini são um grande motivo pelo qual as pessoas estão a usar mais os nossos produtos”. Segundo o executivo, a aplicação Gemini duplicou a base de utilizadores desde o ano passado, atingindo 900 milhões.

A seguir, a empresa de Mountain View quer avançar com o Gemini Omni. A novidade foi apresentada por Demis Hassabis, o investigador que cofundou a Google DeepMind, com um objetivo claro: aproximar a Google da AGI - Inteligência Artificial Geral -, isto é, o ponto em que as máquinas terão capacidades equivalentes ou superiores às dos humanos.

“o Gemini está a tornar-se num modelo do mundo”, afirmou, falando de um tipo de modelos que entendem a realidade física, mantêm memória persistente e são capazes de raciocinar e atuar no mundo real. “É um novo nível de compreensão do mundo, com multimodalidade”, descreveu Hassabis.

A primeira área com ganhos mais visíveis é a geração de vídeo. De acordo com a empresa, o Omni consegue transformar ideias complexas em vídeos muito realistas, com um nível de fidelidade que outros modelos teriam dificuldade em igualar. “Qualquer coisa pode funcionar como uma tela para criar novas realidades”, disse, enquanto mostrava demonstrações em que uma selfie era alterada com elementos visuais surrealistas e de elevada qualidade. Com o tempo, o modelo deverá permitir criar qualquer tipo de conteúdo a partir de qualquer tipo de instrução.

Antes de chegar a esse patamar, o bot Gemini vai aprofundar a integração no quotidiano. Pichai referiu que há cada vez mais “conversas em linguagem natural” em diferentes produtos Google, o que ajudou a orientar o anúncio seguinte: “Ask YouTube”, ou Pedir ao YouTube. Em breve, será possível colocar perguntas mais exigentes e dependentes de contexto dentro da plataforma, facilitando a navegação num serviço com milhões de resultados. O utilizador passará a receber vídeos mais alinhados com o pedido e, graças à memória e ao contexto, o bot permite manter um diálogo em vez de obrigar a repetir pesquisas.

Entre as restantes ferramentas, surge o Docs Live, pensado para quem quer “despejar” oralmente aquilo que lhe vai na cabeça, enquanto o Gemini organiza as ideias e apoia a estruturação do documento - por exemplo, na preparação de uma palestra ou de uma apresentação. Esta funcionalidade ficará disponível no verão para subscritores do Google AI Pro e Ultra.

Agentes IA para toda a gente

A Google apresentou ainda o Gemini Spark, descrito como um agente pessoal de cada utilizador, acessível 24/7. Trata-se de um passo além do Gemini tradicional, concebido para executar ações, e não apenas procurar informação e responder. Um exemplo dado foi a capacidade de gerar uma lista de ingredientes para uma receita e, de seguida, adicioná-los ao carrinho de compras numa aplicação de entregas.

O Spark também poderá ser configurado com tarefas recorrentes, como alertas sobre subscrições prestes a terminar ou um resumo semanal das atividades escolares do filho. Josh Woodward, responsável pelo Google Labs, classificou-o como “incrivelmente útil” e indicou que o Spark ficará disponível para assinantes do Google AI Ultra, chegando primeiro aos EUA.

IA é Pesquisa e Pesquisa é IA

Foi com esta frase que Liz Reid, líder da Google Search, enquadrou as mudanças previstas para o motor de busca. A caixa de pesquisa do Google, disse, será “totalmente reimaginada com IA”, ajudando a formular perguntas e a tornar a experiência mais multimodal - não apenas texto, mas também imagens, áudio e vídeo. “Estamos a juntar o Modo IA e a Vista Geral de IA para uma experiência sem barreiras”, afirmou.

As alterações abrangem também as compras. Para lá de apresentar opções, o Google passará a permitir a criação de um carrinho de compras universal. Nas palavras de Reid, trata-se de “o poder do comércio de agentes”, com disponibilidade prevista para o verão.

Outro anúncio com impacto foi a expansão da SynthID, uma ferramenta que passará a estar integrada na Pesquisa e no Chrome para ajudar a distinguir imagens reais de conteúdos manipulados ou gerados por IA. A OpenAI vai adotar a ferramenta, um passo considerado importante para reforçar a transparência na era da IA.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário