Inteligência Artificial

A Revolução da Inteligência Artificial: Destaques do Google I/O 2025

Xavier

25 Mai 2025 • 6 min read

O Futuro da Criação de Conteúdo com IA Generativa

O evento Google I/O de 2025 revelou uma série de avanços impressionantes no campo da Inteligência Artificial, especialmente em ferramentas generativas que prometem transformar a forma como criamos conteúdo.

Veo 3: A Nova Era da Geração de Vídeos com Áudio Nativo

Um dos lançamentos mais aguardados é o Veo 3, a mais recente evolução do modelo de geração de vídeos da Google. Além de oferecer qualidade superior, aderência aprimorada aos prompts e uma compreensão física mais refinada, o grande destaque do Veo 3 é sua capacidade de gerar áudio nativo. Isso significa que é possível criar vídeos com efeitos sonoros, sons de fundo e até vozes diretamente a partir de prompts, sem a necessidade de ferramentas adicionais. Como demonstrado no Google I/O, o Veo 3 é capaz de produzir vídeos de música, com vocais e instrumentais perfeitamente sincronizados, e até mesmo cenas com diálogos com sotaques diversos, tudo em uma única solicitação.

Imagen 4: Imagens Fotorrealistas e Mais Além

No segmento de geração de imagens, a Google apresentou o Imagen 4, que sucede o Imagen 3 com melhorias significativas. O modelo oferece resultados mais realistas e de maior qualidade, suportando a geração de imagens em até 2K de resolução, ideal para impressão e outras necessidades visuais de alta fidelidade. Uma das capacidades mais notáveis do Imagen 4 é sua habilidade aprimorada de renderizar texto e tipografia, permitindo a criação de quadrinhos, fotos de produtos e pôsteres com texto correto diretamente na imagem. Segundo as demonstrações no Google I/O, o Imagen 4 é incrivelmente rápido, sendo aproximadamente seis vezes mais veloz que modelos concorrentes como o GPT-4 da OpenAI, mantendo uma qualidade de imagem similar.

Flow: A Plataforma de Filmagem Impulsionada por IA

Integrando o poder do Veo 3 e do Imagen 4, a Google lançou o Flow, uma plataforma completa de filmagem impulsionada por IA. O Flow permite criar e editar vídeos com transições fluidas, efeitos sonoros e música, além de manter a consistência de personagens e objetos entre as cenas. Uma funcionalidade inovadora é a “Ingredients to Video”, que permite aos usuários carregar imagens de referência de objetos ou personagens para inseri-los em seus vídeos. Além disso, o Flow oferece a capacidade de estender vídeos existentes, criando transições contínuas entre cenas, mesmo que o modelo original tenha uma duração máxima limitada. No momento, o acesso ao Flow está disponível apenas para usuários do Google AI Ultra nos EUA, por uma assinatura mensal de $249.99.

Inovação no Design e Desenvolvimento com IA

Stitch: O Designer de UI e Web da Google com Velocidade de IA

Para designers e desenvolvedores, o Stitch é uma ferramenta de IA revolucionária que automatiza a criação de interfaces de usuário (UI) e designs de aplicativos. O Stitch é capaz de gerar designs de aplicativos e interfaces a partir de descrições de texto ou referências visuais, como esboços ou capturas de tela. Uma vez gerado o design, é possível exportar o código frontend totalmente funcional ou o arquivo Figma para refinamentos adicionais. O processo é altamente conversacional e iterativo, permitindo que os usuários ajustem o layout, componentes, cores e estilos simplesmente conversando com a IA. O Stitch está disponível gratuitamente em versão beta, oferecendo uma economia significativa de tempo e esforço para profissionais de web design e UI.

Jules: Seu Engenheiro de Software Pessoal de IA

A Google também apresentou Jules, um agente de codificação de IA que se integra diretamente com repositórios GitHub. Jules pode inspecionar bases de código e executar tarefas de desenvolvimento de software de forma autônoma, como escrever testes de unidade, otimizar código ou corrigir bugs. Ele atua como um engenheiro de software júnior, trabalhando em paralelo em várias tarefas e até executando testes para garantir a qualidade do código. Jules é capaz de adaptar-se ao feedback do usuário e oferece uma interface intuitiva. No momento, a ferramenta está disponível gratuitamente, permitindo até cinco tarefas diárias, o que o torna um recurso valioso para qualquer pessoa com um aplicativo ou site que busca automação no desenvolvimento.

Aprimorando a Interação Humano-IA

Modo IA na Busca do Google: A Busca se Torna Conversacional

Reconhecendo as limitações das buscas tradicionais, a Google lançou o Modo IA em sua ferramenta de busca. Essa funcionalidade transforma a experiência de busca em uma interface de chatbot conversacional, permitindo que os usuários interajam de forma mais natural e recebam respostas geradas por IA. Em vez de percorrer vários resultados de busca, os usuários podem simplesmente fazer perguntas complexas, e a IA buscará informações em centenas de sites, consolidando os dados em uma resposta final. Esse recurso, impulsionado pelo modelo Gemini 2.5 Pro, estará disponível inicialmente para usuários dos EUA e promete uma forma muito mais eficiente e poderosa de encontrar informações online.

Gemini Live: Interação em Tempo Real com IA

O Gemini Live representa um avanço significativo na interação entre humanos e IA. Este assistente de voz em tempo real permite que os usuários conversem com a IA de forma fluida e natural. Além disso, ele pode analisar e responder com base na câmera ou na tela do dispositivo do usuário, tudo em tempo real. Isso abre portas para uma infinidade de casos de uso, como ajuda com tarefas domésticas, resolução de problemas de matemática e tradução instantânea. A Google aprimorou a voz do assistente, tornando-a mais natural e realista, e o Gemini Live está disponível gratuitamente no Google AI Studio e no aplicativo Gemini.

Projeto Astra: O Agente de IA para o Mundo Real

Um dos projetos de pesquisa mais ambiciosos da Google é o Projeto Astra, um protótipo de agente de IA capaz de interação em tempo real e execução autônoma de tarefas diretamente nos dispositivos do usuário. Astra pode usar a câmera do telefone ou laptop para analisar o ambiente, navegar na web, controlar aplicativos e realizar tarefas complexas, como encontrar manuais, comprar peças, agendar compromissos e até mesmo fazer chamadas telefônicas. Como demonstrado no Google I/O, Astra representa um passo gigante em direção a um assistente de IA universal, capaz de lidar com uma ampla gama de tarefas do dia a dia de forma autônoma e eficiente. Embora ainda em fase de pesquisa, a Google planeja lançar o Astra em ondas para usuários Android selecionados ainda este ano.

IA Acessível e Integrada em Dispositivos

Gemma 3n: A IA Poderosa que Roda no Seu Bolso

A Google também apresentou o Gemma 3n, um modelo de IA de baixo consumo de recursos projetado para rodar localmente e offline em dispositivos. Com apenas 2 ou 4 bilhões de parâmetros, o Gemma 3n oferece um desempenho notável, quase tão bom quanto o modelo Claude 3.7 Sonnet da Anthropic, que é muito maior e mais caro. Sua arquitetura otimizada para dispositivos móveis, como o MatFormer, e inovações como embeddings por camada e compartilhamento KVC, reduzem drasticamente o uso de memória e a demanda computacional. O Gemma 3n é multimodal, capaz de entender texto e imagens, e a Google planeja adicionar suporte a áudio e vídeo no futuro. O modelo é de código aberto e está disponível para download, permitindo que desenvolvedores o utilizem em seus próprios dispositivos e aplicações.

Android XR: Realidade Estendida com Inteligência Artificial

Expandindo sua visão para além dos smartphones, a Google anunciou o Android XR, um novo sistema operacional baseado em IA, projetado para headsets e óculos inteligentes. Similar ao Android para smartphones, o Android XR visa oferecer uma experiência imersiva e sem as mãos, combinando o mundo físico com o digital. A plataforma permite a live translation, navegação com direções em tela e acesso a aplicativos e dados do telefone diretamente nos óculos. Em parceria com a Samsung, a Google está desenvolvendo um headset imersivo (codinome Project MuHan) que promete uma experiência semelhante à do Apple Vision Pro, mas com foco em ser mais leve e amplamente acessível. A Google vê o Android XR como o futuro da computação, tão onipresente quanto os smartphones hoje.

Outras Inovações e a Liderança da Google na Corrida da IA

Agentes de IA para Tarefas Complexas: Project Mariner, ChatLLM e DeepAgent

A Google não está apenas investindo em modelos, mas também em agentes de IA avançados. O Project Mariner, um agente de IA experimental, é capaz de realizar tarefas complexas e multi-etapas, como pesquisar e reservar hotéis ou agendar serviços como um chaveiro, tudo de forma autônoma e interagindo com a web. Ele será integrado ao aplicativo Gemini. A empresa Abacus.ai, patrocinadora do vídeo, oferece ferramentas como ChatLLM, uma plataforma que permite usar os melhores modelos de linguagem e geradores de imagem/vídeo em um só lugar, e o DeepAgent, um agente de IA de “nível divino” que pode realizar tarefas altamente complexas de forma autônoma, como criar apresentações de PowerPoint, navegar na web, fazer reservas e resumir e-mails. Essas ferramentas, como visto na demonstração de criação de um dashboard Jira, prometem super-impulsionar a produtividade.

A Google continua aprimorando seu modelo Gemini 2.5 Pro, atualmente o melhor modelo de IA disponível, com atualizações que o tornam ainda mais eficiente e poderoso em tarefas de raciocínio complexo, como matemática e codificação. Este modelo lidera a tabela de classificação do LLM Arena em todas as categorias. Em suma, o Google está dominando a corrida da IA, lançando inovações em todas as frentes, desde a geração de conteúdo até o desenvolvimento de software e a integração de IA em dispositivos do dia a dia. A contínua aposta em IA acessível e on-device sugere um futuro onde a inteligência artificial será uma parte ainda mais intrínseca e fluida de nossas vidas.