A Google DeepMind lançou nesta terça-feira (05) o Genie 3, nova versão do modelo de inteligência artificial capaz de criar, em tempo real, mundos 3D interativos para usuários humanos e agentes de IA.
Entre as principais novidades estão a ampliação do tempo de interação — que agora dura alguns minutos — e a memória visual que mantém a posição de objetos por até um minuto, mesmo quando o usuário desvia o olhar. A prévia ficará restrita a um grupo reduzido de pesquisadores e criadores com o objetivo de avaliar riscos e definir formas de mitigação.
Projetado para fins como educação, entretenimento e treinamento de robôs, o Genie transforma comandos de texto em ambientes navegáveis semelhantes a videogames, gerados integralmente por IA.
O novo modelo combina recursos do Genie 2, lançado em dezembro de 2024, com tecnologias do Veo 3, sistema do Google especializado em vídeo que compreende melhor leis físicas. A junção resulta em experiências mais realistas e duradouras, segundo a empresa.
“É o primeiro modelo de mundo interativo, em tempo real e de uso geral”, afirmou Shlomi Fruchter, diretor de pesquisa da DeepMind, em coletiva de imprensa citada pelo TechCrunch. De acordo com ele, o sistema não se limita a um tipo específico de cenário e pode gerar ambientes fotorealistas ou imaginários.
Além do maior tempo de interação e da memória visual, o Genie 3 produz mundos em resolução 720p a 24 quadros por segundo. Eventos podem ser ativados por comando, permitindo alterar o clima ou inserir personagens durante a experiência. Ainda há limitações, como formas restritas de interação e geração de textos legíveis apenas quando incluídos na descrição inicial.

Imagem: Google via olhardigital.com.br
A DeepMind destaca aplicações em educação, games e prototipagem criativa, mas ressalta que o principal valor do Genie 3 é treinar agentes de IA para tarefas gerais — passo considerado essencial rumo à inteligência artificial geral (AGI). “Modelos de mundo são fundamentais nesse caminho, especialmente para agentes incorporados, nos quais simular cenários reais é desafiador”, disse o pesquisador Jack Parker-Holder.
Diferentemente de motores de física tradicionais, o Genie 3 aprende sozinho como o mundo funciona. O modelo é autoregressivo, gerando um quadro por vez e analisando o anterior para decidir o próximo, o que confere consistência e uma noção de física semelhante à humana. Segundo a empresa, esse mecanismo favorece o aprendizado prático de agentes de IA dentro dos ambientes simulados.
Com informações de Olhar Digital