Home / Tecnologia / Google DeepMind apresenta Genie 3, IA que constrói mundos 3D interativos em tempo real

Google DeepMind apresenta Genie 3, IA que constrói mundos 3D interativos em tempo real

Spread the love

A Google DeepMind lançou nesta terça-feira (05) o Genie 3, nova versão do modelo de inteligência artificial capaz de criar, em tempo real, mundos 3D interativos para usuários humanos e agentes de IA.

Entre as principais novidades estão a ampliação do tempo de interação — que agora dura alguns minutos — e a memória visual que mantém a posição de objetos por até um minuto, mesmo quando o usuário desvia o olhar. A prévia ficará restrita a um grupo reduzido de pesquisadores e criadores com o objetivo de avaliar riscos e definir formas de mitigação.

Projetado para fins como educação, entretenimento e treinamento de robôs, o Genie transforma comandos de texto em ambientes navegáveis semelhantes a videogames, gerados integralmente por IA.

O novo modelo combina recursos do Genie 2, lançado em dezembro de 2024, com tecnologias do Veo 3, sistema do Google especializado em vídeo que compreende melhor leis físicas. A junção resulta em experiências mais realistas e duradouras, segundo a empresa.

“É o primeiro modelo de mundo interativo, em tempo real e de uso geral”, afirmou Shlomi Fruchter, diretor de pesquisa da DeepMind, em coletiva de imprensa citada pelo TechCrunch. De acordo com ele, o sistema não se limita a um tipo específico de cenário e pode gerar ambientes fotorealistas ou imaginários.

Além do maior tempo de interação e da memória visual, o Genie 3 produz mundos em resolução 720p a 24 quadros por segundo. Eventos podem ser ativados por comando, permitindo alterar o clima ou inserir personagens durante a experiência. Ainda há limitações, como formas restritas de interação e geração de textos legíveis apenas quando incluídos na descrição inicial.

Google DeepMind apresenta Genie 3, IA que constrói mundos 3D interativos em tempo real - Imagem do artigo original

Imagem: Google via olhardigital.com.br

A DeepMind destaca aplicações em educação, games e prototipagem criativa, mas ressalta que o principal valor do Genie 3 é treinar agentes de IA para tarefas gerais — passo considerado essencial rumo à inteligência artificial geral (AGI). “Modelos de mundo são fundamentais nesse caminho, especialmente para agentes incorporados, nos quais simular cenários reais é desafiador”, disse o pesquisador Jack Parker-Holder.

Diferentemente de motores de física tradicionais, o Genie 3 aprende sozinho como o mundo funciona. O modelo é autoregressivo, gerando um quadro por vez e analisando o anterior para decidir o próximo, o que confere consistência e uma noção de física semelhante à humana. Segundo a empresa, esse mecanismo favorece o aprendizado prático de agentes de IA dentro dos ambientes simulados.

Com informações de Olhar Digital

Deixe um Comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *