O braço de pesquisa do Google, DeepMind, revelou mais um modelo de IA, chamado Genie, que consegue criar ambientes virtuais interativos gerados de forma não supervisionada a partir de vídeos do YouTube. Segundo um paper publicado pela DeepMind, Genie pode gerar “um número infinito de mundos 2D jogáveis de ação”. Em um tweet, o chefe da equipe de abertura de finalidades da DeepMind, Tim Rocktäschel, mostrou exemplos de mundos gerados por Genie com estéticas de argila, desenho e cidade futurista.
Quando um usuário seleciona uma ação nesses mundos gerados, o Genie gera o próximo quadro sem saber previamente quais partes da imagem correspondem aos personagens. Em vez disso, o Genie aprende isso durante o treinamento. Além disso, o Genie poderia gerar simulações em 3D para treinar agentes embarcados como robôs. Por enquanto, o Genie está em estágio inicial de pesquisa e não será disponibilizado ao público.
Startups como ElevenLabs e a Adobe também estão desenvolvendo ferramentas de áudio generativo. A ElevenLabs foca em efeitos sonoros gerados a partir de textos como “ondas quebrando” ou “motor de carro”. Já a Adobe tem o Project Music GenAI Control que gera música a partir de prompts e permite editá-la, como ajustar tempo, estrutura, loops e intensidade. Assim como o Photoshop para imagens, essa ferramenta poderia ajudar criadores a gerar sons para introduções, fundos e outros áudios de forma mais fácil. Por enquanto, não há previsão de lançamento para essas ferramentas.