O gerador de imagens Whisk AI do Google permite que você faça remixes a partir de escolhas rápidas –

  • Google lançou a plataforma Whisk, um novo gerador de imagens com IA.
  • Whisk permite que você use imagens como prompts em vez de textos longos.
  • Com Whisk, é possível criar imagens únicas e personalizadas.

Google apresentou uma nova plataforma lúdica de geração de imagens com IA, chamada Whisk, que permite que você a inicie com imagens em vez de prompts de texto prolixos. Com o Whisk, anunciado nesta semana, você arrasta imagens para dar à ferramenta uma ideia do que você está procurando. Ele pede para você fazer upload de uma imagem de qualquer assunto (como uma pessoa ou animal), uma cena (como uma praia, selva ou paisagem urbana) e depois uma imagem que reflita o estilo desejado (como retrô, emo ou anime). A partir daí, você pode “remixar” os elementos para criar imagens exclusivas na forma de adesivos, pins de esmalte ou brinquedos digitais de pelúcia.

Os usuários podem ajustar ainda mais as criações finais, que podem evoluir durante o processo de geração, ajustando os prompts – por exemplo, pedindo à ferramenta para alterar a altura, penteado ou tom de pele do sujeito. Uma ferramenta experimental dos Laboratórios Google, o Whisk funciona no modelo de IA Gemini da empresa, que escreve automaticamente uma legenda detalhada para as imagens de entrada. Essas descrições são então inseridas no mais novo modelo de geração de imagem do Google, Imagen 3, para produzir uma nova imagem.

Dois anos após a estreia bombástica do ChatGPT da OpenAI, as empresas de tecnologia continuam a explorar o que a IA generativa é capaz de fazer e a lançar novas funcionalidades. Somente neste mês, isso incluiu a ferramenta de geração de vídeos Sora da OpenAI e novos recursos de Inteligência da Apple no iOS 18.2, como Genmoji, Visual Intelligence e integrações do ChatGPT com Siri. Enquanto isso, o Google lançou o Gemini 2.0 e um lançamento limitado de seu agente de IA assistido por visão do Projeto Astra. Em seu post no blog, o Google descreveu o Whisk como mais uma ferramenta criativa do que um editor de imagens tradicional. “Nós o construímos para exploração visual rápida, não para edições perfeitas de pixels”, disse o post do blog. “É sobre explorar ideias de novas e criativas maneiras, permitindo que você trabalhe em dezenas de opções e faça o download das que mais gosta.”