Experimentei o novo gerador de imagens de IA do Google Bard. Veja como acabou

  • Google lançou atualizações no seu assistente de conversação Bard
  • Agora o Bard é capaz de gerar imagens a partir de descrições textuais dos usuários
  • O Google busca continuamente aprimorar as habilidades e segurança do Bard à medida que a inteligência artificial avança
  • Com seu primeiro aniversário se aproximando, a ferramenta de IA conversacional do Google, Bard, está recebendo outra atualização. Avaliações iniciais encontraram o Bard atrasado em relação a chatbots concorrentes em parte porque suas respostas eram menos humanas. Desde então, o Google integrou seu modelo de IA Gemini, o que ajudou o Bard a expandir seu treinamento para além do texto para vídeo, áudio e fotos, e agora ele busca dar passos adicionais em utilidade, à medida que a IA gerativa continua sendo um assunto quente.

    Em uma postagem no blog na quinta-feira, o líder de produto do Bard, Jack Krawczyk, disse que a ferramenta agora permite que os usuários gerem imagens gratuitamente. Quando alguém digita uma dica, como “crie uma imagem de um balão de ar quente voando sobre as montanhas ao por do sol”, o Bard gera o que o Google descreve como “visuais personalizados e amplos para ajudar a dar vida à sua ideia”. No entanto, leva algum tempo – cerca de 13 segundos exatos. E enquanto a maioria das consultas que tentamos gerou imagens e/ou respostas relevantes, ele não tem uma taxa de precisão de 100%. Por exemplo, quando pedi ao Bard para criar uma imagem para uma matéria sobre as atualizações mais recentes da ferramenta, ele se recusou a gerar a imagem solicitada.

    No último ano, o mercado foi inundado com chatbots como o ChatGPT da OpenAI, o Bing AI da Microsoft, o Claude da Anthropic – e, sim, o Bard do Google – à medida que as grandes empresas de tecnologia buscam assumir a liderança na próxima onda da pesquisa. Esses chatbots acessam enormes conjuntos de dados e usam grandes modelos de linguagem para fornecer resposta em texto e agora imagens ou mesmo vídeos, em resposta às consultas dos consumidores. É um campo em rápida evolução que já se aproximou mais da conversação humana. No entanto, enquanto os bots podem entregar respostas com confiança, nem sempre são precisos – e permanecem vulneráveis a abusos.

    A postagem do Google observou que o Bard faz uma distinção entre visuais criados com o Bard e arte criada por humanos originais, e embute marcas d’água nos pixels das imagens geradas. Para testar isso, pedi que criasse uma imagem do Nascimento de Vênus, de Botticelli. Ofereceu uma réplica, mas mais descuidada. Aquelas caras! Aquelas mãos! No entanto, há a opção de relatar um problema legal e dar a cada imagem um polegar para cima ou para baixo. Na sequência de deepfakes de Taylor Swift, o Google disse buscar limitar “conteúdo violento, ofensivo ou sexualmente explícito” e aplica filtros para evitar a geração de imagens de pessoas nomeadas.