IA e você: imagens embaraçosas de Gêmeos do Google, VCs e a ‘abundância’ mágica da IA -
A competição entre empresas como Anthropic, OpenAI, Google, Meta, Microsoft e Perplexity para conquistar usuários levou esses fabricantes de chatbots de IA gerativa a empurrar os limites do que seus sistemas podem fazer e apressar atualizações e novas versões ao mercado. Mas o estado atual do Gemini (anteriormente Bard) do Google nos lembra que a IA gerativa está em progresso e que os desenvolvedores devem fazer uma pausa e realizar testes de qualidade apropriados antes de lançar coisas ao público. Como o Gemini, o modelo de linguagem grande do Google tem entregado resultados tão fora dos trilhos que na semana passada pausou sua função de geração de imagem de três semanas para corrigir “imprecisões em algumas representações históricas de geração de imagens”, disse a empresa em uma publicação de 22 de fevereiro no X.
Quais imprecisões históricas estamos falando? “Imagens que mostravam pessoas de cor com uniformes militares alemães da Segunda Guerra Mundial criadas com o chatbot Gemini do Google amplificaram as preocupações de que a inteligência artificial poderia acrescentar aos já vastos pools de desinformação da internet à medida que a tecnologia lida com questões sobre raça”, escreveu o New York Times em uma matéria com o título “Imagens de chatbots da Google colocam pessoas de cor em uniformes da era nazista”. “Além das imagens históricas falsas, usuários criticaram o serviço por sua recusa em retratar pessoas brancas: quando os usuários pediram ao Gemini para mostrar imagens de casais chineses ou negros, ele o fez, mas quando pediram para gerar imagens de casais brancos, recusou-se”, acrescentou o NYT. “De acordo com capturas de tela, o Gemini disse ser ‘incapaz de gerar imagens de pessoas com base em especificidades étnicas e tons de pele’, acrescentando que ‘isso é para evitar perpetuar estereótipos e vieses prejudiciais'”. Ah, se apenas o Google tivesse os recursos, incluindo equipes de QA, para identificar esses tipos de potenciais problemas antes de lançar ferramentas para seus bilhões de usuários.
Um dia após seu mea culpa nas mídias sociais, o Google postou um pedido de desculpas mais detalhado em um blog com o título “A geração de imagens do Gemini deu errado. Faremos melhor”. Disse que os resultados não eram o que “pretendian” e levaram a “imagens que eram embaraçosas e erradas”. “Então, o que deu errado?”, escreveu Prabhakar Raghavan, vice-presidente sênior do Google. “Em poucas palavras, duas coisas. Primeiro, nosso ajuste para garantir que o Gemini mostrasse uma variedade de pessoas falhou em considerar casos que claramente não deveriam mostrar variedade. E segundo, com o tempo, o modelo ficou muito mais cauteloso do que pretendíamos e se recusou a responder a certos prompts inteiramente – interpretando alguns prompts muito anódinos como sensíveis”. Raghavan disse que a empresa aprendeu algumas lições, incluindo que precisa melhorar a geração de imagens de pessoas, um processo que incluirá “testes extensivos”. A empresa também está recomendando que você realmente leve os resultados do Gemini com um grão de sal e em vez disso confie na Busca do Google para informações, especialmente sobre notícias recentes. Esse é um bom conselho dado os exemplos postados mostrando respostas fora de contexto a alguns prompts de usuários e resultados questionáveis sobre eventos atuais.
Segundo analistas de venture capital da firma A16z, que foi cofundada pelo pioneiro do navegador e grande investidor em IA Marc Andreessen, a IA gerativa trará abundância para os consumidores ao reduzir custos e melhorar produtividade e qualidade de vida. Por outro lado, o empresário Jeffrey Katzenberg, cofundador da Dreamworks Animation, alertou que a IA pode substituir até 90% dos artistas de animação e ter grande impacto na indústria de mídia e entretenimento.