A nova tecnologia de IA do Google permite que você comande robôs para jogar fora seu lixo –

  • O Google está ajudando robôs a realizar tarefas de forma mais rápida e eficiente usando tecnologias como sistemas de inteligência artificial (IA) que alimentam chatbots, como o Bard, ChatGPT, o Claude 2 e outros.
  • O Robotics Transformer 2 do Google, ou RT-2, é um “modelo de visão-linguagem-ação (VLA) pioneiro em seu tipo”, segundo Vincent Vanhoucke, chefe de robótica do Google DeepMind.
  • O RT-2 possui semelhanças com modelos de linguagem grandes que alimentam chatbots de IA. Ele é treinado com base em dados de texto (e imagem) encontrados na Web para “produzir diretamente ações robóticas”.

Vanhoucke disse que fazer com que robôs usem IA para entender o mundo ao seu redor é mais difícil do que o necessário para criar chatbots. Enquanto um chatbot de IA só precisa absorver uma grande quantidade de dados de texto sobre um assunto específico e ser capaz de organizar essas informações de maneira fácil para os seres humanos entenderem, um robô precisa literalmente entender o mundo ao seu redor. É uma coisa reconhecer uma maçã. É outra coisa distinguir entre uma maçã Red Delicious e uma bola vermelha e pegar o objeto correto.

Com o lançamento do ChatGPT da OpenAI no final do ano passado, houve uma corrida de empresas trazendo tecnologia de IA para o mercado. Chatbots de IA já estão se infiltrando na codificação, no processo de inscrição na faculdade e em aplicativos de namoro. O Google em si está tornando a inteligência artificial um foco central de seus negócios – como evidenciado pelo fato de que os apresentadores da empresa disseram “IA” mais de 140 vezes durante o evento principal de duas horas da conferência de desenvolvedores do Google I/O em maio.

A robótica é apenas outro campo em que modelos de IA podem mudar a rapidez com que a tecnologia fica mais inteligente. E para os investidores do Google, os avanços da empresa em robótica podem ser bons negócios. A indústria de robótica industrial atualmente está avaliada em US$ 30 bilhões e espera-se que atinja US$ 60 bilhões até 2030, de acordo com a Grand View Research.

No passado, engenheiros que procuravam treinar um robô para, digamos, jogar fora um pedaço de lixo, primeiro teriam que treinar o robô para identificar o lixo (o que envolve muitos parâmetros), inclinar-se, pegá-lo, levantá-lo, inclinar-se novamente, identificar uma lixeira, mover seu braço robótico sobre a lixeira e jogar o lixo fora. Era, como você pode ter adivinhado, um processo lento e monótono. O Google diz que com o RT-2, que usa uma quantidade enorme de dados de imagem encontrados online, os robôs podem ser treinados rapidamente para entender o que é lixo e como pegá-lo e jogá-lo fora. Um robô pode usar uma pequena quantidade de dados de treinamento para “transferir conceitos incorporados em seus dados de treinamento de linguagem e visão para direcionar ações de robôs – mesmo para tarefas para as quais nunca foi treinado”, disse Vanhoucke. Em uma demonstração dada ao The New York Times, um robô foi capaz de identificar e levantar um dinossauro de brinquedo quando solicitado a pegar um animal extinto entre um grupo de outros brinquedos. Em outro desafio, o robô foi capaz de pegar um carro Volkswagen de brinquedo e movê-lo em direção a uma bandeira alemã.

Nota dos editores: A CNET está usando um motor de IA para ajudar a criar algumas histórias. Para mais informações, veja este post.

“`html
  • O Google está ajudando robôs a realizar tarefas de forma mais rápida e eficiente usando tecnologias como sistemas de inteligência artificial (IA) que alimentam chatbots, como o Bard, ChatGPT, o Claude 2 e outros.
  • O Robotics Transformer 2 do Google, ou RT-2, é um “modelo de visão-linguagem-ação (VLA) pioneiro em seu tipo”, segundo Vincent Vanhoucke, chefe de robótica do Google DeepMind.
  • O RT-2 possui semelhanças com modelos de linguagem grandes que alimentam chatbots de IA. Ele é treinado com base em dados de texto (e imagem) encontrados na Web para “produzir diretamente ações robóticas”.

Vanhoucke disse que fazer com que robôs usem IA para entender o mundo ao seu redor é mais difícil do que o necessário para criar chatbots. Enquanto um chatbot de IA só precisa absorver uma grande quantidade de dados de texto sobre um assunto específico e ser capaz de organizar essas informações de maneira fácil para os seres humanos entenderem, um robô precisa literalmente entender o mundo ao seu redor. É uma coisa reconhecer uma maçã. É outra coisa distinguir entre uma maçã Red Delicious e uma bola vermelha e pegar o objeto correto.

Com o lançamento do ChatGPT da OpenAI no final do ano passado, houve uma corrida de empresas trazendo tecnologia de IA para o mercado. Chatbots de IA já estão se infiltrando na codificação, no processo de inscrição na faculdade e em aplicativos de namoro. O Google em si está tornando a inteligência artificial um foco central de seus negócios – como evidenciado pelo fato de que os apresentadores da empresa disseram “IA” mais de 140 vezes durante o evento principal de duas horas da conferência de desenvolvedores do Google I/O em maio.

A robótica é apenas outro campo em que modelos de IA podem mudar a rapidez com que a tecnologia fica mais inteligente. E para os investidores do Google, os avanços da empresa em robótica podem ser bons negócios. A indústria de robótica industrial atualmente está avaliada em US$ 30 bilhões e espera-se que atinja US$ 60 bilhões até 2030, de acordo com a Grand View Research.

No passado, engenheiros que procuravam treinar um robô para, digamos, jogar fora um pedaço de lixo, primeiro teriam que treinar o robô para identificar o lixo (o que envolve muitos parâmetros), inclinar-se, pegá-lo, levantá-lo, inclinar-se novamente, identificar uma lixeira, mover seu braço robótico sobre a lixeira e jogar o lixo fora. Era, como você pode ter adivinhado, um processo lento e monótono. O Google diz que com o RT-2, que usa uma quantidade enorme de dados de imagem encontrados online, os robôs podem ser treinados rapidamente para entender o que é lixo e como pegá-lo e jogá-lo fora. Um robô pode usar uma pequena quantidade de dados de treinamento para “transferir conceitos incorporados em seus dados de treinamento de linguagem e visão para direcionar ações de robôs – mesmo para tarefas para as quais nunca foi treinado”, disse Vanhoucke. Em uma demonstração dada ao The New York Times, um robô foi capaz de identificar e levantar um dinossauro de brinquedo quando solicitado a pegar um animal extinto entre um grupo de outros brinquedos. Em outro desafio, o robô foi capaz de pegar um carro Volkswagen de brinquedo e movê-lo em direção a uma bandeira alemã.

Nota dos editores: A CNET está usando um motor de IA para ajudar a criar algumas histórias. Para mais informações, veja este post.

“`html
  • O Google está ajudando robôs a realizar tarefas de forma mais rápida e eficiente usando tecnologias como sistemas de inteligência artificial (IA) que alimentam chatbots, como o Bard, ChatGPT, o Claude 2 e outros.
  • O Robotics Transformer 2 do Google, ou RT-2, é um “modelo de visão-linguagem-ação (VLA) pioneiro em seu tipo”, segundo Vincent Vanhoucke, chefe de robótica do Google DeepMind.
  • O RT-2 possui semelhanças com modelos de linguagem grandes que alimentam chatbots de IA. Ele é treinado com base em dados de texto (e imagem) encontrados na Web para “produzir diretamente ações robóticas”.