Exclusivo: a Amazon está usando visão computacional para reconhecer produtos, sem a necessidade de códigos de barras. O sistema é projetado com robôs em mente.
Os robôs podem ser o futuro, mas os braços robóticos aparentemente não são bons em usar uma tecnologia antiga e inabalável: o código de barras. Os códigos de barras podem ser difíceis de encontrar e podem ser afixados em produtos de formato estranho, algo que os robôs não conseguem resolver muito bem.
Como resultado, a empresa disse na sexta-feira que tem um plano para eliminar o código de barras.
Usando fotos de itens nos armazéns da Amazon para treinar um modelo de computador, a gigante do comércio eletrônico desenvolveu um sistema de câmera que pode monitorar itens fluindo um a um pelas correias transportadoras para garantir que correspondam às suas imagens. Eventualmente, os especialistas em IA da Amazon e os roboticistas querem combinar a tecnologia com robôs que identificam itens enquanto os pegam e os viram.
“Resolver esse problema, para que os robôs possam pegar itens e processá-los sem precisar encontrar e digitalizar um código de barras, é fundamental”, disse Nontas Antonakos, gerente de ciência aplicada do grupo de visão computacional da Amazon em Berlim. “Isso nos ajudará a levar os pacotes aos clientes com mais rapidez e precisão.”
O sistema, chamado de identificação multimodal, não substituirá totalmente os códigos de barras tão cedo. Os produtos nos armazéns da Amazon precisarão ter códigos de barras, desde que as empresas externas que os fabricam e enviem dependam da tecnologia para identificar e rastrear o estoque. O novo sistema da Amazon está atualmente em uso em instalações em Barcelona, na Espanha, e em Hamburgo, na Alemanha, disse a empresa, acrescentando que já está acelerando o tempo necessário para processar pacotes lá. A tecnologia será compartilhada entre os negócios da Amazon, então é possível que um dia você veja uma versão dela em um Whole Foods ou outra rede de propriedade da Amazon com lojas físicas.
A Amazon incorporou a visão computacional em outros produtos. Você pode perguntar a um monitor inteligente do Echo Show: “Alexa, o que estou segurando?” para obter ajuda para reconhecer objetos pela casa. O recurso é chamado de Mostrar e Contar e foi projetado pensando em pessoas com deficiência visual. Fabricantes de smartphones e empresas de mídia social também incluíram recursos de IA em aplicativos de câmera e fotos, categorizando fotos automaticamente, por exemplo.
O problema que o sistema elimina – itens incorretos entrando na linha para serem enviados aos clientes – não acontece com muita frequência, diz a Amazon. Mas mesmo erros pouco frequentes resultam em lentidão significativa ao considerar quantos itens um único depósito processa em um dia.
Os especialistas em IA da Amazon tiveram que começar criando uma biblioteca de imagens de produtos, algo que a empresa não tinha motivo para criar antes deste projeto. As próprias imagens, bem como os dados sobre as dimensões dos produtos, alimentaram as primeiras versões do algoritmo, e as câmeras capturam continuamente novas imagens de itens para treinar o modelo.
A taxa de precisão do algoritmo estava entre 75% e 80% quando usado pela primeira vez, o que a Amazon considerou um começo promissor. A empresa diz que a precisão está agora em 99%. O sistema enfrentou um soluço inicial quando não conseguiu detectar as diferenças de cor. Durante uma promoção do Prime Day, o sistema não conseguiu distinguir entre duas cores diferentes de Echo Dots. A única diferença entre os pacotes era um pequeno ponto azul ou cinza. Com algumas reformulações, o sistema de identificação agora pode atribuir pontuações de confiança às suas classificações que apenas sinalizam itens que ele tem certeza de que estão incorretos.
A equipe de IA da Amazon diz que será um desafio ajustar o sistema de identificação multimodal para avaliar os produtos que estão sendo manuseados por pessoas, e é por isso que o objetivo final é fazer com que os robôs os manipulem.