Gigantes da tecnologia estão se unindo a pesquisadores da Universidade de Illinois para melhorar o reconhecimento de fala para pessoas com deficiência.
Uma nova iniciativa de pesquisa visa tornar a tecnologia de reconhecimento de voz mais útil para pessoas com diversos padrões de fala e deficiências.
O Speech Accessibility Project, lançado na segunda-feira, é liderado pela Universidade de Illinois em Urbana-Champaign. Amazon, Apple, Google, Meta e Microsoft estão apoiando o projeto, bem como um punhado de organizações sem fins lucrativos para deficientes.
O reconhecimento de voz, que pode ser encontrado em assistentes de voz como Siri e Alexa, bem como em ferramentas de tradução, tornou-se parte da vida cotidiana de muitas pessoas. Mas esses sistemas nem sempre reconhecem certos padrões de fala, particularmente aqueles associados a deficiências. Isso inclui a fala afetada pela doença de Lou Gehrig ou ELA, doença de Parkinson, paralisia cerebral e síndrome de Down. Como resultado, muitas pessoas podem não conseguir usar efetivamente essas tecnologias de fala.
O Speech Accessibility Project trabalhará para mudar isso criando um conjunto de dados de amostras de fala representativas que podem ser usadas para treinar modelos de aprendizado de máquina, para que eles possam entender melhor uma variedade de padrões de fala.
“Um dos grupos que mais se beneficiaria [da tecnologia de fala] são pessoas com deficiências físicas de muitos tipos diferentes. E muitas vezes, essas são as pessoas para quem a tecnologia de fala não funciona”, disse Mark Hasegawa-Johnson , professor de engenharia elétrica e de computação da UIUC que está liderando o projeto.
“A tecnologia de fala depende de dados de treinamento”, acrescentou. “É uma tecnologia de inteligência artificial, por isso exige que tenhamos dados suficientes para poder desenvolver tecnologia que realmente funcione para pessoas com um tipo específico de padrão de fala. E muitas vezes no passado, simplesmente não tínhamos informações suficientes sobre os padrões de fala de pessoas com diferentes tipos de deficiência ou com diferentes tipos de padrões de fala atípicos.”
O projeto irá coletar amostras de fala de pessoas que representam uma diversidade de padrões de fala. Pesquisadores da Universidade de Illinois recrutarão voluntários pagos para enviar amostras de voz gravadas e criarão um conjunto de dados “privado e desidentificado” que será usado para treinar modelos de aprendizado de máquina para entender melhor uma variedade de padrões de fala. Inicialmente, o projeto se concentrará no inglês americano.
A Davis Phinney Foundation, que apoia pessoas com Parkinson, e a Team Gleason, que atende pessoas com ELA, apoiarão o empreendimento. As organizações comunitárias ajudarão no recrutamento de participantes e testes de usuários, e oferecerão feedback ao longo do projeto. Qualquer pessoa que queira se envolver no Projeto de Acessibilidade de Fala pode visitar o site.
Muitas empresas de tecnologia, incluindo as associadas a este projeto, têm trabalhado para tornar seus produtos e serviços mais acessíveis a todos os usuários.
O Google lançou aplicativos como o Lookout, que ajuda pessoas cegas ou com baixa visão a identificar objetos e moedas, bem como o Project Relate, desenvolvido para ajudar pessoas com deficiências de fala a se comunicarem mais facilmente com outras pessoas. A Apple lançou um recurso de detecção de pessoas em 2020 que permite que usuários de iPhone e iPad cegos e com baixa visão saibam o quão próximo alguém está deles e atualizou seu leitor de tela VoiceOver este ano para oferecer suporte a mais de 20 idiomas. O Facebook, agora sob a controladora Meta, trabalhou para melhorar as descrições de fotos para usuários cegos e com deficiência visual, além de lançar legendas automáticas no IGTV, Stories e vídeos de feed do Instagram.
A Amazon adicionou vários recursos de acessibilidade à sua linha Echo de alto-falantes e telas inteligentes, como fala em texto e “Show and Tell”, que ajuda pessoas com deficiência visual a identificar objetos domésticos do dia a dia. E a Microsoft fez ondas em 2018 quando lançou o Xbox Adaptive Controller, um dispositivo projetado para ajudar jogadores de todas as habilidades a jogar, seguido pelo Surface Adaptive Kit em 2021, que inclui uma variedade de decalques irregulares para identificar teclas, portas e cabos. Em maio, lançou um Adaptive Mouse, quatro Adaptive Buttons e o Microsoft Adaptive Hub para emparelhar vários dispositivos de entrada sem fio.