Óculos com IA podem ler um discurso silencioso

O EchoSpeech usa alto-falantes e microfones montados em uma estrutura de vidro, emitindo ondas sonoras inaudíveis em direção à pele. O EchoSpeech coleta pequenas deformações da pele induzidas por expressões silenciosas e as utiliza para detectar a fala silenciosa analisando ecos de várias rotas.

O uso de interfaces de fala silenciosa (SSI) ganhou popularidade recentemente. A fala silenciosa tem mais situações de aplicação do que a fala falada porque não exige que os usuários vocalizem sons, o que tem limitações.

Ruidong Zhang, um estudante de doutorado em ciência da informação, está usando o EchoSpeech. Essa interface de reconhecimento de fala silenciosa usa detecção acústica e inteligência artificial para reconhecer continuamente até 31 comandos não vocalizados com base nos movimentos dos lábios e da boca.

De acordo com os pesquisadores, a interface vestível de baixo consumo de energia, desenvolvida pelo Laboratório de Interfaces de Computador Inteligente para Interações Futuras (SciFi) da Cornell, leva apenas alguns minutos de dados de treinamento do usuário antes de poder reconhecer comandos e executar em um smartphone.

Os óculos EchoSpeech, equipados com microfones e alto-falantes do tamanho de borrachas de lápis, se transformam em um sistema de sonar vestível alimentado por IA, enviando e recebendo ondas sonoras pelo rosto e rastreando os movimentos da boca. Os perfis de eco são então analisados ​​em tempo real por um sistema de aprendizado profundo construído por pesquisadores do SciFi Lab, com cerca de 95% de precisão.

Zhang é o principal autor de “EchoSpeech: Continuous Silent Speech Recognition on Minimally-obtrusive Eyewear Powered by Acoustic Sensing”, que será apresentado este mês em Hamburgo, Alemanha, na Conferência da Association for Computing Machinery on Human Factors in Computing Systems (CHI ).

Óculos com IA podem ler um discurso silencioso

Zhang, da Universidade de Cornell, disse: “Para pessoas que não conseguem vocalizar som, essa tecnologia de fala silenciosa pode ser uma excelente entrada para um sintetizador de voz. Isso poderia devolver a voz aos pacientes.”

O EchoSpeech pode ser usado para se comunicar com outras pessoas via smartphone em locais onde a voz é inconveniente ou imprópria, como um restaurante movimentado ou uma biblioteca silenciosa, com mais desenvolvimento. A interface de fala silenciosa também pode ser utilizada com ferramentas de design, como CAD, quando conectada a uma caneta, eliminando a necessidade de teclado e mouse.

Ele também disse, “Estamos movendo o sonar para o corpo.”

O SciFi Lab criou vários dispositivos vestíveis que usam aprendizado de máquina e pequenas câmeras de vídeo em miniatura para rastrear movimentos corporais, manuais e faciais. O laboratório mudou recentemente de câmeras para sensores acústicos para rastrear os movimentos do rosto e do corpo, citando a excelente duração da bateria, segurança e privacidade mais rígidas e equipamentos menores e mais compactos como motivos. O EchoSpeech é baseado na tecnologia de detecção acústica relacionada ao laboratório, EarIO, um fone de ouvido usado que registra movimentos faciais.

De acordo com Cheng Zhang, a maioria das tecnologias de reconhecimento de fala silenciosa é limitada a um pequeno conjunto de pedidos preparados. Necessita que o usuário enfrente ou use uma câmera, o que não é nem prático nem praticável. Ele observou que também há riscos significativos de privacidade com câmeras vestíveis tanto para o usuário quanto para outras pessoas com quem o usuário interage.

EchoSpeech, uma tecnologia de detecção acústica, elimina a necessidade de câmeras de vídeo vestíveis. De acordo com François Guimbretière, professor de ciência da informação na Cornell Bowers CIS e co-autor, Como os dados de áudio são significativamente menores do que os dados de imagem ou vídeo, eles requerem menos largura de banda para analisar. Pode ser transmitido para um smartphone em tempo real via Bluetooth.

Ele disse, “E porque os dados são processados ​​localmente em seu smartphone, em vez de enviados para a nuvem. Informações sensíveis à privacidade nunca saem do seu controle.”

De acordo com Cheng Zhang, a duração da bateria também aumenta enormemente: dez horas com detecção acústica contra 30 minutos com uma câmera.

Os pesquisadores do SciFi Lab estão investigando aplicativos de vidro inteligente que rastreiam os movimentos faciais, dos olhos e da parte superior do corpo em trabalhos futuros.

O pesquisador disse, “Achamos que o vidro será uma importante plataforma de computação pessoal para entender as atividades humanas no dia a dia.”

A National Science Foundation contribuiu para o financiamento deste estudo.

Referência do periódico:

  1. Ruidong Zhang, Zhengnan Lai, et al. EchoSpeech: reconhecimento contínuo de fala silenciosa em óculos minimamente intrusivos alimentado por detecção acústica. 10.1145/3544548.3580801
About the author : Melhoressuplementos
Óculos com IA podem ler um discurso silencioso

Os suplementos alimentares são uma forma prática de complementar a alimentação e fornecer nutrientes importantes para o corpo.

Leave A Comment

Emagrecimento

Óculos com IA podem ler um discurso silencioso

Emagrecimento

Óculos com IA podem ler um discurso silencioso
Óculos com IA podem ler um discurso silencioso

Receba ofertas

Receba Grandes Ofertas: Economize Dinheiro em Suas Compras

Não perca tempo e cadastre-se agora mesmo na promoção Receba Grandes Ofertas. É uma oportunidade única de economizar dinheiro em suas compras e ainda receber brindes e promoções exclusivas. Não deixe essa chance passar!