Pela primeira vez no mundo, pesquisadores do Centro de Inteligência Artificial Centrado no Homem GrapheneX-UTS da Universidade de Tecnologia de Sydney (UTS), na Austrália, desenvolveram um sistema portátil e não invasivo que pode decodificar pensamentos silenciosos e transformá-los em texto.
A tecnologia poderá ajudar na comunicação de pessoas que não conseguem falar devido a doenças ou lesões, incluindo acidente vascular cerebral ou paralisia. Também poderia permitir a comunicação contínua entre humanos e máquinas, como a operação de um braço biônico ou robô.
O estudo foi selecionado como destaque na conferência NeurIPS , um encontro anual de alto nível que apresenta pesquisas líderes mundiais em inteligência artificial e aprendizado de máquina, realizado em Nova Orleans.
A pesquisa foi liderada pelo professor CT Lin, diretor do GrapheneX-UTS HAI Center, juntamente com o primeiro autor Yiqun Duan e o colega candidato a doutorado Jinzhou Zhou da Faculdade de Engenharia e TI da UTS.
No estudo, os participantes leram silenciosamente trechos de texto enquanto usavam um boné que registrava a atividade elétrica cerebral no couro cabeludo por meio de um eletroencefalograma (EEG).
Uma demonstração da tecnologia pode ser vista neste vídeo
Transcrição
A onda EEG é segmentada em unidades distintas que capturam características e padrões específicos do cérebro humano. Isso é feito por um modelo de IA chamado DeWave desenvolvido pelos pesquisadores. DeWave traduz sinais de EEG em palavras e frases, aprendendo com grandes quantidades de dados de EEG.
"Esta pesquisa representa um esforço pioneiro na tradução de ondas brutas de EEG diretamente para a linguagem, marcando um avanço significativo no campo", disse o ilustre professor Lin.
"É o primeiro a incorporar técnicas de codificação discreta no processo de tradução cérebro-texto, introduzindo uma abordagem inovadora à decodificação neural. A integração com grandes modelos de linguagem também está abrindo novas fronteiras na neurociência e na IA", disse ele.
A tecnologia anterior para traduzir sinais cerebrais em linguagem exigia cirurgia para implantar eletrodos no cérebro, como o Neuralink de Elon Musk, ou digitalização em uma máquina de ressonância magnética, que é grande, cara e difícil de usar na vida diária.
Esses métodos também lutam para transformar sinais cerebrais em segmentos de nível de palavra sem auxílios adicionais, como rastreamento ocular, que restringem a aplicação prática desses sistemas. A nova tecnologia pode ser usada com ou sem rastreamento ocular.
A pesquisa da UTS foi realizada com 29 participantes. Isto significa que é provável que seja mais robusto e adaptável do que a tecnologia de descodificação anterior que só foi testada em um ou dois indivíduos, porque as ondas EEG diferem entre indivíduos.
A utilização de sinais EEG recebidos através de uma tampa, em vez de eléctrodos implantados no cérebro, significa que o sinal é mais ruidoso. Em termos de tradução de EEG, no entanto, o estudo relatou um desempenho de última geração, superando os benchmarks anteriores.
"O modelo é mais adequado para combinar verbos do que substantivos. No entanto, quando se trata de substantivos, vimos uma tendência para pares sinônimos em vez de traduções precisas, como 'o homem' em vez de 'o autor'", disse Duan.
"Acreditamos que isso ocorre porque quando o cérebro processa essas palavras, palavras semanticamente semelhantes podem produzir padrões de ondas cerebrais semelhantes. Apesar dos desafios, nosso modelo produz resultados significativos, alinhando palavras-chave e formando estruturas de frases semelhantes", disse ele.
A pontuação de precisão da tradução está atualmente em torno de 40% no BLEU-1. A pontuação BLEU é um número entre zero e um que mede a semelhança do texto traduzido automaticamente com um conjunto de traduções de referência de alta qualidade. Os pesquisadores esperam ver isso melhorar para um nível comparável à tradução de idiomas tradicionais ou aos programas de reconhecimento de fala, que está próximo de 90%.
A pesquisa segue a tecnologia anterior de interface cérebro-computador desenvolvida pela UTS em associação com a Força de Defesa Australiana, que usa ondas cerebrais para comandar um robô quadrúpede.
Para Antonielle Freitas, DPO do escritório Viseu Advogados, "imaginem o impacto positivo na comunicação para pessoas com dificuldades de fala devido a doenças ou lesões! Além disso, essa tecnologia abre portas para uma interação mais avançada entre humanos e máquinas, como no controle de braços biônicos. Contudo, apesar dessas perspectivas empolgantes, é crucial considerar a privacidade dos usuários. Essas inovações destacam a importância da regulamentação da Inteligência Artificial para garantir que avancemos de maneira ética e responsável.O desenvolvimento é fascinante, mas devemos garantir que a tecnologia seja usada para o bem, respeitando sempre os direitos individuais."