Você fala, eles fazem. Os assistentes de voz foram integrados aos smartphones alguns anos atrás e seus usuários desde então estão cada vez mais dependentes dessa tecnologia para simplificar e automatizar as tarefas no nosso dia a dia. Se você nunca usou esse recurso, mas tem um smartphone recente com Android (sistema operacional mais utilizado em celulares inteligentes), por exemplo, é só configurá-lo e começar a dizer coisas como "ligue para casa", "navegar para a Avenida Paulista", "tocar Iron Maiden", para que o aparelho faça o que você mandou. Sem dúvida, a tecnologia de reconhecimento de voz é uma das inovações mais empolgantes disponíveis atualmente. Afinal, a voz é uma interface muito mais natural que o próprio texto, certo? Ela possibilita aos consumidores fazerem mais em menos tempo.
Mas essa tecnologia vai muito além dos smartphones. A evolução dos chamados dispositivos de assistência por voz (VAD, da sigla em inglês), como caixas de som inteligentes e até mesmo tablets, já é uma realidade. Esses dispositivos são ferramentas poderosas que podem simplificar as tarefas diárias e que nos mantêm de cabeça erguida e de mãos livres, para assim aumentarmos nossa produtividade. Com eles, a tecnologia de voice computing (que passou por tantos problemas de funcionamento no passado) finalmente decolou.
Nos próximos anos devemos ver um impulso em direção à chamada edge computing (ou seja, a capacidade de processamento migrando para os dispositivos de "borda" de rede, se afastando da nuvem computacional) no mercado da tecnologia VAD. Muitos dos equipamentos atualmente disponíveis no mercado realizam um processamento básico local e depois mandam inputs, como uma questão sobre como será o clima amanhã, por exemplo, para a nuvem. Embora os assistentes de voz tenham feito um grande sucesso com essa abordagem, ainda existem alguns problemas a respeito de latência, largura de banda e privacidade. Além disso, os custos dos serviços de nuvem com o intuito de processar rapidamente esses comandos aumentam as despesas relacionadas a eles.
Dispositivos conectados cada vez mais terão capacidade de inteligência artificial embutida, assim capacitando os usuários a terem uma experiência fluida. Processamento local também utilizará menor largura de banda e oferecerá uma segurança mais robusta para proteger os dados dos usuários.
Os assistentes de voz serão os responsáveis pela abertura de novas ondas de inovação. Veremos uma mudança no design e formato dos dispositivos conectados e no papel que a voz desempenha em nossas vidas, alterando a forma que interagimos com nossos aparelhos. Assim veremos um novo ecossistema de dispositivos com capacidade de suporte à tecnologia de voz. Nas casas conectadas, a tecnologia de voz já se expandiu com o uso de caixas de som inteligentes e está sendo integrada com uma variedade de formatos de dispositivos como micro-ondas e outras aplicações. Nos carros, começamos a observar o aparecimento de acessórios que transformam praticamente qualquer veículo em um automóvel conectado.
O renascimento no design dos dispositivos que utilizamos certamente terá um impacto econômico. Veremos consumidores comprando cada vez mais dispositivos comandados por voz para se conectarem. Exemplo: se uma pessoa gosta de utilizar caixas de som inteligentes em sua sala de estar, poderá comprá-las também para os outros cômodos de sua casa. O mesmo acontecendo com lâmpadas, câmeras de segurança e outros dispositivos que se conectam e que podem ser integrados por meio da tecnologia de voz.
E também vamos presenciar uma consolidação. Os consumidores atuais, por exemplo, podem comprar acessórios de voz para seus carros, mas no futuro as ferramentas se tornarão padrão nos automóveis que compramos, e um acessório não será mais necessário. Uma coisa é certa. O aprimoramento e a invenção de acessórios comandados por voz só estão começando.
Samir Vani, country manager da MediaTek no Brasil.