Você fala com sua voz habilitada dispositivos e prefere a pesquisa por voz a digitação para encontrar informações online? As tecnologias de controle de voz lideradas por pesos pesados da indústria como Amazon Alexa, Siri da Apple e Google Assistant tiveram um rápido ascender nos últimos anos. As pessoas gostam deles porque permitem interações autênticas e naturais e são instintivos.
A tecnologia de voz também é a porta de entrada para experiências metaversas intuitivas.
A tecnologia de voz torna as duas forças motrizes do metaverso – VR e AR – mais convenientes
Pense em como a maioria dos headsets VR atuais funcionam. Os usuários precisam de controladores VR para interagir com o ambiente, se movimentar e navegar. Você pode pegar e empurrar objetos virtuais com a ajuda desses controladores, que são dispositivos semelhantes a joysticks. No entanto, por serem portáteis, eles restringem os possíveis casos de uso, como trabalhar em um metaverso de local de trabalho onde usar as mãos é uma necessidade absoluta. Por outro lado, os comandos de voz permitem que os usuários controlem e naveguem em mundos virtuais com as mãos livres.
Os comandos baseados em voz também podem aumentar a conveniência das experiências AR – independentemente de funcionarem por meio de smartphones ou óculos inteligentes. Na maioria dos casos, usar a voz é mais confortável do que escrever textos longos.
A tecnologia de reconhecimento de voz e fala moldará o futuro metaverso
Duas tecnologias relacionadas serão decisivas no futuro de um metaverso comandado por voz: reconhecimento de fala e reconhecimento de voz.
O reconhecimento de fala usa processamento de linguagem natural e tecnologias de aprendizado de máquina para reconhecer a linguagem humana. Isso essencialmente ajuda a entender as palavras exatas que o orador usa. Os casos de uso comuns são traduções automáticas em tempo real, legendas e comandos de voz diretos. Pode ser aplicado, por exemploem jogos metaversos para que os jogadores possam dar comandos de voz enquanto controlam simultaneamente o jogo com as mãos.
A finalidade do reconhecimento de voz é reconhecer a identidade do locutor. Essa tecnologia não se concentra nas palavras faladas, mas sim em recursos como sotaques, dialetos e velocidade que caracterizam a forma como uma pessoa fala.
Por exemplo, pode ajudar seus dispositivos a reconhecê-lo. Portanto, a tecnologia é usada principalmente para criar senhas de voz para dispositivos pessoais. Também pode ajudar a treinar assistentes pessoais de IA, como Siri e Alexa, para que eles ajudem apenas uma pessoa específica. Uma conferência virtual em que muitos palestrantes participam é um cenário metaverso no qual o reconhecimento de voz pode ser útil. Em tais circunstâncias, pode ser usado para diferenciar quem disse o quê.
O futuro metaverso provavelmente dependerá fortemente de ambas as tecnologias. Considere, por exemplo, a solução de software de controle de voz WearHF desenvolvido pela Realwear. Os usuários podem integrar o software com o fone de ouvido de nível industrial da empresa para convertê-lo em um dispositivo viva-voz com a opção de ativar/desativar o recurso de reconhecimento da voz do locutor.
A ativação de comandos de voz abre aplicativos para experiências suaves.
Tomemos, por exemplo, compras no metaverso, onde conversão as taxas podem chegar a 70% dos visitantes, e o tamanho do mercado deve chegar a 800 bilhões até 2024.
Se os criadores de AR e VR podem fornecer interações de voz, além de interações de apontar e clicar, as compras no metaverso podem ser mais seguras graças à verificação de segurança por voz. Além disso, os consumidores podem passear pelas lojas virtuais sem usar as mãos para uma experiência de compra mais imersiva.
Combine faixas de narração com avatares metaversos 3D para criar expressões faciais aprimoradas.
A tecnologia de voz também é crucial para outros casos de uso do metaverso. Por exemplo, podemos aproveitá-lo para equipar avatares com expressões faciais mais realistas. A NVIDIA, empresa líder em IA e metaverso, está desenvolvendo o aplicativo Omniverse Audio2Face. O aplicativo utiliza tecnologias generativas de IA para sincronizar o áudio de narração com a animação de um personagem 3D. O aplicativo pode ser usado para criar avatares metaversos realistas ou assistentes digitais em tempo real.