Please enter CoinGecko Free Api Key to get this plugin works.

Inteligência Artificial ‘Voicebox’ da Meta, é uma ferramenta de conversão de texto em fala que aprende como o ChatGPT

Inteligência Artificial 'Voicebox' da Meta, é uma ferramenta de conversão de texto em fala que aprende como o ChatGPT

A Meta AI revelou recentemente um gerador de conversão de texto em fala (TTS) inovador que afirma produzir resultados até 20 vezes mais rápidos do que os modelos de inteligência artificial de última geração com desempenho comparável.

O novo sistema, apelidado de Voicebox, evita a arquitetura TTS tradicional em favor de um modelo mais parecido com o ChatGPT da OpenAI ou o Bard do Google.

Entre as principais diferenças entre o Voicebox e modelos TTS semelhantes, como o ElevenLabs Prime Voice AI, é que a oferta da Meta pode generalizar por meio do aprendizado no contexto.

Assim como o ChatGPT ou outros modelos de transformadores, o Voicebox usa conjuntos de dados de treinamento em larga escala. Esforços anteriores para usar enormes quantidades de dados de áudio resultaram em saídas de áudio severamente degradadas. Por esse motivo, a maioria dos sistemas TTS usa conjuntos de dados rotulados pequenos e altamente selecionados.

Meta supera essa limitação por meio de um novo esquema de treinamento que abandona rótulos e curadoria para uma arquitetura capaz de preencher informações de áudio.

Como a Meta AI colocou em uma postagem no blog:

“O Voicebox é o “primeiro modelo que pode generalizar para tarefas de geração de fala que não foi especificamente treinado para realizar com desempenho de última geração.”

Isso permite que o Voicebox traduza texto em fala, remova ruídos indesejados sintetizando a fala substituta e até mesmo aplique a voz de um locutor a saídas de idiomas diferentes.

De acordo com um trabalho de pesquisa publicado pela Meta, seu sistema Voicebox pré-treinado pode realizar tudo isso usando apenas o texto de saída desejado e um clipe de áudio de três segundos.

A chegada da geração robusta de fala ocorre em um momento particularmente delicado, pois as empresas de mídia social continuam lutando com moderação e, nos Estados Unidos, uma eleição presidencial iminente ameaça testar mais uma vez os limites da detecção de desinformação online.

O ex-presidente dos EUA, Donald Trump, por exemplo, enfrenta atualmente acusações de que manipulou materiais confidenciais do governo depois de deixar o cargo. Entre as supostas evidências citadas no caso contra ele estão gravações de áudio nas quais ele supostamente admitiu possíveis irregularidades.

Embora atualmente não haja indicação de que o ex-presidente pretenda negar o conteúdo descrito nos arquivos de áudio, seu caso ilustra que a integridade dos dados reside no cerne do sistema jurídico dos EUA e, por extensão, em sua democracia.

Voicebox não é a primeira ferramenta desse tipo, mas parece estar entre as mais robustas. Como tal, a Meta desenvolveu uma ferramenta para determinar se a fala foi gerada por ela, e a empresa afirma que pode detectar trivialmente a diferença entre áudio real e falso. Pela postagem do blog:

“Assim como outras inovações poderosas de IA, reconhecemos que essa tecnologia traz o potencial de uso indevido e danos não intencionais. Em nosso artigo, detalhamos como construímos um classificador altamente eficaz que pode distinguir entre fala autêntica e áudio gerado com o Voicebox para mitigar esses possíveis riscos futuros.”

No mundo das criptomoedas, a IA tornou-se tão essencial para as operações diárias da maioria das empresas quanto a internet ou a eletricidade. As maiores exchanges contam com chatbots de IA para interações com clientes e análise de sentimentos, e os bots de negociação se tornaram comuns.

O advento de sistemas robustos de conversão de texto em fala, como o Voicebox, combinado com negociação automatizada, pode ajudar a preencher uma lacuna para possíveis comerciantes de criptomoedas que dependem de sistemas TTS que, atualmente, podem ter dificuldades com o jargão criptográfico ou suporte multilíngue.

Veja mais em: Inteligência Artificial (IA) | Notícias

Compartilhe este post

Facebook
Twitter
LinkedIn
WhatsApp