Synthesia, uma startup de inteligência artificial (IA) apoiada pela Nvidia, introduziu uma nova atualização que permite que avatares de IA transmitam emoções e movimentos humanos.
A empresa revelou seus “Avatares Expressivos”, que visam expressar emoções com base em instruções de texto para apresentações corporativas, marketing e fins de treinamento.
https://x.com/synthesiaIO/status/1783535861214204368
A IA generativa é frequentemente elogiada por sua capacidade de criar imagens em movimento realistas, como é o caso do gerador de vídeo Sora da OpenAI.
No entanto, a IA tem as suas falhas, especialmente quando retrata humanos, que muitas vezes são mostrados com mãos ou membros distorcidos, fundos colados ou lábios fora de sincronia com a fala.
Synthesia pretende corrigir isso em sua versão mais recente, que foi desenvolvida em humanos reais lendo roteiros em seu estúdio. Isso foi feito para ajudar os bots a capturar o rastreamento labial e a serem mais precisos em suas expressões emotivas.
Victor Ribarbelli, cofundador e CEO da Synthesia, disse:
“A peça que faltava era que, ao contrário dos humanos, os avatares não entendem o que estão dizendo, o que anteriormente levava à falta de resposta facial às emoções.”
No estúdio, eles foram treinados para responder a instruções simples como “Estou feliz. Estou triste. Estou frustrado” ao transmitir as expressões faciais corretas e o tom associado à emoção em questão.
Os novos avatares também estão disponíveis em mais de 130 idiomas e podem fornecer suas próprias legendas e até mesmo clonar as vozes dos próprios usuários.
No entanto, dos exemplos de modelos de avatares no site da Synthesia que falam outros idiomas além do inglês – como francês, alemão e espanhol – o modelo em inglês é o mais avançado e humano.
A startup supostamente tem pelo menos metade das empresas da Fortune 100 listadas como clientes e fornece serviços para mais de 55.000 empresas. Isso inclui líderes de diversos setores, como Zoom, Xerox, Microsoft e Reuters, entre outros.
Synthesia é uma empresa sediada no Reino Unido fundada em 2017. Na esteira do boom da IA no último ano, atingiu uma avaliação de quase US$1 bilhão com grandes patrocinadores como a Nvidia, que atualmente domina o desenvolvimento de chips semicondutores de IA.
Devido à sua abordagem mais restrita – criação de avatares semelhantes a humanos para uso comercial – a Synthesia tem evitado parte do hype e da competição acirrada vista entre modelos de chatbot concorrentes, como o ChatGPT da OpenAI e o chatbot Gemini do Google.