Ícone do site Gazeta do Cerrado

Inteligência artificial imita voz humana com amostra de apenas 1 minuto

. (Eu, Robô/Reprodução)

Baseada no Canadá, a Lyrebird é uma startup de inteligência artificial que desenvolveu um algoritmo capaz de imitar a voz humana com amostras breves da voz de uma pessoa. Um minuto já pode ser o suficiente para que uma simulação seja criada–ainda que áudios de algumas horas gerem resultados mais eficazes.

Se você viu a apresentação do Google, na qual o Google Assistente fez chamadas de voz para pessoas sem se identificar como um recurso artificial, sabe que isso pode causar polêmica. A primeira coisa que vem à mente, provavelmente, é o uso indiscriminado dessa tecnologia, que poderia fazer você falar com robôs ao telefone sem saber que não há uma pessoa real do outro lado da linha.

Porém, a startup diz que o recurso pode ser usado para a criação de vozes para chatbots de atendimento ao cliente ou até para dar vozes a personagens de videogame. A companhia tem até uma parceria com a ALS Association, organização sem fins lucrativos que arrecada fundos para pacientes com ELA (esclerose múltipla amiotrófica), para ajudar pessoas com a doença a se comunicar.

Para demonstrar sua tecnologia, a Lyrebird divulgou um áudio com vozes simuladas de Donald Trump, Barack Obama e Hillary Clinton conversando sobre a tecnologia da empresa. Ouça-o a seguir.

Politicians discussing about Lyrebird by Lyrebird

Em vídeo da Bloomberg, o jornalista Ashlee Vance tem sua voz copiada e realiza uma ligação para sua mãe, que não percebe estar falando com um robô. Veja-o a seguir. A reportagem continua em seguida.

Os fundadores da Lyrebird, três estudantes da Universidade de Montreal, afirmam que sua tecnologia levanta pontos importantes para a sociedade, incluindo questionamentos sobre a autenticidade de áudios usados como provas judiciais. A solução que a empresa propõe é tornar sua tecnologia “acessível a todos”. Como um Photoshop para voz, os fundadores esperam que, assim como sabemos que pode acontecer hoje com as fotos, as pessoas saberão que áudios também podem ser falsificados.

O número de idiomas disponíveis ainda é limitado. Nem mesmo o francês, falado no Canadá, está disponível na plataforma da Lyrebird. O algoritmo só lida bem com o inglês americano no momento.

A tendência de usar inteligência artificial para voz já é um caminho sem volta. Além de Google e de startups, a Adobe também conta com uma solução para isso. O projeto é chamado Project VoCo e permite editar vozes humanas como editamos imagens no Photoshop. Ainda assim, a amostra necessária de áudio é de 20 minutos, que mostra potencial do algoritmo da startup canadense–apesar de que alguns exemplos soem ainda um tanto robóticos. Outro exemplo dessa tendência da voz entre as empresas de tecnologia é o recurso de guia curva a curva no Waze que usa a voz do próprio usuário, algo que já foi descrito como uma selfie para os seus ouvidos.

A Lyrebird garante, em seu site oficial, que a sua voz digital é somente sua e ninguém mais pode usá-la sem seu consentimento. De qualquer forma, você pode gravar seu um minuto de áudio no site, após um login com e-mail comercial, e ouvir sua voz robótica. Todos os dados podem ser apagados depois que você fizer o teste. Se quiser ouvir sua voz imitada pelo algoritmo da Lyrebird, é possível fazer isso neste link.

Por Lucas Agrela, do site Exame

Sair da versão mobile