Perigo: IA só precisa de 15 segundos da sua voz para a clonar!

Nos últimos anos, o tempo de escuta necessário para a inteligência artificial conseguir clonar a sua voz tem sido cada vez mais rápido. Isto na perfeição. Antes eram minutos, agora são apenas segundos. A OpenAI revelou recentemente que a sua própria tecnologia de clonagem de voz requer apenas 15 segundos de material áudio. Isto para reproduzir a voz de alguém na perfeição.

Perigo: IA só precisa de 15 segundos da sua voz para a clonar!

Numa publicação no seu site, a OpenAI partilhou uma pré-visualização em pequena escala de um modelo chamado Voice Engine. Está em desenvolvimento desde final de 2022.

O Voice Engine funciona alimentando-o com um mínimo de 15 segundos de material falado. O utilizador pode então introduzir texto para criar o que a OpenAI descreve como um discurso “emotivo e realista”. Dito isto “assemelha-se muito ao orador original”.

Entretanto a OpenAI insiste que está a adotar uma “abordagem cautelosa e informada em relação a um lançamento mais alargado. Tudo devido ao potencial de utilização indevida da voz sintética”. Acrescenta que pretende “iniciar um diálogo sobre a utilização responsável de vozes sintéticas. Também sobre a forma como a sociedade se pode adaptar a estas novas capacidades”.

“Com base nessas conversas e nos resultados desses testes em pequena escala, tomaremos uma decisão mais informada sobre se e como implantar essa tecnologia em escala”.

Apple, iPhone

Já há ataques a utilizarem voz artificial 

Uma das utilizações indevidas a que a OpenAI se refere é um esquema que alguns criminosos já estão a levar a cabo utilizando uma tecnologia semelhante que está disponível publicamente há algum tempo. Assim trata-se de clonar uma voz e depois telefonar a um amigo ou familiar dessa pessoa. Isto para a induzir a entregar dinheiro através de uma transferência bancária. Há também receios quanto à forma como esta tecnologia se utilizará nas próximas eleições presidenciais. Aliás uma questão realçada por um incidente recente de grande visibilidade em que uma chamada automática utilizando um clone da voz do Presidente Joe Biden disse às pessoas para não votarem nas primárias de New Hampshire em janeiro.

Outra preocupação é a forma como a tecnologia em rápida evolução irá afetar os meios de subsistência dos actores de voz. Como é natural receiam que lhes seja cada vez mais pedido que cedam os direitos da sua voz. Isto para que a IA se utilize para criar uma versão sintética, sendo provável que a compensação por esse contrato seja muito inferior à obtida se o ator realizasse o trabalho pessoalmente.

Entretanto olhando para as implantações mais positivas da tecnologia, a OpenAI sugere que esta se pode utilizar para prestar assistência à leitura a pessoas que não lêem e a crianças. Isto utilizando vozes naturais e emotivas.

Também poderia-se utilizar para ajudar os doentes que estão a perder gradualmente a voz devido a doença a continuar a comunicar utilizando o que parece ser a sua própria voz.

Siga a Leak no Google Notícias e no MSN Portugal.

Receba as notícias Leak no seu e-mail. Carregue aqui para se registar. É grátis!

Bruno Fonseca
Bruno Fonseca
Fundador da Leak, estreou-se no online em 1999 quando criou a CDRW.co.pt. Deu os primeiros passos no mundo da tecnologia com o Spectrum 48K e nunca mais largou os computadores. É viciado em telemóveis, tablets e gadgets.

Leia também