Hace 4 años | Por Chitauri a youtube.com
Publicado hace 4 años por Chitauri a youtube.com

El documento "Transferir el aprendizaje de la verificación del orador a la síntesis de texto a voz de varios oradores" y muestras de audio están disponibles aquí: https://arxiv.org/abs/1806.04558 https://google.github.io/tacotron/publications/speaker_adaptation/ Una implementación no oficial de este documento está disponible aquí: https://github.com/CorentinJ/Real-Time-Voice-Cloning

r

Joder esto cada vez da más miedo.

D

#1 I know. Scary cry cry cry

r

#1 es algo parecido a lo de misión imposible, pero aún más rápido.

D

Ahora no podremos dormir tranquilos.

jamma

Al Rajoy no lo da clonado...a ver como sintetiza el hilillosh...

Chimuelo

A Sergio Ramos le va a venir de perlas para felicitar las navidades lol

D

Editado

Kastamere

Entre la app que te hacia viejo con una foto y esto... Nos suplantan en breve

D

Esto facilita cometer el delito de suplantación de identidad. Sería una buena idea aumentar las penas por este delito.

D

¿Se queda con tus datos o no?

L

#13 He pensado lo mismo

D

Lo que me parece también muy brutal de esto es que se folla, literalmente, a todos los sintetizadores de voz que hay, la salida de audio mediante esto es perfecta.

Miedo.

l

Si le enseñan a cantar,
me clonan ya a Freddy Mercury y a Elvis, por qué no?

hexion

A algoritmos que hacen cosas ahora es guay llamarles "inteligencia artificial" (o AI si todavía se es más guay), de la misma manera que todo servidor que ofrece servicios por internet es una "nube".

bollod

Apenas podemos empezar a imaginarnos las implicaciones.

bollod

#18 Mi tostador es smart y tiene IA. Me lo compré en Mercadona por 14 euros.

neo1999

#5 Pregunta al estamento con la mas alta tecnología a su alcance, el ejército.

daphoene

Esto lleva mucho tiempo teniendo las mismas implicaciones, sólo que ahora somos más conscientes de ello. Lo bonito es que ahora podrás alegar que es un deepfake cuando te pille una cámara de seguridad, realmente lo que se consigue es lo contrario, invalidar pruebas flagrantes.

D

Si le sumamos el AutoTune , ser cantante está obsoleto

neo1999

Supongo que las pruebas de grabaciones de voz que puedan presentarse en un juicio quedarán invalidadas.

Imag0

La biométrica muere antes de dar el estirón

I

#9 "Ya"... dice.

sotillo

#4 Ya te digo

I

#24 No te ofusques con ese terror tecnológico que han construido

MoneyTalks

Aguien se ha bajado el codigo y lo ha probado?

daphoene

#26 La biométrica como medida de seguridad, ya en su propia concepción, era una cagada muy importante. Muy chula para pelis, pero poco más.

Kapedocia

lo habéis probado?

phillipe

Por fin podremos recuperar la voz buena de Homer Simpson!

m

#22: Las cámaras de seguridad tendrán que tener alguna especie de "blindaje criptográfico" y electrónico para que no se puedan manipular sus imágenes.

Kachemiro

#13 esa secuencia es obra maestra

M

#13 #9 Ya lo predijo la peli "Perseguido" del chuache en los 80.

Rudolf_Rocker

Hay que probarlo...

D

#18 Y según tu que necesita para ser IA? porque tanto el encoder como el vocoder son redes neuronales entrenadas con miles de ejemplos...

skatronic

#18 El cuñado de Menéame.

Cancerbero

#23 pues viendo el panorama musical casi prefiero que sea todo generado a engendros actuales tipo "dale, dale. Bon dale"

ppma

Es el fin de los actores de doblaje. Ahora podremos ver cine y series traducidas con la voz auténtica del actor pero hablando nuestro idioma.

Tribuno

#36 Una de mis preferidas de Chuache. Esta película cuenta mucho más de lo que aparenta. No solo es una peli palomitera.

g

#34 JA JA JA JA … No.

m

#43: Lo suyo sería implementarlo bien, seguramente hagan chips especiales para la criptografía.

D

acabo de probarlo y acojona lo suyo....

Reference voice: enter an audio filepath of a voice to be cloned (mp3, wav, m4a, flac, ...):
E:TS3sounddefault_maleaway_activated.wav
Loaded file succesfully
Created the embedding
Write a sentence (+-20 words) to be synthesized:
Llamada entrante iniciada. Origen desconocido.
Created the mel spectrogram
Synthesizing the waveform:
float64

Saved output as demo_output_00.wav

Lo clava el cabron....