Hace 4 años | Por Chitauri a youtube.com
Publicado hace 4 años por Chitauri a youtube.com

El documento "Transferir el aprendizaje de la verificación del orador a la síntesis de texto a voz de varios oradores" y muestras de audio están disponibles aquí: https://arxiv.org/abs/1806.04558 https://google.github.io/tacotron/publications/speaker_adaptation/ Una implementación no oficial de este documento está disponible aquí: https://github.com/CorentinJ/Real-Time-Voice-Cloning

D

#1 I know. Scary cry cry cry

r

#1 es algo parecido a lo de misión imposible, pero aún más rápido.

sotillo

#4 Ya te digo

r

Joder esto cada vez da más miedo.

neo1999

#5 Pregunta al estamento con la mas alta tecnología a su alcance, el ejército.

D

Ahora no podremos dormir tranquilos.

jamma

Al Rajoy no lo da clonado...a ver como sintetiza el hilillosh...

Chimuelo

A Sergio Ramos le va a venir de perlas para felicitar las navidades lol

I

#9 "Ya"... dice.

M

#13 #9 Ya lo predijo la peli "Perseguido" del chuache en los 80.

Tribuno

#36 Una de mis preferidas de Chuache. Esta película cuenta mucho más de lo que aparenta. No solo es una peli palomitera.

D

Editado

Kastamere

Entre la app que te hacia viejo con una foto y esto... Nos suplantan en breve

D

Esto facilita cometer el delito de suplantación de identidad. Sería una buena idea aumentar las penas por este delito.

L

#13 He pensado lo mismo

Kachemiro

#13 esa secuencia es obra maestra

D

¿Se queda con tus datos o no?

D

Lo que me parece también muy brutal de esto es que se folla, literalmente, a todos los sintetizadores de voz que hay, la salida de audio mediante esto es perfecta.

Miedo.

l

Si le enseñan a cantar,
me clonan ya a Freddy Mercury y a Elvis, por qué no?

hexion

A algoritmos que hacen cosas ahora es guay llamarles "inteligencia artificial" (o AI si todavía se es más guay), de la misma manera que todo servidor que ofrece servicios por internet es una "nube".

bollod

#18 Mi tostador es smart y tiene IA. Me lo compré en Mercadona por 14 euros.

D

#18 Y según tu que necesita para ser IA? porque tanto el encoder como el vocoder son redes neuronales entrenadas con miles de ejemplos...

skatronic

#18 El cuñado de Menéame.

bollod

Apenas podemos empezar a imaginarnos las implicaciones.

daphoene

Esto lleva mucho tiempo teniendo las mismas implicaciones, sólo que ahora somos más conscientes de ello. Lo bonito es que ahora podrás alegar que es un deepfake cuando te pille una cámara de seguridad, realmente lo que se consigue es lo contrario, invalidar pruebas flagrantes.

m

#22: Las cámaras de seguridad tendrán que tener alguna especie de "blindaje criptográfico" y electrónico para que no se puedan manipular sus imágenes.

g

#34 JA JA JA JA … No.

m

#43: Lo suyo sería implementarlo bien, seguramente hagan chips especiales para la criptografía.

D

Si le sumamos el AutoTune , ser cantante está obsoleto

Cancerbero

#23 pues viendo el panorama musical casi prefiero que sea todo generado a engendros actuales tipo "dale, dale. Bon dale"

I

#24 No te ofusques con ese terror tecnológico que han construido

neo1999

Supongo que las pruebas de grabaciones de voz que puedan presentarse en un juicio quedarán invalidadas.

Imag0

La biométrica muere antes de dar el estirón

daphoene

#26 La biométrica como medida de seguridad, ya en su propia concepción, era una cagada muy importante. Muy chula para pelis, pero poco más.

MoneyTalks

Aguien se ha bajado el codigo y lo ha probado?

Kapedocia

lo habéis probado?

phillipe

Por fin podremos recuperar la voz buena de Homer Simpson!

Rudolf_Rocker

Hay que probarlo...

ppma

Es el fin de los actores de doblaje. Ahora podremos ver cine y series traducidas con la voz auténtica del actor pero hablando nuestro idioma.

D

acabo de probarlo y acojona lo suyo....

Reference voice: enter an audio filepath of a voice to be cloned (mp3, wav, m4a, flac, ...):
E:TS3sounddefault_maleaway_activated.wav
Loaded file succesfully
Created the embedding
Write a sentence (+-20 words) to be synthesized:
Llamada entrante iniciada. Origen desconocido.
Created the mel spectrogram
Synthesizing the waveform:
float64

Saved output as demo_output_00.wav

Lo clava el cabron....