Hace 6 años | Por ccguy a qz.com
Publicado hace 6 años por ccguy a qz.com

Un artículo de investigación publicado por Google este mes detalla un sistema de texto a voz llamado Tacotron 2, que consigue una precisión casi humana al imitar el audio de una persona que habla a partir de un texto. El sistema es la segunda generación oficial de Google de la tecnología, que consiste en dos redes neuronales profundas. La primera red traduce el texto en un espectrograma con el que se alimenta WaveNet, un sistema de DeepMind que lee la carta y genera los elementos de audio. [el artículo incluye varios ejemplos comparativos].

Comentarios

Relator

#1 Té refieeeeres a lá que hablá asíiiiiiiiii. ¡Já jaja jajajá!

kucho

#3 es que, se ha, metido, un buen lingotazo!

D

#1 A mí me parece muy alegre que tenga esa jovialidad beoda cuando anuncia que me quedan 100m para llegar al curro.

Eck1

#1 Con lo que te ries cuando dices "Ok Google, cuentame un chiste" y te lo canta con esa voz

D

#1 ya encontró trabajo esta?

Pakipallá

#1 Si te refieres a la que suena en Android, yo no podía con ella, me incitaba al consumo de drogas, jaja.
Ya más en serio, de las primeras cosas que hago al estrenar móvil es instalarle el motor TTS de Ivona y la voz "Conchita", que es gloria oírla en comparación con la otra. ¿La pega? Pues que funciona perfectamente en casi todas las aplicaciones, excepto en las propias de Google, que se pasa por el forro la configuración de voz que pongas por defecto.

D

#1 Parece que se ha tragado un anuncio de compresas

D

A dos pasos está de que te tire una zapatilla mientras escapas.

c

Son perfectamente distinguibles, aunque el resultado sea bastante bueno.