Hace 2 años | Por mr_b a genbeta.com
Publicado hace 2 años por mr_b a genbeta.com

Lalal.ai es el nombre de la aplicación web que emplea la inteligencia artificial para analizar cualquier canción y separarla en una pista con la voz y otra con los instrumentos casi como por arte de magia. La aplicación ha sido creada por un grupo de especialistas en los campos de la IA, el aprendizaje automático, la optimización matemática y el procesamiento digital de señales: “Hemos desarrollado y entrenado una red neuronal única basada en 20 TB de datos de entrenamiento para extraer pistas instrumentales y de voz de las canciones”.

Comentarios

kwisatz_haderach

#18 +1 por el nombre y el logo lol, buen branding oye.

M

#28 Gracias!... aunque yo no tengo nada que ver con ellos . La usé alguna vez hace tiempo, pues soy profe de música, y ya te imaginas lo bien que vino en su día. Actualmente lo hago con Cubase, pues la última versión viene con Spectralayers One y el resultado me parece mucho más potente... y rápido.

* Edito, que puse mal el nombre

Cuñado

#18 #28 lol Directa al podium del branding. Justo después de una aplicación que busca paquetes no libres en una instalación de Linux (vrms: Virtual Richard M. Stallman) y de otra que puentea la fase de testing y muestra los tests como pasados (Volkswagen)

trivi

#18 eso venía a decir, que ya había una aplicación hace tiempo que hasta separaba los instrumentos y de la que Jaime Altozano hizo un vídeo.

c

No sé si está basado en esto, https://github.com/facebookresearch/demucs Lo probé hace unos meses y va bastante bien, eso sí, tienes que compilarlo tú, pero te ahorras las posibles limitaciones que tuvieran en la web que dice el artículo. Es lo que enseña Altozano en el vídeo que comenta #41 y aunque imperfecto, es la bomba para eliminar baterías y tocar con acompañamiento tú solo.

D

#30 Has probado a ir despacito o echarle gasolina ? roll ya me voy

EmuAGR

#43 Entonces es que no te gusta en general. lol

s

Probado con un audio grabado por mi. Muy imperfecto. Se cuela algo de música en lo vocal. Se cuela muchísimo vocal en la música, se puede seguir la letra perfectamente.

O

No está mal pero no es perfecto. Lo acabo de probar con el opening de Evangelion (así de friki que soy) y tiene sus fallejos.

reithor

karaokes inversos, muerte al autotune... todo ventajas.

c

#32 Y Lobato hizo muchísimo por la F1 en España. Los previos de las carreras estaban de puta madre para ayudarnos a entender los innumerables detalles de las carreras. Los programas que tienen ahora en DAZN con De La Rosa (ex piloto) y Cuquerella (ingeniero de F1) me parecen cojonudos

comunerodecastilla

#56 No si ya, yo también me pongo de los nervios con los derrapes del Lobato.

blid

Si te llaman comunista, por algo será. mimimi

e

Yo he probado con "Kygo Gone Are The Days ft James Gillespie" y lo clava

xyria

Lo probé y funciona genial (excepto una fracción de segundo al principio, tanto de la pista de voz como de la de audio).

Fernando_x

Tendría una aplicación importante, eliminar ruido de fondo que sea intenso para poder percibir mejor las voces en comunicaciones.

Vale, para ponerlo a prueba de verdad, le he metido un audio de un video de gatos maullando. Y ha separado bastante bien los maullidos del ruido de fondo. La pista vocal únicamente contiene maullidos, y la instrumental ruido de fondo y algunos maullidos que supongo se salían de lo normal en lo que sería la voz humana.

kwisatz_haderach

#25 si tienes una tarjeta nvidia con rtx, en los drivers hay una funcion beta de limpieza de ruido por IA, que es pura brujeria. En discord tienen uno integrado que no es tan potente, pero ayuda bastante si tienes mal micro o ruido ambiental en casa.

a

#25 Si te interesa el tema creo que se puede usar esto que imagino vendrá incluido en los servicios que se pueden contratar de Google, aunque no lo he probado, solo me vino a la cabeza la noticia cuando lo comentaste.

https://www.pchardwarepro.com/la-inteligencia-artificial-de-google-puede-separar-las-voces-en-una-multitud/

j

Es bestial, entiende hasta siniestro total (primera etapa con Coppini )

EmuAGR

Esto lo solucionan los japoneses incluyendo la pista karaoke. Si haces la diferencia de la onda entre la pista de karaoke y la completa, puedes obtener la pista de voz.

Usé ese método sin IA una vez para entender una parte de una letra que era tapada por la instrumentación y sale perfecto.

borre

Acabo de probar con esta versión de Hopelessly devoted de Rival Sons y madre mía:

Bolgo

En breve me veo a Lola Flores cantando a ritmo de reaggaton

D

#3 Todo tiene su lado negativo....pero la Siensia tiene que avanzar.

Bolgo

#9 qué dices de negativo! Imagínate lo de que “tú lo que quieres te coma el tigre” al ritmo patapúm …

D

#10 Ok.Ok Voy a ello.

Bolgo

#11 puedes procrastinarlo hasta la semana que viene, no más

D

#12 Como me conoces...

Bolgo

#13 jajaja . Me recordó a cuando me dicen: tú no te preocupes, o , yo te llamo. Me saltan todas las alertas.

Cuñado

#15
- Oye, algún día hay que quedar para unas cañas.
- Mañana?
- No, algún día.

Aitor

#3 Tampoco cambiaría nada, cantaría igual de mal.

teseo

He probado la app. No es perfecta, no es válida para uso profesional pero sí que puede valer para ensayar.

Tremecen

He probado a subir canto gregoriano de los monjes de silos, la parte vocal la deja mucho más seca y la parte musical que se inventa es una mezcla entre órgano de catedral y la voz del diablo robótico.

zaladquiel

Lo he probado con mi voz y ruido de fondo de la calle y lo que hizo fue separar en una pista los momentos de voz, pero que conservan el ruido de fondo, y en la otra el ruido de fondo, pero con momentos de silencio donde aparecía mi voz. Es decir un cut and paste.

amstrad

Probado, se cuela el charles en la voz. A veces saca un saxo como vocal. Como experimento está bien.

The_Ignorator

¿Relacionada? http://menea.me/1wu98

¿Alguien ha probado alguna (Spleeter o Lalal.ai)? ¿funcionan bien?

k

#2 acabo de probar lalal.ai con la de hijos de cain y no me ha convencido su funcionamiento.
Se podia apreciar algo de la voz en la pista instrumental, y tampoco le ha gustado mucho el punteo del principio

The_Ignorator

#4 Sí, yo también acabo de probar (Con "Sick of you" de Iggy Pop y los Stooges, además de un recopilatorio que salva un error en la producción del disco original) y se oye mucho la voz. Al menos con el algorimo normal. La demo sí me di cuenta de ponerla en "agressive" y aunque algo se oía en un momento puntual que sería normal, no me dí cuenta de señalarlo con la versión gratuita (pide correo) y la voz se escucha perfectamente en muchos momentos. En otros lo tapa completamente. También es verdad que Iggy es de variar la voz, meter chillidos y esas cosas, pero hay momentos en los que se cuela mucho la voz y creo que no debería ahí (que canta "normal").

No me termina de convencer, aunque supongo que dependerá también de la canción/cantante.

y

#2 Pues no muy bien. Yo he subido una cancion de Queen y en la parte de letra coge musica y en la de solo musica aparecen letras.

D

#2 Lalal.ai . la acabo de probar con Battiato, OMD y Paulina Blond. Funciona de que te cagash.
Te arranca unas cuantas sonrisas y varias ideas maliciosas.

D

#2 He probado con "Annabel", de Goldfrapp. La separación vocal es bastante correcta, a ratos hasta buena, aunque "arrastra" una parte bien audible de la instrumentación. En los pasajes en los que no hay voz la atenuación de volumen es quizá muy precipitada y brusca, "capando" las colas del verso. Peor parada sale la parte instrumental, en donde no se aprecia una buena corrección en la normalización armónica y notándose muchas ausencias, tanto tímbricas, como de volumen o dinámica, (obviamente en los pasajes precisos en donde se ha extraído la voz).

c

#16 No pruebes con un temazo como

sólo el saca la voz limpia y a ratos hahaha

xyria

#2 Lalal.ai funciona fastásticamente. Yo la he probado hace unos instantes y me desemsambló un archivo en pista de voz y pista de audio sin pérdida de calidad, excepto un error mínimo al principio de la pista de audio.

uGo

#2 yo he utilizado Spleeter y estoy probando lalai. De momento, saco unas conclusiones como que Spleeter (que va todo con comandos de consola) es bastante más complicado de usar para novatos, aunque tiene mucho más opciones y para el tema de edición musical y sampleo la veo muy util ya que Spleeter te da la opcion de dividir la cancion hasta en 4 pistas (agudos,medios, graves y vocal) y no solo 2 como la web, pero la verdad que la calidad de los vocales de lalai me ha parecido superior a spleeter con la prueba que he hecho, (aunque para sacar conclusiones hay que probar los dos varias veces, ya que por ejemplo spleeter ofrece resultados distintos para 2 o 3 o 4 pistas en funcion de la canción ya que los vocales siempre se van a colar de alguna manera en alguna de las otras pistas y el resultado de una canción a otra varía mucho y puede que unas veces sea mejor uno y otras otro) Pero para cosas basicas y rapidas la verdad que parece que funciona muy bien la version web

Además de para sampleo y musica, hace poco he visto usar esta herramienta para hacer memes y editar el sonido que pincha un dj y cambiando la cancion de fondo mientras habla: aqui David Guetta que le cambian su homenaje a George Floyd con el discurso de "I have a dream" por esto:



Buscando "David Guetta ends racism" hay un monton de videos

denegator_

#2 yo he probado una de Chiquetete y sin música tartamudea.

Claudio_7777

#2 He probado spitter.ai y rx 8 audio editor de izotope que tiene una función para separar las pistas. El resultado puede sonar bastante extraño si escuchas de manera individual pero para hacer covers para youtube y cosas así no está mal. Suena con un extraño efecto de fase, como si fuera una voz fantasmal. Probé con entre dos tierras de héroes del silencio, que se escucha la voz muy clara en la mezcla, smells like teen spirit de nirvana y boys de sabrina para hacer una versión más cañera y acelerada en abelton live.

chemari

Espero ansioso a una red neuronal que pueda quitarle las risas a las series antiguas.

Cuñado

#52 Hay muestras de eso en YouTube. El problema es que la pausa que hacen los actores antes de dar la respuesta hace que parezca que tienen una leve discapacidad cognitiva

chemari

#64 lol lol pues no lo había pensado

Stormshur

Con una dance falló, con una de pop acertó de lleno, joder pensaba que esto sería imposible

s

¿a que nadie se atreve a arreglar "Ommadawn lost version" del 75 con esto? jiji

D

Ahora ya se podrá quitarle la música de fondo a los documentales.

e

#6 lol

obmultimedia

#27
-Alonso va al baño...
-Parece que va estreñido...
-Tu puedes Alonso, venga Alonso, un poco mas!
-Si!! Alonso!!! quiero un hijo tuyo!!! maravilloso!!

EmuAGR

#6 Nunca he entendido por qué hay una parte de la audiencia que odia a Lobato. He visto alguna carrera sin él (repetición a otra hora) y era un puto muermazo, un señor de voz monótona describiendo. Para eso prefiero a Lobato que como mínimo le da chicha.

comunerodecastilla

#6 ¿Has probado a bajar el volumen?.

W

#39 y que haga: " fiuuuuuu, fiuuuuuu!!!" con la boca. O se lo pida a su mujer... Cada vez que salga un coche " fiuuuuuu"

Veelicus

#39 La cosa es que a De La Rosa le escucho sin problemas, por eso lo de elegir a que comentarista hacer mute.

rayfth

Hay varias aplicaciones mas que hacen cosas similares (yo uso RX8 y probe Acid pero con malos resultados). Luego algunos tienen metodos propios y descostruyen las canciones para volver a mezclarlas con otras armonicamente y hacer esta puta locura

Eso ya lo sacaron hace más de veinte años con el autotune y nunca funcionó bien por que es imposible separar discriminar frecuencias y que se salven otras que están en el mismo rango.

Ozono33

Cubase 11 y RX8 separan voces, bajo, bateria y resto de instrumentos, se oye con artefactos pero es muy útil para muchas cosas.

m

lo hace regular y es de pago. quizá lo haga regular sólo en la versión gratis.

D

Para qué?

teseo

#42 la de cantantes, instrumentistas, DJ's, estudiantes... que te darían tantas respuestas...