Hace 1 año | Por Nonagon a youtube.com
Publicado hace 1 año por Nonagon a youtube.com

En este video, utilicé inteligencia artificial para generar un video musical animado para la canción Canvas de Resonate. Esta herramienta le permite a cualquiera generar bellas imágenes usando solo texto como entrada. Mi pregunta era, ¿qué pasa si uso letras de canciones como entrada para la IA? ¿Puedo hacer videos sincronizados de música perfectos automáticamente con solo presionar un botón? Dime cómo crees que le fue a la IA en esta interpretación visual de la canción.

Comentarios

i

El resultado es increíble, mejor que la mayoría de videoclips que se producen hoy en día.
Integra muy bien el significado de la letra (de hecho, en las partes instrumentales el vídeo decae un poco) y se ajusta al ritmo de la canción.
Impresionante.

Fernando_x

#45 Sí, cierto, GPT-3 está entrenado para completar textos de manera realista. Lo cual le lleva a que cuestiones muy alejadas del tema, como las matemáticas, le supongan un problema muy grande. En ese ámbito no está al nivel de un ser humano. Por eso digo que al nivel matemático de un niño pequeño. Es más, se pueden mejorar esos resultados en matemáticas si le haces que te detalle correctamente los pasos para llegar al resultado. Tal como harías con un niño pequeño.

D

Absurdo.

llorencs

#54 Si, la verdad que me gustó bastante. La primera temporada con más humor, y el resto con algo pero más serias, pero las 3 temporadas me gustan.

Yiteshi

#9 No importa el trato que le demos, porque eventualmente serán mucho más inteligentes que nosotros. Más bien hay preguntarse qué trato nos darán a nosotros. Lo que no sabemos y da miedito es cómo y cuándo alcanzarán la singularidad. Ni siquiera sabemos cómo la adquirimos nosotros, los masones dicen que ocurrió durante el Neolítico y no fue espontánea si no por un factor externo. De eso se trata 2001 Odisea del espacio de Stanley Kubrick (masón de grado 33).

Yiteshi

Esa es la capacidad de abstracción de un subconsciente humano. Ahora cabe especular dentro de cuanto tiempo tendremos una AI que recree por completo todas las características del cerebro. Le pongo 100 años. Y que Lucifer nos agarre confesados.

llorencs

#7 Por qué? Puede ser salir mala o no. Una IA completa puede traer ventajas. El problema es como la tratemos. Si le tenemos miedo o pasamos a considerarla humana sintética.

powernergia

#9 Si recrea por completo las características de un cerebro humano, como indica #7, será como los humanos, osea un potencial peligro dependiendo de lo que pueda controlar.

BM75

#7 O puede que nunca...
Es difícil aventurarse a predecir eso.

Fernando_x

#7 Exacto, por eso a esta técnica en la que se le da a la IA completa libertad de imaginar se la denomina Deep Dreaming.

Ya hay IAs con la capacidad de abstracción de un niño humano. Capaz de solucionarte acertijos, completarte rimas, continuar una historia inventada o resolverte problemas matemáticos sencillos. Como digo, al nivel de un niño pequeño.

rojo_separatista

#30, de hecho GPT-3 o Dall-e tienen un desempeño muy superior al de un niño pequeño. Diría que están al nivel de los mejores humanos. Creo que falta mejor consistencia en los resultados, pero en 5 años todo esto debería estar resuelto. Me preocupa como lo hará la sociedad para asimilar lo que se nos viene encima.

Fernando_x

#32 En matemáticas no. Por ejemplo, GTP-3

Le planteo como input:

I have 3 coins, you have 5 coins. You give me 3 coins, and then I give you one coin. How many coins do you have now?

Y me responde con:

You have four coins.

Que no es lo que le había preguntado y además está mal.


En lengua sí:

It has four legs, but it cannot walk. What is it?

A chair.


O por ejemplo:

Create a little poem about my love for strawberries:

I love strawberries,
I really do.
I can't get enough
of their sweet,
red goodness.

I could eat them
all day long
and never get tired
of their flavor.

I love strawberries
and am so glad
that they are

rojo_separatista

#43, es que GPT-3 no está entrenado para esto, sino para escribir textos que suenen coherentes aunque no sean verdad. Creo que te quedas con el dedo, lo que nos demuestra GPT-3 es que la capacidad de abstracción de estos modelos ha dado un salto cualitativo, que falle en algo en particular para lo que no ha sido entrenado es cuestión de tiempo, más bien poco. Dall-e 2 falla en la escritura de texto y ya han salido modelos que lo solucionan.

Joice

Algunos comentarios dejan muy en evidencia la poca sustancia de sus autores. El trabajo es impresionante.

n

Pues a mi me ha flipado, el mejor videoclip que he visto en mucho tiempo.

p

#20 Lo suscribo. Me parecen un truño el 99% de videoclips que se hacen, un refrito de tomas random y listo el videoclip.
Este videoclip me parece una pasada impresionante.

D

Que me pase la mierda que fuma ia IA esta.

sabbat

Supongo que el video no lo género de cero una Ia. Con el montaje final es difícil apreciar que partes usaste 
El video me parece genial. Con un trabajo enorme. Estaría bien algún detalle más 😃

Maximilian

Pues a mi me parece brutal.
Como dice #1 no creo que lo vaya generando en modo “live”, pero no por eso deja de ser impresionante.

A este paso dentro de poco los actores ya no serán necesarios para ls películas

pingON

#3 llegará un momento que toda la industria audiovisual podrá ser "sustituída" porque bastará con tener un boceto de la historia, y el resto será hecho por IA, guión, actores, .... en 20 años tal vez.

llorencs

#6 Algo así ocurre en Orveile y la sala de simulación.

Maximilian

#8 eso que es?

llorencs

#49 Orveille una serie tipo Star Trek.

Ainur

#50 La heredera espiritual de Star Trek, porque las últimas secuelas han dejado de la parte ética y filosófica en segundo plano.

D

#6 y en 100. Piensa en la traducción entre lenguas. Un problema más sencillo. Empezó en los 70 y ahora tenemos buenas aproximaciones que sin embargo no son ni mucho menos perfectas. A veces confunden matices y traducen cosas totalmente sin sentido. Ya veremos pero yo no seria tan optimista.

e

#3 #1 en el link del comentario del autor se explica cómo se ha generado.
muchas horas y una buena gpu

shem

#1 A mi me parce un refrito de efectos más o menos aleatorios. No entiendo que parte necesita una AI, sobre todo teniendo en cuenta que el video no tiene nada de realista.
A mi me parece más bien click bait.

Fernando_x

#10 Todas y cada una de las imágenes que has visto en el video han sido creadas por una IA sin intervención de un humano en el diseño.

j

#10 La de que en vez de gastarte 1-10 millones en pagar un videoclip con decenas-cientos de personas humanas involucradas durante meses, pagues 5 euros a Azure y te haga un video de calidad profesional en cinco minutos. Ahí es donde entra la necesidad. No estamos tan lejos.

p

#10 ni puñetera idea de lo que has visto ni de lo que supone.

Joice

#1 En la descripción de YouTube explica bastantes cosas acerca de cómo lo hizo. Algunos detalles, como la sincronización del ritmo, son manuales.

M

Cada día más cerca de la anulación humana, del sueño profundo que causará lentamente la muerte cerebral de aquellos que sean expuestos a todas estas supuestas "inteligencias artificiales" y cuando quieran despertar ya les habrá causado daños irreparables.

p

#23 Registra la idea que Hollywood te la roba

D

Efectivamente, casi como tomarse un tripi.

AubreyDG

Pues como si te comes un volquete de tripis, la verdad.

sillycon

Como si te diera una embolia hasta arriba de ácido.

Visualmente muy interesante, aunque a ratos da bastante mal rollo. Y por supuesto carece de todo elemento artístico que le pudieran dar las personas

arturios

¿Esto ha sido el tripi de anoche o es así el vídeo?

A

#15 no son excluyentes…

D

Picture yourself in a boat on a river...
With tangerine trees and marmalade skies...
Somebody calls you, you answer quite, ... slowly
A girl with kaleidoscope eyes...

Cellophane flowers of yellow and green...
Towering over your head...
Look for the girl with the sun in her eyes...
And she's gone.



Soy experto en música psicodélica

D

A mi me parece una basura infumable. No hay por donde cojerla

BM75

#18 Pues muy bien.
Por cierto, coger*

D

#29 pues coger, pero sigue siendo infumable

c

D

Yo soy Groot

Marticia

La creación es bonita, hermosa, pero le falta transmitir emociones, quizás porque es creado por una IA sin ellas.

luissargazo

Que pruebe con la regebasura. Por ver qué sale.

BladeKing

#5 lo mismo prefería no tener que poner un +18 en el video de YouTube

meneantepromedio

A ver si entiendo, teneis una IA con el poder de computo para resolver ecuaciones y hacer cosas útiles ¿y le ponéis a generar videoclips?

Quizás la IA les mande a tomar por culo y demuestre todo su potencial en un solo paso.

c

#4 No entiendes. La IA quiere aprender a amar, luego a odiar y por último destruirnos. Eso implica hacer arte.

danymuck

#4 tenemos la inteligencia para crear energía a través de fisionar átomos en una central nuclear y sin embargo la utilizamos para bajar al bar a tomar cervezas.

Ves lo absurdo de mi comentario? Pues a ver si eres capaz de ver lo absurdo en el tuyo. Te doy una pista. No todo el mundo utiliza las mismas herramientas para lo mismo porque no todo el mundo se dedica a lo mismo.

tnt80

#4 se trata de conseguir algo muy difícil, por eso se fijan objetivos más a corto plazo, y más posibles de alcanzar (uno no puede alcanzar la cima del Everest, por ejemplo, sin parar de vez en cuando y sin buen equipo), algunos de esos retos a corto plazo, es la generación de imágenes y de vídeos, puestos a generar estos, un videoclip es tan bueno como cualquier otra cosa.
Y si te estás preguntando para que quiere nadie que una IA genere imágenes, uno de los retos es conseguir una que las pueda interpretar muy bien, para eso necesitas una gran cantidad de éstas, que pueden no estar disponibles por copyright, por privacidad, por lo que sea, una IA capaz de generar estás imágenes, te ahorra el problema.
Un ejemplo, supón que quieres una IA capaz de identificar caras, ya que a los algoritmos los pueden engañar fácilmente, pues necesitas un montón de caras para entrenar está IA, y no muchos pueden estar dispuestos a permitir que se use su cara para eso, pues una inteligencia artificial que te genere caras de personas que no existen, o no tienen por qué te ahorra muchos problemas, creas una IA que genere caras, y las usas para entrenar a la otra.

p

#4 Llamar IA al sistema que genera esas imágenes es un poco click-bait/hype. Dejémoslo en una red (pseudo-)neuronal capaz de generar imagenes oníricas, que no es poco, pero no llega a la categoría de "Inteligencia" tal y como tu pareces concebirla. La IA es un campo de la informática bastante amplio que busca lograr sistemas que de algun modo imiten la inteligencia. En ese cajon desastre entran muchos tipos de sistemas "inteligentes" y uno de ellos es el subcampo de las redes neuronales artificiales que lo lleva petando desde hace una década. Los logros de ese campo pasan por la identificación de patrones, la generación de imagenes, sonidos y otros estímulos y el análisis y generación de secuencias. Se han conseguido logros muy importantes, y cada año se superan, pero... de momento, que se sepa ninguno de esos sistemas está capacitado para "tomar consciencia y demostrar todo su potencial". Y una cosa que parece no entenderse bien por el gran público es que cada ejemplo de esas redes neuronales solo sirve para una tarea muy concreta y no puede "pensar o razonar" y su funcionamiento se reduce a una concatenación estímulo-cómputo-respuesta.