Publicado hace 2 años por rojo_separatista a xataka.com

Si existe en tu mente, lo puede dibujar: lo nuevo de OpenAI crea imágenes a partir de palabras

xataka.com

A principios del pasado año te hablábamos de DALL-E, la inteligencia artificial de OpenAI capaz de generar imágenes de cualquier texto que escribiéramos.

comentarios destacados

#2: No sé si funciona porque pongo "Abascal bujarra" "Abascal moro" y me devuelve fotos reales.

hace 2 años

#5: Sin exagerar, creo que es de los avances tecnológicos más espectaculares de lo que va de siglo y a penas lo he visto reflejado en los medios de comunicación. Cuanto más veo, más me alucino, creo que el grado de desarrollo que está alcanzando la IA es muy superior a lo que cree la mayoría de la gente.

rojo_separatista

hace 2 años

autor

#16: #2 Uno de los mejores envíos de esta web en mucho tiempo, y los que tenéis la mente podrida por el fanatismo la llenáis de ataques políticos de mierda.

Por vuestra culpa tenemos una clase política terrible.

--647281--

hace 2 años

#12: #8, no está disponible, por ahora solo hay una lista de espera para poder usarla.

rojo_separatista

hace 2 años

autor

Comentarios

Mejores hilos

rubentotal

hace 2 años

No sé si funciona porque pongo "Abascal bujarra" "Abascal moro" y me devuelve fotos reales.

V 15

K 91

rojo_separatista

hace 2 años

autor

#2, será que hace overfitting.

V 2

K 20

#16

Desactivado

hace 2 años

#2 Uno de los mejores envíos de esta web en mucho tiempo, y los que tenéis la mente podrida por el fanatismo la llenáis de ataques políticos de mierda.

Por vuestra culpa tenemos una clase política terrible.

V 8

K 55

#19

rubentotal

hace 2 años

editado

#16 Algo de razón tienes, de hecho he dudado un poco en hacer la gracieta.
Pero sí, la gente tiene la mente podrida. Aunque puede servir como ejemplo de cosas que pedirá la gente a la web.
Recuerdo al principio de googlestreetview que se lo enseñé a unos conocidos. ¿ Sabes lo primero que buscaron ? Las putas que había en la calle en la zona de prostitución marginal. Es decir, tenían un montón de lugares del mundo para ver a pie de calle y eligieron eso. _{Ah y eran gente "normal" con algunos estudios}
Supongo que yo no soy mejor.

V 1

K 21

#28

Cuchipanda

hace 2 años

#19 que no te haga sentir mal una cuenta clon que se dedica a blanquear cosas, amijo.

V 0

K 11

#35

Desactivado

hace 2 años

#16 Bueno, no es más que la versión mejorada de algo que llevaba casi dos años en abierto y bien conocido por la comunidad

El envío bueno sería el de la primera versión , que crea dibujos con las palabras que pongas

Eso sí, era regulero. En esta noticia dicen que parece que lo han mejorado pero sigue siendo cerrado por lo que no lo podemos confirmar.

V 0

K 12

rojo_separatista

hace 2 años

autor

Sin exagerar, creo que es de los avances tecnológicos más espectaculares de lo que va de siglo y a penas lo he visto reflejado en los medios de comunicación. Cuanto más veo, más me alucino, creo que el grado de desarrollo que está alcanzando la IA es muy superior a lo que cree la mayoría de la gente.

V 7

K 64

Ferran

hace 2 años

#5 Esto es todavía muy friki

V 1

K 15

#15

elemilio

hace 2 años

#5 Yo ya me he apuntado a la lista de espera para jugar.

Aqui podéis jugar a algo parecido
https://huggingface.co/spaces/multimodalart/latentdiffusion
Yo estuve generando algunas imágenes hace unos días. Aunque parece que ahora tiene problemillas...

V 1

K 12

#17

rojo_separatista

hace 2 años

autor

#15, yo también me he apuntado, este que enlazas también lo probé, pero esto bastante lejos. Por ahora me la paso enganchado al twitter de sus creadores, mientras van colgando imágenes.

V 1

K 18

#20

elemilio

hace 2 años

#17 Apuntados, gracias!

V 0

K 9

#30

ojosangrante

hace 2 años

editado

#15 #17 supongo que conocéis hypnogram, midjourney, diffussion, vqganclip etc. Tengo una lista de notebooks también.

V 1

K 15

#34

rojo_separatista

hace 2 años

autor

#30, sí, además de GLIDE y a pesar de apuntar maneras, ninguno ha logrado la espectacularidad de este modelo. Pero lo que me preocupa más es que la gente se quede con la belleza de las imágenes resultantes antes que con la demostración de que es capaz de relacionar tan bien conceptos abstractos en un modelo multimodal de imágenes y texto.

V 2

K 30

#39

ojosangrante

hace 2 años

#34 es flipante. Yo cuando hice el tutorial de vqgan mi hermana me decía "estas perdiendo el tiempo". Pero su marido nos dijo "pues esto tiene mucho potencial puede ser útil para mucha gente". Habiendo probado varios este tiene resultados tan espectaculares que la última vez que hablamos de esto (ayer, puede jaja) dudábamos de si el prompt era realmente sin retocar nada y no estaban usando las capas que dicen que soporta.

V 2

K 30

#46

rojo_separatista

hace 2 años

autor

#39, la frustración que siento yo es que veo que el común de los mortales no se dan cuenta del salto cualitativo que tenemos en frente. Por aquí me han dicho que Eliza, un modelo basado en reglas de los años 60 sin ninguna clase de aprendizaje automático, es más o menos igual se espectacular que eso.

V 2

K 30

#21

ifYouStrikeMeDown

hace 2 años

#15 También lo tienes aquí: https://colab.research.google.com/github/multimodalart/latent-diffusion-notebook/blob/main/Latent_Diffusion_LAION_400M_model_text_to_image.ipynb

V 2

K 21

#18

Acuantavese

hace 2 años

#5 Cada día me cuesta más captar la ironía aquí

V 0

K 11

#23

rojo_separatista

hace 2 años

autor

#18, el problema que me he encontrado cuando he enseñado esto a mi círculo cercano es que no ven más allá de una app que hace bonitos dibujitos. Que es esto al lado del grafeno, el bosón de higgs o la cura semanal a la enfermedad del Alzheimer, verdad?

La verdad es que quizás no sea evidente, pero más allá de esto, lo que nos demuestra esta IA es que ha desarrollado una capacidad de abstracción y comprensión del lenguaje natural que se está empezando acercar a la humana de forma espectacular a la humana. Quizás, no sea lo más evidente, pero sin duda es lo más relevante. No por lo que tenemos delante, que ya de por sí resulta bello y espectacular, sino por lo que se atisba de cara al futuro.

V 1

K 24

#24

DenisseJoel

hace 2 años

#23 « lo que nos demuestra esta IA es que ha desarrollado una capacidad de abstracción y comprensión del lenguaje natural que se está empezando acercar a la humana de forma espectacular a la humana »

Yo creo que no. Esa interpretación ya la hacíamos los humanos en los tiempos del programa Eliza. De hecho, lo que hacen estos sistemas es "darnos el pego". Hacen cosas sorprendentes, pero de ahí a hablar de "capacidad de abstracción" o de "comprensión del lenguaje" va un abismo.
Una IA no sabe lo que es un gato, solo es capaz de encontrar elementos en común en imágenes etiquetadas como "gato".

V 3

K 46

#25

rojo_separatista

hace 2 años

autor

#24, creo que confundes capacidad de abstracción con conciencia de la realidad. Lo de Eliza, con mis disculpas pero nada que ver, a la que apretabas un poco estos asistentes conversacionales fallaban más que una escopeta de feria, no tenían ninguna clase de consistencia. A falta de poder jugar un poco con ello, yo diría que esto no ocurre con este modelo.

V 1

K 18

#26

DenisseJoel

hace 2 años

#25 Si entendemos capacidad de abstracción en el sentido de extraer elementos en común y reglas de clasificación, en muchos dominios específicos ya nos ha superado.

V 0

K 11

#27

rojo_separatista

hace 2 años

autor

editado

#26, hasta ahora te diría que dependía mucho de en qué dominio, cuando la información estaba muy estructurada, sí era habitual encontrar modelos que superaran la capacidad humana.

Lo que me parece relevante de la noticia se este envío es que el dominio del que hablamos es el de las imágenes y el lenguaje natural, algo que per se no está estructurado pero que es la principal más importante que utilizamos los humanos comprender el mundo que nos rodea. Por eso me parecen tan relevantes los resultados de este trabajo. Había trabajos anteriores que ya apuntaron en esta dirección, Dall-e 1 y GPT-3, pero esto lo supera.

V 1

K 26

#51

woopi

hace 2 años

editado

#23 Pues sí... Por cierto las versiones libres de "El beso" de Klimt que hace la IA son buenísimas. ¡Curioso!

V 0

K 9

#36

Desactivado

hace 2 años

#5 Habrá que verlo en abierto para comprobar si hay mucha diferencia con el anterior ¿No?

Porque dice que usan GPT3, igual que el otro, por lo que en tema de comprensión de textos no hay avances en esta versión.

V 0

K 12

#41

rojo_separatista

hace 2 años

autor

#36, sí, la crítica más importante que se le puede hacer es que no tenemos acceso al modelo y los desarrolladores pueden estar haciendo cherry picking.

V 1

K 23

#54

saqueador

hace 2 años

#5 Un poco exagerado si es...

V 0

K 9

#56

rojo_separatista

hace 2 años

autor

#54, no te culpo por pensar así.

V 0

K 15

rojo_separatista

hace 2 años

autor

Me parece realmente brutal.

V 5

K 58

#13

Ribald

hace 2 años

#1 Lo único en lo que me falla en general, es en los ojos. En otras imágenes generadas me pasa igual. No sé qué es, pero me da la impresión de que algo falla.

V 1

K 10

#47

lestat

hace 2 años

No genera imagenes violentas, no genera rostros fotorealistas... que se lo metan en los cojones, y cuando salgamos de esta era de subnormalidad para ofendiditos igual o pruebo.

V 2

K 26

#50

Nova6K0

hace 2 años

#47

Saludos.

V 1

K 17

#10

andres.dev

hace 2 años

Cumplirá la regla 34 con esta IA?

V 1

K 21

#14

Ribald

hace 2 años

editado

We’ve limited the ability for DALL·E 2 to generate violent, hate, or adult images. By removing the most explicit content from the training data, we minimized DALL·E 2’s exposure to these concepts. We also used advanced techniques to prevent photorealistic generations of real individuals’ faces, including those of public figures.

Gracias a Dios que lo han tenido en cuenta. Me pregunto si en un rincón más oscuro de internet se generá una versión sin censurar.

#10 Parece que no

V 3

K 28

#33

ojosangrante

hace 2 años

#14 también dicen que no se puede para renderizar protestas. Tienen de "open" lo que yo de millonario. Esto es totalmente propietario y cerrado.

V 2

K 27

#48

Nova6K0

hace 2 años

#33 Es que hay código abierto, que de libre tiene poco.

Saludos.

V 0

K 10

#57

ojosangrante

hace 2 años

#48 pero no es código abierto tampoco por lo que tengo entendido.

V 0

K 8

#58

the_unico

hace 2 años

#14 Yo ya estaba pensando como sacar una versión sin esa limitación

V 0

K 9

#22

ifYouStrikeMeDown

hace 2 años

#10 Son unos mojigatos los de OpenAI, pasa algo parecido con GPT3. Ya llegará una alternativa libre.

V 1

K 15

#37

Desactivado

hace 2 años

editado

#22 GPT3 es de Open AI, estas diciendo lo mismo.

Para que llegue la alternativa libre alguien tiene que poner el dinero que ha puesto Elon encima de la mesa.

V 0

K 12

#38

ifYouStrikeMeDown

hace 2 años

#37 GPT3 es de OpenAI, sí, pero Dall-E 2 no es GPT3.

V 0

K 6

#40

Desactivado

hace 2 años

#38 Según esta noticia sí

V 0

K 12

#42

ifYouStrikeMeDown

hace 2 años

#40 Solo dice vagamente que "aprovecha el potencial de GPT-3 para generar sus diseños". Y la única referencia a GPT-3 en el paper al que enlazan es "we generated 512 “artistic” captions using GPT-3 [4] by prompting it with captions for existing artwork".

V 0

K 6

#43

Desactivado

hace 2 años

#42 Conozco bien sin ser un experto. Tal como lo escribe Xataka entiendo que usan GPT3 para analizar el sentido de la frase

V 0

K 12

#44

ifYouStrikeMeDown

hace 2 años

#43 Pero el paper al que enlazan en esa frase no dice eso.

En cualquier caso, aunque se derive de GPT-3, cosa que repito que no dicen ahí, decir que Dall-E es GPT3 sería como decir que Objective-C es C.

V 0

K 6

#45

Desactivado

hace 2 años

#44 Yo entiendo que usarían GPT3, como otras tantas librerías.

V 0

K 12

#55

Janssen

hace 2 años

No manches guey! Alta tecnología

V 0

K 16

Desactivado

hace 2 años

Cuidado a ver si de algunos cerebros no va a poder dibujar nada...

V 0

K 13

noexisto

hace 2 años

Al final hay una “Lista de espera”. Son listos

V 0

K 12

#53

Cuchipanda

hace 2 años

editado

#52 no se preocupe, cosas de mi ignorancia con el ATPC.

editado:

Ah, joder, a tomar por el horto lol, pensaba que eran las siglas de algo ténico. Ya me disculpa.

V 0

K 11

archivistica

hace 2 años

¿Podéis poner enlace a la aplicación y no al artículo, por favor?

V 2

K 9

zastiu

hace 2 años

#8 https://openai.com/dall-e-2/

V 2

K 22

#12

rojo_separatista

hace 2 años

autor

#8, no está disponible, por ahora solo hay una lista de espera para poder usarla.

V 4

K 48

#32

ojosangrante

hace 2 años

#8 no está pero tienes unas cuantas cosas basadas en modelos un poco peores como vqgan diffussion, midjourney (también la van a hacer de pago) hypnogram etc

V 0

K 8

#11

pax0r

hace 2 años

atpc los diseñadores gráficos

V 2

K 7

#29

Cuchipanda

hace 2 años

#11 ¿qué te atepece hacer con ellos?

V 0

K 11

#52

pax0r

hace 2 años

#29 no le entiendo señor

V 0

K 10

#31

ojosangrante

hace 2 años

#11 tal cual. Es lo primero que dije yo cuando me enseñaron el del conejo sentado en el banco.

V 1

K 18

#49

Nova6K0

hace 2 años

#11 Pues la llevan clara, si quieren forrarse con esto. Porque si en una obra no interviene directamente un humano (y no decir cuatro frases, para que una "máquina" os haga un dibujo, no vale) esa obra no puede tener derechos de autor, y ya hay dos sentencias en ese sentido, por el uso de IAs.

Saludos.

V 0

K 10

Si existe en tu mente, lo puede dibujar: lo nuevo de OpenAI crea imágenes a partir de palabras

A principios del pasado año te hablábamos de DALL-E, la inteligencia artificial de OpenAI capaz de generar imágenes de cualquier texto que escribiéramos.

Etiquetas

comentarios destacados

Comentarios