Hace 4 meses | Por geralt_ a goldpenguin.org
Publicado hace 4 meses por geralt_ a goldpenguin.org

Con el lanzamiento del generador de imágenes AI de Meta y Midjourney V6, la competencia por el mejor generador de imágenes AI es cada vez más feroz. Veamos cómo Midjourney, Meta, DALL-E 3, Stable Diffusion XL y Adobe Firefly 2 se comparan entre sí con la misma entrada de datos.

Comentarios

Tannhauser

#4 Estás siendo tú mismo, Woody Alien.

woody_alien

#21 No era tan niña.

DonScumm

#4 Viendo la lista de palabras clave que se ha desvelado de un documento de Midjourney, no sería para nada de extrañar...

m

#43 no entiendo....

DonScumm

#48 https://x.com/JonLamArt/status/1741545927435784424

En concreto me refiero a estas palabras clave que aparecen en el documento:

https://x.com/pehdrigues/status/1741622270492053899?s=20

No se cómo no se está hablando más sobre esta filtración más allá de los círculos de artistas, donde ha levantado mucha polvareda y toneladas de indignación.

Lonnegan

#3 Yo desde luego, me pongo con una foto de la habitación moderna esa, o sea, partiendo del resutado, si intentase obtener algo parecido se que voy a fracasar porque no se me ocurren esas instrucciones.

pkreuzt

#5 Es que el proceso es dificilmente reversible. Puedes empezar con un prompt sencillo e ir añadiendo o quitando cosas hasta que sale lo que pretendes, pero tratar de inferir que prompt se ha usado viendo la imagen es más difícil.

t

#6 Una buena estrategia es ver qué prompts ha utilizado la gente, ver qué resultados han obtenido, e ir incorporando los distintos comandos, haciendo una especia de biblioteca.
Y muchas IAs, como Midjourney tienen un "manual" donde explican muchos tipos de instrucciones, para poner el peso en un elemento de la imagen, por ejemplo, etc.

pkreuzt

#12 En Civitai te ponen ejemplos de cada modelo, los parámetros que van mejor y hasta las semillas utilizadas para que puedas replicarlos.

Grub

#6 Solo uso "Stable-D" y sin mucha idea, mi método siempre ha sido pedir 10 o 100 imágenes de un prompt sencillo. Y sobre las más acertadas conforme a lo que espero recibir, 10 o 100 variaciones especificando algo más el prompt.
Al estilo https://www.freepik.com/pikaso pero en modo manual y local (no tan rápido)

obmultimedia

#7 cuando tienen muchas peticiones acaba sacandote verdaderas aberraciones.

Rufusan

#7 la AI está muy bien, pero sería grotesco que se llegase antes a un campeonato mundial de Pickelbol que del triatlón Padel+vermú+misa

Acido

#38 #15
También acabo de enterarme que existe un equipo de baloncesto llamado "Portland Pickles" (los pepinillos de Portland) que tiene camiseta verde... Creo que tiene una mascota que es un pepinillo.

Así que la IA al leer "la final del campeonato mundial" quizá no le cuadrara eso con el verdadero "pickleball" y prefirió usar el equipo "pickles" de basketball : camisetas verdes y pepinillo por ahí en medio.

Cc: #7 #8 #19

cognitiva

#15 OK, pero es la IA.

Acido

#7

A mi también me sorprendió esa imagen, pero tiene su lógica.
Se trata de una ambigüedad... porque hay un deporte llamado pickleball y también pickle significa pepinillo, así que pickleball también podría significar "pelota pepinillo", que es lo que dibujó Meta. Parece una especie de "broma" hecha por Meta pero seguramente no tenía muchas imágenes del deporte Pickleball, que en mi caso creo que es la primera vez que leo esta palabra. Es decir, aunque aparezca en Wikipedia no es un deporte muy extendido.

Cc: #8 #19

X

#33 El pickleball está pegando más fuerte que el pádel en EEUU.

skaworld

#33 aham, y por qué ha decidido que es un deporte femenino que se practica con un tumor-pepinillo (o tumornillo) de dimensiones ciclópeas en la frente?

Acido

#38
Lo de la frente ni idea... Pero el tamaño del pepinillo se supone que es aproximadamente el de una pelota de ese deporte (baloncesto).
Quizá lo de la frente es porque el texto dice que esté haciendo un mate, y en ese tipo de jugadas el supuesto balón está por encima de la cabeza, ya que la cesta de baloncesto está arriba, así que el "balón" (pelota-pepinillo) debe estar a punto de encestar, y, por tanto, más alto que la cabeza.

Wachoski

#5 pues imagina crearla tu mismo a mano.... Esa es la movida

paumal

#3 es como quien decía que el SEO era alquimia. Es puro método.

mierdeame

#3 Los prompts negativos, lo cual no menciona para nada el artículo

Una puta mierda de comparativa.

yemeth

#3 Hay mil ajustes en Stable Diffusion, pero es que hasta se queja de que el realista no es realista. Articulista mío, ¿has probado a usar un Modelo realista? ¿O te has ido a la versión de la web y le has dado al botón?

El artículo solo revela que Midjourney gana las comparativas cuando eres manco.

pkreuzt

#41 Bueno, es lo que decía un meneante en otro artículo: Midjourney es para darle al botón y ya. SD Tiene más posibilidades de expansión y diferentes capacidades según el modelo usado.

JanSmite

#42 Acabo de probar Midjourney, que dices que es para darle al botón, y ni eso.

Prompt (creo que bien sencillo y específico): "checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"

Resultado :

JanSmite

#42 En ésta he cambiado un poco el prompt, para que el suelo sea blanco y negro:

"black and white checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"

En la única en la que pone el "2" bien, aparece una cinta roja no pedida, el suelo no es blanco y negro y no es "tablero de ajedrez", está hecho un asco ¯\(º_o)/¯ :

Golan_Trevize

#57 Cosas de la """inteligencia""" artificial.

D

#57 Bueno lo que dice #42 es que es con SD (Stable Diffusion) con el que tienes más opciones, no con Midjourney.

Por cierto, qué "version web" de Midjourney usas tú? Hasta donde yo sé solo existe online la de Discord, y ahora mismo te pide suscribirte.

Yo le he pedido a ChatGPT, que usa DALL-E, pero es complicado lo de conseguir un suelo de damero que no tenga errores.

D

#57 #60 Incluso con algunas iteraciones más le cuesta hacer que el tablero esté bien, sin repeticiones de casillas o sin que las casillas tengan distintos tamaños. ChatGPT me ha pedido clemencia y comprensión, dice que es complicado el tema del patrón de ajedrez para tamaños aleatorios, y le entiendo.

Al final ha podido sacar algo medio bien, pero que sigue estando regular (casillas de distintos tamaños, una con un subcuadrado "comido", etc):

S

#61 Según se mire es más realista, ya tengo varias baldozas discolas en casa por reparaciones y varios. lol

JanSmite

#61 Es justo a lo que me refería: la "comprensión" del prompt parece que no es tan buena como quieren hacernos creer, cuando no comprenden un prompt tan sencillo como ese. Puedo entender que no puedan general imágenes perfectas, pero no que aparezcan elementos que no has pedido, como mochos o figuras de ajedrez.

Ojo, igual las versiones a las que yo tengo acceso son anteriores a lo que hay ahora, o no tienen puestos add-ons que les dan más fiabilidad, pero es lo que he visto hasta ahora.

JanSmite

#60 https://start.chatgot.io/login

7 días de prueba gratis

JanSmite

#41 Los habrá, pero, al menos con la versión web, que es a la que yo tengo acceso, le pides algo tan sencillo como un cubo amarillo, de los de fregar, con la letra A pintada en negro en el cubo, sobre un suelo de cuadros blancos y negros, tipo ajedrez, y hace lo que le sale del pijo: tres cubos de fregar, puede que alguno amarillo, cubos (geométricos) pequeños con letras diversas impresas en ellos, el suelo deformado… Y, sí, he probado con diferentes modelos, variando la semilla, etc. Después de 20 pruebas conseguí algo parecido a lo que pedía, pero había otros elementos no pedidos en la imagen.

Seguramente habrá forma de hacerlo de manera sencilla, pero se supone que esas IA deberían entender una entrada de texto normal y corriente. Sé que estamos sólo en el principio de la tecnología y que irá mejorando, pero si tienes que ir jugando con ajustes arcanos para que te salga lo que pides, no es lo que yo espero de una IA.

Globo_chino

#1 Y conocer mucho a las IAs, sus puntos fuertes y débiles

Vamos acabar rezándole al espíritu máquina como en Warhammer.

kmon

#1 es que leer la mente aún no pueden

Nihil_1337

#1 Es que llamar a los modelos de difusión "inteligencia artificial" quedará muy bonito para el márketing pero no los define de ninguna manera.

DonScumm

#1 Pues imagínate cuando lo tienes que hacer por ti mismo sin ayuda de ningún software que genere imágenes precocinadas.

Nihil_1337

Para los que utilizamos profesionalmente este tipo de herramientas esta comparativa no tiene ningún sentido. Es como comparar con que tenedor comes mejor los espaguetis: con la espátula de servir la ensalada, con el de trinchar el pollo, con el normal o con el pequeñito de postre.

Nihil_1337

#24 Más risas se echa la peña con lo de las gambas y las mariscadas de los sindicatos, mientras siguen sin afiliarse a ninguno como idiotas, y eso si que pone en riesgo muchos más puestos de trabajo que una herramienta.

r

#14 Vale, las IAs ponen en riesgo miles de trabajos y podrían estar violando el copyright... ¿pero y las risas que nos echamos?

C

#51ThorntonThornton 3 votos negativos en 3 comentarios no relacionados entre sí. ¿Algún problema conmigo?.

Globo_chino

Firefly lo está petando, no es tan espectacular como a las demás pero es increíblemente realista.

Benzo

#10 Por lo que se ve en el artículo, Midjourney es mucho más realista.

Es increible el nivel al que estan llegando.

cosmonauta

¡Que pesados con las criptos!

f

es una comparación injusta. 

Cada sistema tiene un prompt optimo. Por no decir que Midjourney va "chetado" de prompts antes de que el prompt que tu pongas le llegue al sistema de generación. De ahí el consabido "estilo Midjourney" del que adolecen la mayoría de las imágenes hechas con midjourney.

Por ejemplo un prompt bien hecho para fotos de insectos macro te permite hacer esto...
 


 

f

#36 
Con una rtx y te descarga de GitHub FOOOCUS ya tienes para empezar  si quieres profundizar más, te descargas AUTOMATIC1111 y si quieres nodo hard ComfyUI. 
Stable Diffusion es una herramienta frente a otros que son productos cerrados 
 
 

S

Que buenos melones les dibuja a las jugadores de basketball. lol

j

Una duda para los que somos torpes.

Alguna manera de usar alguno de ellos de manera gratuita?

Gracias de antebrazo,jeje

b

#30 no aparece en el artículo pero este no está mal Leonardo.ai

j

#31 Gracias. Le echaré un vistazo

f

#30 Pues claro, Stable Diffusion lo puedes instalar en tu propio ordenador si tienes una Nvidia RTX. Tengo un perfil en instagram donde publico mis creaciones.



si estás interesado te puedo dar más información. Todo eso que ves en mi perfil está hecho con una RTX3060 o con una RTX3090, en casa.

j

#34 Pues la verdad que tengo gráfica Nvidia pero no llega a ser una RTX, pero muchas gracias por la información.

A

#30 Yo tengo una 1660super y tengo instalado Automatic1111 y confyui en mi ordenador y tiran bastante bien (automatic lo uso para SD1.5, Confy en modo fp8 para mis modelos). Yo suelo usar https://tensor.art/u/623084478000232742/posts que te da unas cuantas generaciones gratuitas al día y varias formas de conseguir más, el enlace es a mi galería. Como te decían hoy en día hay muchos sitios que te dejan pruebas gratuitas con determinada cantidad de usos diarios, https://leonardo.ai, https://seaart.ai, https://playgroundai.com, https://ideogram.ai ... estos son los que se me ocurren así a bote pronto, cada uno tiene sus pros y sus contras... pero puedes probarlos gratis con un determinado número de imágenes diarias.

A

#30 Se me olvidaba, Midjourney lo puedes probar gratis aqui: https://www.chatgot.io/

C

#30 Copilot (Bing) de Microsoft permite generar imágenes, no es la panacea pero es curioso.
En local me he instalado un modelo que me bajé de GitHub y sólo con descomprimirlo ya funcionaba, pero ahora mismo no recuerdo el nombre. Ése sí es más impresionante.

t

#30 Si tienes o te creas una cuenta de Microsoft (hotmail, outlook, ...) puedes usar Bing create.

m

Sabéis de alguna IA que permita insertar una foto y haga modificaciones del contenido a través del prompt?

Es para diseño de interiores, no me seáis mal pensados.

a

#49 Leonardo ai, la verdad es que he probado todas y para mí es la mejor y más completa. Y en cuanto a la parte premium de registro la mejor calidad precio. He estado usándola para trabajos y es una maravilla. La herramienta para mejorar la calidad y resolución de una imagen ya generada es top y como pides tiene esa opción que dices de edición de imágenes por pronts.

m

#50 voy a ver si hay posibilidad de registrarse para probar y en su caso pagar

CidFapeador

#49 En concreto el interior de la ropa de alguien

D

Spam