Hace 1 año | Por armadilloamaril... a youtube.com
Publicado hace 1 año por armadilloamarillo a youtube.com

¿Te imaginas una IA como DALL·E gratis en tu PC? Gratis, ilimitada y sin censura. Esta IA es Stable Diffusion, un nuevo modelo generador de imágenes como OpenAI DALL·E 2 o Google Imagen, pero Open Source. Puedes probarla a través de su web Dreamstudio o descargar desde GitHub el modelo. Y es que la creatividad ha de ser libre!

Comentarios

TDI

#1 Yo he puesto "ardilla con lanzallamas" y me ha puesto una ardilla con muchos dedos en los pies. No sé cómo será en comparación con Dall-E 2, aunque las cosas simples se ven bien.

#8 OH SI OY SI OG SI

mecha

#8 da pa' paja

thorin
Jakeukalane

#4 ¿Qué opinas?

Jakeukalane

#4 https://creator.nightcafe.studio/creation/WM2SmkMuAzVmmZlMA4Np Nightcafé también tiene Stable Diffusion.

e

#4 Dall-e 2 es mejor, especialmente si le específicas mucho lo que quieres. Por ej "squirrel with a flamethrower" da Los resultados de la imagen de abajo.

Jugando un poco con la frase puedes obtener mejores resultados:

https://labs.openai.com/s/56HIvNCF6dLLEnlIAQ43J531

N

#25 Estoy en la beta de dall-e 2 y te aseguro que ni de broma es mejor, y a eso sumale la censura panfila e infantil made in usa, como no se pongan las pilas se los van a comer, de hecho he intentado utilizar dall-e 2 un monton de veces, para cosas muy concretas, y no solo ha sido incapaz si no que los resultados han sido absolutamente decepcionantes, superado incluso por midjourney por mucho, y luego por delante está stable difusión que les mea a los dos en la cara pero de forma muy evidente, en tiempo de generación y en concreción

e

#34 tambien estoy en la beta de Dall-e 2 y he trasteado un par de horas con Stable Diffusion. Sinceramente en Stable soy incapaz de generar imágenes como un elefante con gorro de aviador, una mezcla de puercoespín con elefante (si he conseguido una mezcla de gato y elefante) o locuras similares. En cambio en Dalle2 a la primera... Mismo prompt.

Jakeukalane

#37 los prompts no pueden ser iguales si se quieren buenos resultados.

e

#34 tambien estoy en la beta de Dall-e 2 y he trasteado un par de horas con Stable Diffusion. Sinceramente en Stable soy incapaz de generar imágenes como un elefante con gorro de aviador, una mezcla de puercoespín con elefante (si he conseguido una mezcla de gato y elefante) o locuras similares. En cambio en Dalle2 a la primera... Mismo prompt.

Tambien personalmente me suelen gustar más los resultados de Dall-e 2 cuando por fin doy con algo en Stable Diffusion.

https://labs.openai.com/s/4mRsU5F33JQy4bMgc1yfN9dj

Tiempos para generar la imagen lógicamente gana Stable (de momento), y el tema censura es un hándicap, pero en mi opinión Dall-e 2 es muchísimo mejor en cuanto a los resultados obtenidos

Yemeral

#25 En algunas cosas es mucho mejor pero no en otras.

Por ejemplo, "Portrait of a dwarf warrior. Studio lighting. Very wise. Tough. Bokeh" me devuelve exactamente eso en Stable Diffusion.

En Dall-E diría que el resultado es... no sé... pero evidentemente no lo que buscaba. Los otros tres resultados de Dall-E eran incluso peores.

Os adjunto ambas fotos...

Jakeukalane

#41 le pusieron inclusividad a closedai. No es broma, eso hicieron.

e

#41 supongo que habrá temáticas en las que uno sea mejor que otro, o que subjetivamente nos guste más un resultado u otro. Tambien, lógicamente, los mismos prompt no funcionan igual en las dos herramientas.

Cambiandola un poco he obtenido mejores resultados (aún así me gusta más la tuya de Stable Diffusion)

https://labs.openai.com/s/xdijLdUvv1rpAGB3ImLorD3H

KevinCarter

#1 El cuchillo igual no te lo reconoce.

K

#1 Te va a sacar a las susodichas fabricando un objeto cortante.

#6 me sirve

Jakeukalane

#21 Todo es usar los servicios adecuados... Pero sí, la censura hipertalibán de DreamStudio es una vergüenza (ver #15)

BodyOfCrime

#23 No es mejor que Dall-e ni de coña. Que sea open source no lo hace mejor lo hace más libre. Voto errónea

Far_Voyager

#24 Depende. He sacado esto pidiéndole (en inglés) que sacara la diosa celta Brígida pelirroja, con un vestido medieval verde, y llevando una vela.

Me parece mejor que la de Dall-e, que parece todavía más abstracto e irreconocible, aunque reconozco haber usado la versión Lite y que usando la de lista de espera parecen salir cosas mucho mejores.

BodyOfCrime

#26 Pero es que no estás usando Dalle. Estas usando un triciclo con una pegatina que pone Ferrari. lol

De hecho Dalle mini tuvo que cambiar de nombre porque OpenAI se lo pidió ahora se llama craiyon.com

Jakeukalane

#26 eso es realmente dalle mini?

Far_Voyager

#68 No, excepto por la cara que es un desastre con Dall-E las imágenes son distintas.

Jakeukalane

#69 preguntaba porque vi que te dijeron que era de dalle mini pero creo que sí es dalle 2.

Jakeukalane

#24 ¿tienes beta de dall-e o lo comparas con las imágenes que hay en internet? Porque desde que lo lanzaron ha bajado mucho la calidad de dall-e. Es bastante mejor en cuanto a versatilidad y en algunos aspectos es mejor incluso en el dibujo (en otros no). O quizás es que no se usen los inputs adecuados. Cuanto más texto, mejor...* Para ver lo que realmente se hacía con Stable en la beta puedes ver su discord ( https://discord.gg/stablediffusion ) ahí puedes ver las imágenes de los primeros días con 150 iteraciones y tamaños enormes, para ver de lo que es capaz el modelo.

*

BodyOfCrime

#32 Dime que quieres que te haga? Es más dame una imagen, dime que borrar y que quieres que dalle reconstruya. Lo digo porque es algo que por ahora solo puede hacer Dalle. También puedo enseñarte la factura de lo que pague en Dalle por 150 tokens ( que me parece un poco robo)

De Stable Diffusion hay también unas cuantas mías por el discord de la herramienta.

SD no es mejor ni por asomo cualitativamente, tampoco es que Dalle sea la venida de Cristo,

Jakeukalane

#39 "ahora solo puede hacer Dalle"
No es cierto, hay diffusion con inpainting y outpainting, Latent Diffusion, Majesty Diffusion y Stable Diffusion (hasta VQGAN creo que había). Que no esté en herramientas web friendly con Stable Diffusion aún no significa que no se pueda hacer. Además que el inpainting de dalle da un poco de pena porque pierde todos los estilos, o al menos la última vez que lo usé, porque que dé tres imágenes en vez de cuatro me parece desperdiciar los créditos. Eso es otra limitación, que yo sepa no puedes darle parámetros a dalle específicos de tamaño de imagen, etc. Quizás sí se pueda porque he visto opciones de API que no tengo ni idea de lo que son, pero diría que no.
No es necesaria la factura, sólo era una pregunta porque dalle ha empeorado mucho.
En mi opinión sí hay veces que stable diffusion es bastante mejor que dalle2. Aquí hay una comparativa entre los tres:


Sí, a mí también me parece un robo, con stable diffusion me olvidé un poco de dalle2 y me caducaron 8 créditos y ahora tengo hasta el 31 para gastar 40 créditos gratuitos, no sé si me dará tiempo a gastarlos.

BodyOfCrime

#43 Me refería con las herramientas disponibles para el público, ya se que se podía de antes y no es un invento de OpenAI lol

Jakeukalane

#47 No veo relación entre mi comentario y tu respuesta. ¿De donde deduces que yo piense que es un invento de OpenAI?
> Herramientas disponibles para el público.
Es decir Stable/Majesty/Latent. Creo que dalle-2 sigue en beta y no todo el mundo tiene cuentas.
> No es un invento de ClosedAI
Nadie ha dicho que lo fuera.

BodyOfCrime

#48 No, no, me refiero a que yo decía que Dalle ofrece esa posibilidad y que MJ o SD no la ofrecen, de ahí tú me has dicho que es algo que ya existía pero que no era público y yo te he contestado diciendo que tienes razón y que ya sabía que no era algo inventado por OpenAI. No sé si ahora queda más claro.

Jakeukalane

#50 SD sí la ofrece. DreamStudio creo que no. Es público, simplemente hace falta saber usarlo.

Jakeukalane

#39 acepto el reto. ¿Qué tal "back of a beautiful woman" como decían en uno de los comentarios? Stable con muy pocas iteraciones hace media?type=comment&id=36499735&version=0&ts=1661274597&image.png
O si eso no hay manera de que no lo censure dalle: "alchemist mage with handsome face".
Pero me da cosa que gastes tus créditos pagados. Dame el prompt completo y lo hago yo con mis créditos gratuitos.

BodyOfCrime

#46 No me está quedando claro dos cosas:

1) El prompt final es este "back of a beautiful woman" o hay más cosas como estilo, tiro de cámara, técnica usada, etc?
2) Tienes Dalle y me pides que te lo haga pudiendo hacerlo tú? (Que no hay problema, simplemente me he quedado un poco así )

Jakeukalane

#49
1) back of a beautiful woman; trending digital fantasy art, realistic texture, 8k, perspective, high definition, ultra crisp, unreal engine 5, popular on artstation, daily deviation, vibrant, extremely detailed, style greg rutkowski
2) Sólo te he pedido el prompt para que sea más justa la comparativa, no que gastes tus créditos. De hecho me parecería mal que gastaras créditos pagados teniendo yo créditos gratuitos que seguramente me expiren.

BodyOfCrime

#52 Que yo sepa los créditos que expiran son los de pago y al año. Por otro lado no tengo claro que meter "unreal engine 5" vaya a casar nada bien con digital art o con el estilo de greg ratkowski, pero aún así lo hago y lo subo

editado:
Lo dicho, creo que unreal engine 5 no ha ayudado nada, pero ahí queda

Jakeukalane

#54 es lo que puse para esa imagen, no he dicho que sea el mejor prompt del mundo. Te pedía un prompt nuevo (el texto) con lo que considerases de estilos para que la comparativa fuera más justa. Y ya dije que no quiero que gastes créditos (?)

Jakeukalane

#54 bueno, al final gastaste un crédito cuando no era necesario, siento que no me hayas entendido. Me gustaría compensarlo de alguna manera. Si quieres que haga alguna ejecución de un prompt para ti, no habría ningún problema.

Sí, estoy de acuerdo en que unreal engine 5 no ha contribuido. Sigo pensando que DALLE-2 tiene sus puntos fuertes pero SD también los tiene. No es tan claro como decir "DALLE-2 es absolutamente mejor en todos los aspectos". Un saludo.

pd. los créditos por usuario alfa son de un año y los de usuario beta son de un mes. Me quedan 40 de un mes (hasta el 31 de agosto).

BodyOfCrime

#56 Que no coño, que el coste de un crédito es nímio, si te cuento la de gilipolleces que he hecho te echarías las manos a la cabeza.

Jakeukalane

#60 seguramente. Yo ahora estoy un poco saturado porque hay demasiadas alternativas. También me gusta bastante lo que hace Kandinsky. Aunque NO sea mejor que Dalle-2 ni SD.

BodyOfCrime

#61 Que salgan muchas es bueno, mejores precios, diferentes datasets y métodos de entrenamiento...

orangutan

#52 Con Stable diffusion no sale tan mal

Jakeukalane

#58 seguramente se sature y no tenga tanta influencia el unreal engine 5. Pero los mejores prompts para unos y otros son diferentes. No puedes usar ese prompt para Kandinsky y esperar que saque algo coherente por ejemplo. Pero no me entendió lo que quería hacer. Así que bueno.

j

#10 cierto lo de la censura. Le pedi una foto de un maniqui, y varias me salieron borrosas...

S

#10 Stable Diffusion es gratis. Lo que no lo es es su uso en dreamstudio. Si quieres usarlo gratis tienes que instalarlo en tu PC pero claro, necesitas una gráfica potente. Un tutorial para la instalación:

D

#42 Ok, gracias por la explicacion

Jakeukalane

#53 también puedes usar un Google colab. Si te interesa en una semana o así te enlazo uno que haga en español.

axisnaval

Pues ya tengo la tarde echá.

alehopio

"back of a beutifull woman"

pixelado como el hardcore japonés, ya estamos con el puritanismo ¿dónde queda el arte?

Grub

#21 Terminó en los 90's

s

Con estas cosas parece que los diseñadores gráficos, ilustradores, dibujantes, fotógrafos, etc... A no ser que sean muy buenos tienen los días contados como profesionales.
En una década lo que van a poder hacer las IA tiene pinta de que será imbatible. Sobre todo en precio.

Jakeukalane

#31 ya está afectando. Mi grupo de escritores y yo hemos dejado ya de hacer algunos encargos a dibujantes para hacerlos con IA.

s

#44 Normal. Yo tengo en proyecto algo que necesitará etiquetas en un par de años, y probablemente, cuando llegue el día de ponernos con ello vamos a utilizar estos recursos.

masde120

He probado Stable diffusion (o dreamstudio parece que se llama ahora) y me hace unas imágenes de mierda, que no se adaptan en absoluto a lo que pido y de una calidad pésima. No he probado dall e2 pero creo que será mejor.

masde120

#19 pude poner antes de que se me acabara el saldo realistic photo e hyperrealistic y me hacía obras como las del medievo... Muy mal. He visto cosas muy chulas en los videos pero en general también he visto que Dalle2 ya en los primeros resultados salen cosas mejores y aquí sólo de vez en cuando suena la flauta. Por este precio no me merece la pena, pero seguro que en un futuro será mejor,

Jakeukalane

#27 Stable Diffusion no es DreamStudio. No sé si en el vídeo lo equiparan pero esto se puede instalar en local o usar un Colab. Dalle2 no es tan bueno de primeras, como dije, porque lo han degradado muchísimo, para soportar a tanta gente. Esto está hecho con un google colab. Solo 50 iteraciones porque aún no sé cambiarlo. Pero es un .pyb que me pasaron, ahora los colabs serán mejores. La limitación era los 7.3 GB del modelo, pero se puede guardar en la propia cuenta o usar huggingfaces. En cualquier caso hay varias webs, latitude.io, nightcafé, dezgo, etc. que lo están implementando. Al ser open source el potencial es mucho más abierto que cualquier cosa que haga ClosedAI.

Jakeukalane

#27 #30 con la primera frase me refiero específicamente a que hay más Stable Diffusion que DreamStudio, por si no se entendió.

N

#17 Estoy desde la beta cerrada de dall-e 2 y te aseguro que no es mejor en absoluto

A

¿Tanto tiempo esperando a que me den acceso a DALL-E y cuando lo obtengo ahora este va a ser mejor? ¡¡¡SuPutaMadre!!!

Jakeukalane

#45 Va a pasar continuamente. IMAGEN seguramente cuando salga esté desfasado.