Hace 1 año | Por armadilloamaril... a youtube.com
Publicado hace 1 año por armadilloamarillo a youtube.com

¿Te imaginas una IA como DALL·E gratis en tu PC? Gratis, ilimitada y sin censura. Esta IA es Stable Diffusion, un nuevo modelo generador de imágenes como OpenAI DALL·E 2 o Google Imagen, pero Open Source. Puedes probarla a través de su web Dreamstudio o descargar desde GitHub el modelo. Y es que la creatividad ha de ser libre!

Comentarios

Jakeukalane

#4 ¿Qué opinas?

thorin
mecha

#8 da pa' paja

Jakeukalane

#21 Todo es usar los servicios adecuados... Pero sí, la censura hipertalibán de DreamStudio es una vergüenza (ver #15)

axisnaval

Pues ya tengo la tarde echá.

#8 OH SI OY SI OG SI

alehopio

"back of a beutifull woman"

pixelado como el hardcore japonés, ya estamos con el puritanismo ¿dónde queda el arte?

TDI

#1 Yo he puesto "ardilla con lanzallamas" y me ha puesto una ardilla con muchos dedos en los pies. No sé cómo será en comparación con Dall-E 2, aunque las cosas simples se ven bien.

KevinCarter

#1 El cuchillo igual no te lo reconoce.

Jakeukalane

#4 https://creator.nightcafe.studio/creation/WM2SmkMuAzVmmZlMA4Np Nightcafé también tiene Stable Diffusion.

N

#25 Estoy en la beta de dall-e 2 y te aseguro que ni de broma es mejor, y a eso sumale la censura panfila e infantil made in usa, como no se pongan las pilas se los van a comer, de hecho he intentado utilizar dall-e 2 un monton de veces, para cosas muy concretas, y no solo ha sido incapaz si no que los resultados han sido absolutamente decepcionantes, superado incluso por midjourney por mucho, y luego por delante está stable difusión que les mea a los dos en la cara pero de forma muy evidente, en tiempo de generación y en concreción

s

Con estas cosas parece que los diseñadores gráficos, ilustradores, dibujantes, fotógrafos, etc... A no ser que sean muy buenos tienen los días contados como profesionales.
En una década lo que van a poder hacer las IA tiene pinta de que será imbatible. Sobre todo en precio.

e

#41 supongo que habrá temáticas en las que uno sea mejor que otro, o que subjetivamente nos guste más un resultado u otro. Tambien, lógicamente, los mismos prompt no funcionan igual en las dos herramientas.

Cambiandola un poco he obtenido mejores resultados (aún así me gusta más la tuya de Stable Diffusion)

https://labs.openai.com/s/xdijLdUvv1rpAGB3ImLorD3H

e

#4 Dall-e 2 es mejor, especialmente si le específicas mucho lo que quieres. Por ej "squirrel with a flamethrower" da Los resultados de la imagen de abajo.

Jugando un poco con la frase puedes obtener mejores resultados:

https://labs.openai.com/s/56HIvNCF6dLLEnlIAQ43J531

Yemeral

#25 En algunas cosas es mucho mejor pero no en otras.

Por ejemplo, "Portrait of a dwarf warrior. Studio lighting. Very wise. Tough. Bokeh" me devuelve exactamente eso en Stable Diffusion.

En Dall-E diría que el resultado es... no sé... pero evidentemente no lo que buscaba. Los otros tres resultados de Dall-E eran incluso peores.

Os adjunto ambas fotos...

K

#1 Te va a sacar a las susodichas fabricando un objeto cortante.

#6 me sirve

BodyOfCrime

#52 Que yo sepa los créditos que expiran son los de pago y al año. Por otro lado no tengo claro que meter "unreal engine 5" vaya a casar nada bien con digital art o con el estilo de greg ratkowski, pero aún así lo hago y lo subo

editado:
Lo dicho, creo que unreal engine 5 no ha ayudado nada, pero ahí queda

BodyOfCrime

#56 Que no coño, que el coste de un crédito es nímio, si te cuento la de gilipolleces que he hecho te echarías las manos a la cabeza.

BodyOfCrime

#61 Que salgan muchas es bueno, mejores precios, diferentes datasets y métodos de entrenamiento...

masde120

He probado Stable diffusion (o dreamstudio parece que se llama ahora) y me hace unas imágenes de mierda, que no se adaptan en absoluto a lo que pido y de una calidad pésima. No he probado dall e2 pero creo que será mejor.

orangutan

#52 Con Stable diffusion no sale tan mal

Jakeukalane

#37 los prompts no pueden ser iguales si se quieren buenos resultados.

s

#44 Normal. Yo tengo en proyecto algo que necesitará etiquetas en un par de años, y probablemente, cuando llegue el día de ponernos con ello vamos a utilizar estos recursos.

Jakeukalane

#53 también puedes usar un Google colab. Si te interesa en una semana o así te enlazo uno que haga en español.

Far_Voyager

#24 Depende. He sacado esto pidiéndole (en inglés) que sacara la diosa celta Brígida pelirroja, con un vestido medieval verde, y llevando una vela.

Me parece mejor que la de Dall-e, que parece todavía más abstracto e irreconocible, aunque reconozco haber usado la versión Lite y que usando la de lista de espera parecen salir cosas mucho mejores.

BodyOfCrime

#26 Pero es que no estás usando Dalle. Estas usando un triciclo con una pegatina que pone Ferrari. lol

De hecho Dalle mini tuvo que cambiar de nombre porque OpenAI se lo pidió ahora se llama craiyon.com

Far_Voyager

#68 No, excepto por la cara que es un desastre con Dall-E las imágenes son distintas.

Jakeukalane

#69 preguntaba porque vi que te dijeron que era de dalle mini pero creo que sí es dalle 2.

Jakeukalane

#27 Stable Diffusion no es DreamStudio. No sé si en el vídeo lo equiparan pero esto se puede instalar en local o usar un Colab. Dalle2 no es tan bueno de primeras, como dije, porque lo han degradado muchísimo, para soportar a tanta gente. Esto está hecho con un google colab. Solo 50 iteraciones porque aún no sé cambiarlo. Pero es un .pyb que me pasaron, ahora los colabs serán mejores. La limitación era los 7.3 GB del modelo, pero se puede guardar en la propia cuenta o usar huggingfaces. En cualquier caso hay varias webs, latitude.io, nightcafé, dezgo, etc. que lo están implementando. Al ser open source el potencial es mucho más abierto que cualquier cosa que haga ClosedAI.

S

#10 Stable Diffusion es gratis. Lo que no lo es es su uso en dreamstudio. Si quieres usarlo gratis tienes que instalarlo en tu PC pero claro, necesitas una gráfica potente. Un tutorial para la instalación:

Jakeukalane

#31 ya está afectando. Mi grupo de escritores y yo hemos dejado ya de hacer algunos encargos a dibujantes para hacerlos con IA.

Jakeukalane

#41 le pusieron inclusividad a closedai. No es broma, eso hicieron.

BodyOfCrime

#23 No es mejor que Dall-e ni de coña. Que sea open source no lo hace mejor lo hace más libre. Voto errónea

Jakeukalane

#24 ¿tienes beta de dall-e o lo comparas con las imágenes que hay en internet? Porque desde que lo lanzaron ha bajado mucho la calidad de dall-e. Es bastante mejor en cuanto a versatilidad y en algunos aspectos es mejor incluso en el dibujo (en otros no). O quizás es que no se usen los inputs adecuados. Cuanto más texto, mejor...* Para ver lo que realmente se hacía con Stable en la beta puedes ver su discord ( https://discord.gg/stablediffusion ) ahí puedes ver las imágenes de los primeros días con 150 iteraciones y tamaños enormes, para ver de lo que es capaz el modelo.

*

Jakeukalane

#27 #30 con la primera frase me refiero específicamente a que hay más Stable Diffusion que DreamStudio, por si no se entendió.

BodyOfCrime

#32 Dime que quieres que te haga? Es más dame una imagen, dime que borrar y que quieres que dalle reconstruya. Lo digo porque es algo que por ahora solo puede hacer Dalle. También puedo enseñarte la factura de lo que pague en Dalle por 150 tokens ( que me parece un poco robo)

De Stable Diffusion hay también unas cuantas mías por el discord de la herramienta.

SD no es mejor ni por asomo cualitativamente, tampoco es que Dalle sea la venida de Cristo,

Jakeukalane

#39 "ahora solo puede hacer Dalle"
No es cierto, hay diffusion con inpainting y outpainting, Latent Diffusion, Majesty Diffusion y Stable Diffusion (hasta VQGAN creo que había). Que no esté en herramientas web friendly con Stable Diffusion aún no significa que no se pueda hacer. Además que el inpainting de dalle da un poco de pena porque pierde todos los estilos, o al menos la última vez que lo usé, porque que dé tres imágenes en vez de cuatro me parece desperdiciar los créditos. Eso es otra limitación, que yo sepa no puedes darle parámetros a dalle específicos de tamaño de imagen, etc. Quizás sí se pueda porque he visto opciones de API que no tengo ni idea de lo que son, pero diría que no.
No es necesaria la factura, sólo era una pregunta porque dalle ha empeorado mucho.
En mi opinión sí hay veces que stable diffusion es bastante mejor que dalle2. Aquí hay una comparativa entre los tres:


Sí, a mí también me parece un robo, con stable diffusion me olvidé un poco de dalle2 y me caducaron 8 créditos y ahora tengo hasta el 31 para gastar 40 créditos gratuitos, no sé si me dará tiempo a gastarlos.

Jakeukalane

#39 acepto el reto. ¿Qué tal "back of a beautiful woman" como decían en uno de los comentarios? Stable con muy pocas iteraciones hace media?type=comment&id=36499735&version=0&ts=1661274597&image.png
O si eso no hay manera de que no lo censure dalle: "alchemist mage with handsome face".
Pero me da cosa que gastes tus créditos pagados. Dame el prompt completo y lo hago yo con mis créditos gratuitos.

BodyOfCrime

#43 Me refería con las herramientas disponibles para el público, ya se que se podía de antes y no es un invento de OpenAI lol

Jakeukalane

#47 No veo relación entre mi comentario y tu respuesta. ¿De donde deduces que yo piense que es un invento de OpenAI?
> Herramientas disponibles para el público.
Es decir Stable/Majesty/Latent. Creo que dalle-2 sigue en beta y no todo el mundo tiene cuentas.
> No es un invento de ClosedAI
Nadie ha dicho que lo fuera.

BodyOfCrime

#46 No me está quedando claro dos cosas:

1) El prompt final es este "back of a beautiful woman" o hay más cosas como estilo, tiro de cámara, técnica usada, etc?
2) Tienes Dalle y me pides que te lo haga pudiendo hacerlo tú? (Que no hay problema, simplemente me he quedado un poco así )

BodyOfCrime

#48 No, no, me refiero a que yo decía que Dalle ofrece esa posibilidad y que MJ o SD no la ofrecen, de ahí tú me has dicho que es algo que ya existía pero que no era público y yo te he contestado diciendo que tienes razón y que ya sabía que no era algo inventado por OpenAI. No sé si ahora queda más claro.

Jakeukalane

#50 SD sí la ofrece. DreamStudio creo que no. Es público, simplemente hace falta saber usarlo.

Jakeukalane

#49
1) back of a beautiful woman; trending digital fantasy art, realistic texture, 8k, perspective, high definition, ultra crisp, unreal engine 5, popular on artstation, daily deviation, vibrant, extremely detailed, style greg rutkowski
2) Sólo te he pedido el prompt para que sea más justa la comparativa, no que gastes tus créditos. De hecho me parecería mal que gastaras créditos pagados teniendo yo créditos gratuitos que seguramente me expiren.

Jakeukalane

#54 es lo que puse para esa imagen, no he dicho que sea el mejor prompt del mundo. Te pedía un prompt nuevo (el texto) con lo que considerases de estilos para que la comparativa fuera más justa. Y ya dije que no quiero que gastes créditos (?)

Jakeukalane

#54 bueno, al final gastaste un crédito cuando no era necesario, siento que no me hayas entendido. Me gustaría compensarlo de alguna manera. Si quieres que haga alguna ejecución de un prompt para ti, no habría ningún problema.

Sí, estoy de acuerdo en que unreal engine 5 no ha contribuido. Sigo pensando que DALLE-2 tiene sus puntos fuertes pero SD también los tiene. No es tan claro como decir "DALLE-2 es absolutamente mejor en todos los aspectos". Un saludo.

pd. los créditos por usuario alfa son de un año y los de usuario beta son de un mes. Me quedan 40 de un mes (hasta el 31 de agosto).

Jakeukalane

#45 Va a pasar continuamente. IMAGEN seguramente cuando salga esté desfasado.

Jakeukalane

#58 seguramente se sature y no tenga tanta influencia el unreal engine 5. Pero los mejores prompts para unos y otros son diferentes. No puedes usar ese prompt para Kandinsky y esperar que saque algo coherente por ejemplo. Pero no me entendió lo que quería hacer. Así que bueno.

Jakeukalane

#60 seguramente. Yo ahora estoy un poco saturado porque hay demasiadas alternativas. También me gusta bastante lo que hace Kandinsky. Aunque NO sea mejor que Dalle-2 ni SD.

Jakeukalane

#26 eso es realmente dalle mini?

masde120

#19 pude poner antes de que se me acabara el saldo realistic photo e hyperrealistic y me hacía obras como las del medievo... Muy mal. He visto cosas muy chulas en los videos pero en general también he visto que Dalle2 ya en los primeros resultados salen cosas mejores y aquí sólo de vez en cuando suena la flauta. Por este precio no me merece la pena, pero seguro que en un futuro será mejor,

j

#10 cierto lo de la censura. Le pedi una foto de un maniqui, y varias me salieron borrosas...

e

#34 tambien estoy en la beta de Dall-e 2 y he trasteado un par de horas con Stable Diffusion. Sinceramente en Stable soy incapaz de generar imágenes como un elefante con gorro de aviador, una mezcla de puercoespín con elefante (si he conseguido una mezcla de gato y elefante) o locuras similares. En cambio en Dalle2 a la primera... Mismo prompt.

e

#34 tambien estoy en la beta de Dall-e 2 y he trasteado un par de horas con Stable Diffusion. Sinceramente en Stable soy incapaz de generar imágenes como un elefante con gorro de aviador, una mezcla de puercoespín con elefante (si he conseguido una mezcla de gato y elefante) o locuras similares. En cambio en Dalle2 a la primera... Mismo prompt.

Tambien personalmente me suelen gustar más los resultados de Dall-e 2 cuando por fin doy con algo en Stable Diffusion.

https://labs.openai.com/s/4mRsU5F33JQy4bMgc1yfN9dj

Tiempos para generar la imagen lógicamente gana Stable (de momento), y el tema censura es un hándicap, pero en mi opinión Dall-e 2 es muchísimo mejor en cuanto a los resultados obtenidos

D

#42 Ok, gracias por la explicacion

Grub

#21 Terminó en los 90's

N

#17 Estoy desde la beta cerrada de dall-e 2 y te aseguro que no es mejor en absoluto

A

¿Tanto tiempo esperando a que me den acceso a DALL-E y cuando lo obtengo ahora este va a ser mejor? ¡¡¡SuPutaMadre!!!