Hace 1 año | Por --689162-- a genbeta.com
Publicado hace 1 año por --689162-- a genbeta.com

Durante las últimas semanas hemos visto de lo que es capaz Stable Diffusion, la nueva inteligencia artificial de Stability AI que permite generar imágenes a través de una descripción en texto. DALL-E 2 fue la herramienta que sentó precedente en este sentido, y tras ella, han sido varias las que han salido a la luz para poder experimentar de lo que pueden ser capaz de forma gratuita. Stable Diffusion es una de ellas, y si bien se hizo popular de un modo 'peculiar', Se trata de una de las mejores herramientas para probar este modo de generar...

Comentarios

ronko

#1 Si eres youtuber o futbolista de éxito, eso es calderilla.

noexisto

#4 me espero a que salga la versión vídeo y le entreno con los tuits de Gallir para hacer podcast con un gallir-fake en plan Fabián Barrio
Todo un éxito!

Z

#1 Han bajado mucho, ahora estan por debajo del precio recomendado de salida. el que no tiene una grafica decente en estos momentos es pq no quiere

D

#13 Nuevas y así de 4gb valen más de 200€ wall

rojo_separatista

#1, teniendo en cuenta los requisitos que hasta hace nada pedían estos modelos para poder ejecutarse, que hayan logrado que se pueda ejecutar con un PC doméstico aunque sea con una 3090, es prácticamente magia, la verdad.

D

#1 Es suficiente con una GTX serie 10 de hace 6 años

Pilfer

#1 a mi siempre me llama la atención como ahora el espacio en disco nunca lo ponen, es como si ya no importara para nada

thorin

#5 ¿Cuanto tiempo te lleva generar algo?

radon2

#6 Depende de la calidad de la imagen y de la tarjeta gráfica , entre segundos y muchos minutos si no tienes una Nvidia.

pkreuzt

#5 #6 Con menos de 3GB de VRAM va a usar la CPU por mucha Nvidia que tengas.

Nadieenespecial

#6 con una gtx1070, entre 10 y 70s depende de lo que hagas, con los parámetros mas típicos 20s.

Yo estoy usando esta versión de la GUI no la que recomiendan, https://github.com/AUTOMATIC1111/stable-diffusion-webui , que si no me equivoco tiene muchas mas opciones avanzadas aunque sea mas jodida de usar en principio, la verdad es que estan cambiando todo a una velocidad que marea. Y en 10 días o así sacan la 1.5

PD: creo que la que recomiendan solo tiene la generación a partir de texto y no la manipulación de imágenes, supongo que para empezar esta bien. El que tenga interés y paciencia yo casi le recomendaría esperar un mes o así, que ahora mismo hay técnicas nuevas casi cada día.

noexisto

#20 Gracias!!

Jakeukalane

#20 el modelo 1.5 ya hay webs que lo usan así que quizás lo han liberado ya.

Nadieenespecial

#47 Supuestamente es el 25, no veo ninguna noticia de que el modelo sea publico. Sera una especie de beta privada, se que ya lo puede usar cierta gente, pero la verdad es que prefiero esperar.
También comentar que esta Waifu diffusion que es stable diffusion pero reentrenado con imágenes de anime, y dicen para ese uso es mucho mucho mejor https://github.com/harubaru/waifu-diffusion
No soy muy fan del anime así que no puedo opinar ya que estoy usando el modelo normal

Jakeukalane

#51 entiendo. Sí, puede que sea algún tipo de acuerdo o que estén mintiendo o que no hayan liberado los "pesos" (al menos eso pasó con el 1.4).
Waifu diffusion tengo que agregarlo a mi lista. Al ser github supongo que es instalable (tengo pocos datos móviles).

Nadieenespecial

#53 SI hablas del waifu, es simplemente poner el archivo de ese modelo en vez del original.
Para instalar usa el enlace del articulo, o el que yo recomiendo https://github.com/AUTOMATIC1111/stable-diffusion-webui

Jakeukalane

#54 sí, me refería a ese, actualicé el comentario. Otro que agregar en https://tuscriaturas.miraheze.org/wiki/Texto_a_imagen#Stable_Diffusion

danymuck

#6 yo con una 1080ti y un i9 9900k tarda menos de un minuto. Depende de lo que pidas.

Grub

#30 Con con una Raspberry 4 tardo unos 13 segundos por imagen en Colab 16 segundos con filtro faces y unos 40 ampliando 4k. Pero no lo tengo en casa y estoy mirando de comprar una tarjeta y un sobremesa decente (no soy de jugar) cry

noexisto

#5 Gracias!!

Jakeukalane

#29 mañana me caducan 15 créditos de dalle2. Este mes no he usado ninguno. Y llevo cerca de 1000 imágenes de SD en un server de discord y 2500 en dezgo...

Jakeukalane

#9 no funciona así.

javierchiclana

Se puede hacer online. ¿Recomendáis alguna web?

Zeratul

#15 La IA de la noticia tiene un servicio web oficial de pago: https://beta.dreamstudio.ai/

Al crearte una cuenta te dan créditos para que la pruebes. Llegan para hacer varias pruebas antes de que te pida comprar más créditos.

Xavier_Martinez

#15 https://huggingface.co/spaces/stabilityai/stable-diffusion es la que uso desde hace una semana que descubrí esta cosa.

E

Diferencia entre ForoCoches y meneame:

En ForoCoches en noticias así se ponen en el hilo ejemplos de imágenes generadas a partir de frases típicas por ejemplo Alonso de cera, o camión demigrante.

En Menéame se quejan de que si las tarjetas son muy caras, que si pide mucha RAM. A pesar de haber mucho informático que afirma no moverse del sofá por menos de 55k anuales.

A ver, esos Ferrari de Gallir dónde están, que yo los vea.

Nadieenespecial

#34 Dame un rato lol

E

#39 lo malo es la traducción al inglés que términos como "hurtcock" "equidistant" no son fáciles de traducir, otros como "pussypass" pierden matices y machirulo no se me ocurre manera de que lo entienda con una palabra... Aunque sea sustituible por "Bertín Osborne lookalike" en la práctica

Nadieenespecial

#40 Ya bueno, yo en meter el texto para generar la imagen soy bastante malo, soy mas de usar img2img para modificar una imagen en otra.

Lo que estoy intentando es el modo inpaint con una foto suya, que nunca lo he usado hasta ahora

Nadieenespecial

#40 Que no hay manera de regenerar al pobregallirgallir es inimitable. Yo por hoy lo dejo, si me acuerdo otro dia que maneje mejor los nuevos modos del img2img le doy de nuevo a ver.

E

#56 a ver más creatividad ...

Orange cartoon elephant driving a red Italian sports car

D

#34 un informático de los de 55k que haya (si hay) yo creo que esto de instalarse un programa y ponerlo a funcionar lo hará solo si cobra. Vamos, supongo. No va a hacer gratis algo por lo que suele cobrar.

Zeratul

#34 Yo la estuve probando hace una semana, la mayoría de las imágenes son rarunas y poco creíbles. Hay que dedicar tiempo a encontrar las palabras clave "semilla" que consigan lo que quieres.

Lo mejor que conseguí es esta imagen de "Drácula" con estilo Caravaggio:

D

#49 Mira en lexica.art ahí tienes millones de ejemplos de imágenes generadas con stable diffusion asi como sus palabras y ajustes para que puedas hacerlas tu sin esfuerzo. Adjunto una que he hecho con Waifu Diffusion, que es una variante de stable diffusion pero entrenada con imágenes de manga y anime.

Zeratul

#52 Gracias, lo probaré.

iveldie

#67 en youtube hay un tutorial muy interesante donde lo explica todo, te dice todos los métodos, el último que explica casi al final del video es el que uso yo, aunque si te interesa el tema mirate el video entero

thorin

#68 ¡Muchas gracias!

thorin

#68 He conseguido hacerlo a través de Google Colab.

Mañana en el curro me pongo a escuchar el resto del vídeo, a ver qué consejos de optimización da.
La verdad es que por 10€ igual me lo pienso para hacer el tonto durante un mes, si es que acelera mucho la velocidad.

iveldie

#71 a mi 15 segundos me parece una velocidad impresionante pra el resultado que da, pero pruebalo y me cuentas. Pasate por mi perfil de facebook donde publico algunas cosas que he hecho con stable difussion, poniendo mi nick y ame encontraras, no se si e puede publicar por aqui

thorin

#72 He mirado y has clavado bastante los retratos de famosos gracias a los parámetros extra que has usado.
A mi no me salen todavía tan bien.

iveldie

#73 hay gente que dice que no es artístico ni imaginativo, que lo hace cualquiera. Yo creo que su parte artística e imaginativa si la tiene. También tiene su parte de aprendizaje y hay que trastear mucho hasta tener buenos resultados.

manbobi

Lo he instalado y tarda segundos en generar la imagen

Pacman

Pues lo voy a probar. Para webs y apps es un dolor (de cabeza y de bolsillo) andar por los bancos de imágenes.

Esto se considera tuyo, libre de uso, no?

Cyberbob

#14 Si, el problema es que salvo para cosas muy concretas y abstractas nunca va a sustituir a una foto de stock buena.

Pero está claro que si te dedicas a eso debería ser una herramienta más en el cinturón, claro.

Por cierto, hay bancos de imágenes, dibujos, iconos gratuitos … y de buena calidad … muchos de ellos con licencia permisiva (permiten uso comercial la mayoría) Les das algo de visibilidad a los creadores y a ti te sale gratis. No es tan malo.

m

#16 algún enlace? Gracias

Zeratul

#14 Hay debate al respecto. La IA no crea una imagen desde cero, sino que es entrenada con imágenes ya existentes, en muchos casos imágenes que no son de libre uso.

Pero en principio, sí, las imágenes creadas por la IA son de libre uso. O más bien tú tendrías los derechos sobre esa imagen, pues entiendo que con la legislación actual la IA se consideraría una herramienta y tú serías el creador legal de la imagen.

Zeratul

#25 Estoy de acuerdo. Pero muchos ilustradores no opinan igual, supongo que en parte por miedo a que en un futuro las IA les quiten el trabajo.

noexisto

#26 he leído al respecto y está claro que quien pueda elegir ilustrador lo hará o lo complementará
En estos momentos gran parte de (por ejemplo) youtubers no usan los servicios de ningún ilustrador para hacer una carátula al vídeo (como se llame) pero sí usarán esta herramienta.
Es como la edición musical que se ha democratizado a niveles bestiales. Dile a cualquier músico de los 60-70-80-90s como se hace en día y que habrían hecho de tener un pc

Nova6K0

#19 En todo caso, y como mucho el copyright, sería de quién crea el programa. Que hablando, muy entre comillas, sería una obra derivada.

Pero ya hay sentencias en contra de que una obra que no tiene intervención humana directa, no se puede considerar como protegida por derechos de propiedad intelectual. Y es lógico. Claro que si lo aplicasen a rajatabla, quienes no saben cantar, y tienen que usar siempre el autotune, los vería mal... Porque el autotune no es solo un filtro como se dice, si no una IA que usa una serie de filtros, que es distinto. Muy resumidamente, hablando.

Saludos.

Jakeukalane

Edit

Metabron

Dentro de nada todo el trabajo lo harán las IA y los robots, ¿Y que pasa con las personas? En nuestra mano queda que lo que viene sea una utopia o una distopia apocaliptica

D

Joder, a mi que me costó la vida instalarlo en local hace unas semanas y ahora lo hacen asi de facil.

daTO

#12 está de add-on en Photoshop,

danymuck

Para mi la mejor de estas IA es la de MidJourney. Es un bot en Discord, no necesitas una pedazo de gráfica ya que se generan las imágenes en la nube, o eso creo. Te genera 4 de una vez y el estilo es mucho más artístico, ilustración, etc. no como la de SD que es más tipo pintura y no fui capaz de sacar imágenes tipo ilustración por mucho que se lo pidas. Siempre tiene ese filtro como de dibujado.

Lo malo es que tienes 200 búsquedas gratis y después tienes que pagar pero yo tengo en favoritos autenticas obras artísticas dignas de cualquier ilustrador. Mi objetivo es tener todos mis cuadros de casa hechos con esta IA. A mi me parece alucinante y estamos hablando de un bot de Discord. Te puedas pasar horas y horas ahí delante del Discord diciéndole que te retoque esto o lo otro o que le añada lo que sea. Y además puedes ver las imágenes que el resto de la gente le está pidiendo a la IA así que ya no solo puedes guardar tus propias imágenes sino que también puedes guardar las de los demás.

Hay muchas que te dejan con la boca abierta.

Metabron

#31 Midjourney es la ostia para obras artísticas, pero para fotorealismo no acabo de verlo, creo que es por el tipo de imagenes con que lo han entrenado. Por ahora lo dejan gratis para que le entrenemos a la IA por la cara y luego cobraran el servicio, pero creo que Stable Diffusion es open source.

fr1k1

#33 depende de los parámetros, comomsiempre. Mientras lo probaba en discord había un tío pidiéndole un Citroën koenisseg fotorrealista y lo petaba

thorin

#31 A mi la interfaz de discord me parece engorrosa.
Ojalá se pueda hacer directamente en una página web normal.

Jakeukalane

#31 SD puede sacar lo que le pidas. Pero es fundamental que la frase sea larga.

Grub

#60 Si pides algo sencillo, lo borda. "chica guapa" en inglés, claro.
Entiendo que hay un exceso de entrenamiento en algunas imágenes.
No estoy en contra...

Jakeukalane

#31 si quieres dile a thorin que hay muchas webs normales para hacer SD. Incluso hay UIs de discord... generar-imagenes-ia-alta-resolucion-esta-solo-clic-windows-10-11/c055#c-55

Hace 1 año | Por --689162-- a genbeta.com

iveldie

Yo como tengo un mac un poco antiguo lo que hago es conectarme con un super ordenador de google mediante google collab y con un script conecta a mi google drive me envia ahi las imagenes generadas en unos 15 segundos. Me desconecta cada icerto tiempo pero uso 3 cuentas distitnas y asi puedo usarlo siempre que quiera

thorin

#44 ¿Y eso en cuanto dinero se traduce?

iveldie

#62 cero, pero si quieres usar solamente una cuenta y usarlo ilimitadamente son 9,25 al mes

thorin

#66 Pues ya es más barato que contratar directamente Midjourney, Dall-E 2, etc. porque salen por unos 30 USD más IVA.

Gracias, voy a mirar cómo va

D

Tengo la idea de que estas cosas consisten en que tú entrenas una Inteligencia Artificial y además pagas por ello. ¿ Es así ?

D

#8 Hombre, si te muestra 8 resultados y tú le dices cuál es el bueno, estás entrenando a la máquina.
Gracias por la explicación, está bien saber que hay una comunidad detrás.

leporcine

Uf subidón, a ver qué tal funciona.