Hace 10 meses | Por geralt_ a firstpost.com

Publicado hace 10 meses por geralt_ a firstpost.com

ChatGPT en apuros: OpenAI demandada por robar todo lo que se ha escrito en Internet [ENG]

firstpost.com

OpenAI recopiló una enorme cantidad de datos de diversas fuentes de Internet para entrenar sus avanzados modelos lingüísticos de IA. Estos conjuntos de datos consisten en una amplia gama de materiales, como artículos de Wikipedia, libros populares, publicaciones en redes sociales e incluso contenido explícito de géneros especializados. Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos.

comentarios destacados

#13: #11 ¿Acceso ilegítimo a la wikipedia? ¿a libros? ¿a posts en foros? ¿acceso ilegítimo a este comentario?

¿cómo va a ser eso ilegítimo?

Surrealista, como estamos acostumbrados en este mundo de jetas y locos del copyright.

fugaz

hace 10 meses

#4: ¿Y por qué tenía que pedir permiso para leer datos accesibles en la web, que por ejemplo Google lleva indexando décadas?

alexwing

hace 10 meses

#7: #1 O a lo mejor es fair use.
Que sería lo lógico para una IA que aprende de lo que ve, si no estuviéramos atontados por la exageración de celo en derechos de autor.

fugaz

hace 10 meses

#3: which is used for profit

Van a tener que demostrar eso. OpenAI es una entidad sin ánimo de lucro. La financiación la obtienen de una subsidiaria con beneficios limitados.

https://openai.com/our-structure

Gry

hace 10 meses

#96: #4 #43
No es solo permiso para "leer".
Si alguien como yo escribe algo de forma pública, como un blog, o este comentario de Meneame, se entiende que das permiso a cualquiera para leerlo. Por tanto, que lo "lean" no es problema.
El problema es si tomas un blog escrito por otro, lo copias, y lo pones en una web tuya ¡como si lo hubieras escrito tú! Sin mencionar al autor original. Esto es lo que se llama plagio, una violación de copyright. No mencionar al autor original es violar el derecho de reconocimiento (BY). Todo autor tiene derecho a que se reconozca que él fue el autor de esa obra.
Por otro lado, desde el momento que ChatGPT u otras herramientas de OpenAI cobran dinero por sus servicios, se están lucrando. Te dan información de obras que otros han creado y te cobran por ello... Eso es ánimo de lucro.

Lo de Google es diferente porque:

1. Aunque no sepa o no diga cuál es el autor original, te da el enlace a la fuente. Lo que quiere decir esto es que Google deja claro que esas creaciones NO son creación suya... No es un plagio. El enlace a la fuente lo que viene a decir es : alguien, en tal sitio escribió esto y puedes ir a la fuente...

2. Google no muestra la obra completa, sino un extracto. Esto creo que se considera uso aceptable (fair use) avalado por lo que conoce como "derecho de cita". No es que publique un artículo de periódico entero, sino que dice "estas frases aparecen en tal obra", como quien nombra una frase de una peli o de una novela.

3. Google no cobra a quienes da la información / frases escritas por otros... No se lucra exactamente con ese trabajo de otros, sino que cobra a unos anunciantes que quieren aparecer en las búsquedas.

4. Google da el derecho a ser excluido, a no aparecer en las búsquedas. Aunque no sé si el mismo "robots.txt" impediría a OpenAI usar esos datos.

5. El buscador Google no te muestra textos de mensajes privados, como podrían ser emails que alguien escribió en Gmail. Por lo que dicen otros, parece ser que OpenAI sí ha usado datos privados...

#9 Aunque el artículo meneado usa la palabra "robar", sin embargo, creo que puede ser un titular sensacionalista o una forma de hablar.
En lenguaje jurídico un robo es sustraer algo con violencia o amenaza (ej: a punta de pistola, o estrellando un coche contra un escaparate). En el caso de OpenAI no hay violencia, así que no puede ser "robo" en ese sentido jurídico. Por otro lado está el "hurto", que es sustraer algo sin violencia. Pero creo que tampoco es eso porque sustraer es quitar algo de forma que el dueño legítimo no pueda disfrutar de ello, aunque sea dinero de una cuenta y no un objeto físico. Si copias una peli, la publicas en Internet y te lucras con ello no impides que otros tengan su copia y puedan disfrutar de ella, así que no es hurto sino violación de derechos de autor... El autor original es quien tiene derecho, o bien a lucrarse o bien a dar permiso de explotación a otro para que otro se lucre, pero en general es ilegal lucrarse con las obras de otros sin que te hayan dado permiso.

Un caso relacionado podría ser el de PirateBay, una web que daba enlaces para descargarse obras como películas. Mientras no se lucrara no estaba violando ninguna ley. Además, no copiaba ni transmitía la obra en sí, sino un enlace, generalmente de P2P donde se podría descargar la obra sin ningún pago.
Una diferencia entre esto y Google es que esto se refiere a obras como pelis que buscan un lucro y que no están a disposición pública.

Desde mi punto de vista, lo que hace OpenAi se parece un poco a las copias piratas de productos como zapatillas Adidas cambiando el nombre y llamándolas zapatillas Adios. Se aprovechan del trabajo de otros y se lucran con ello, sin permiso del autor original. La diferencia es que en estos productos hay unas marcas registradas protegidas legalmente y en general en los datos usados por OpenAI no suele haber marcas, o no usan la marca para engañar a quien paga.

Cc: #7

Acido

hace 10 meses

#24: #4 Que los datos sean accesibles no quiere decir que se renuncie a los derechos de copia. Google no incurre en ningún delito porque tan sólo muestra una pequeña cita y te pone el enlace de la fuente, chatGPT copia todo sin mencionar fuentes. Si haces preguntas muy específicas sobre contenidos e una página, puedes llegar a obtener textos literales de la página web en la respuesta

Fingolfin

hace 10 meses

#6: #3 También han demandado a los propietarios de esa subsidiaria (p.ej. Microsoft), entre otros.

vs OPENAI LP, OPENAI INCORPORATED, OPENAI GP, LLC, OPENAI STARTUP FUND I, LP, OPENAI STARTUP FUND GP I, LLC, OPENAI STARTUP FUND MANAGEMENT LLC, MICROSOFT CORPORATION

https://clarksonlawfirm.com/wp-content/uploads/2023/06/0001.-2023.06.28-OpenAI-Complaint.pdf (157 páginas )

Unregistered

hace 10 meses

#82: #80 De la fuente que citas:

The doctor died in 2018, and the artist assumes that the images were stolen after his death and published on the Internet.

Pues igual que un buscador como Google. Si tú haces una entrada en un blog y pones una foto robada en esa entrada Google lo indexará sin comprobar la legalidad de esa fotografía. El responsable de hacerla pública es quien crea la entrada del blog, los robots como Google u OpenIA u otros lo que hacen es pasearse por lo que hay publicado y lo indexan, respetando en todo caso el robots.txt.

Existen procedimientos para hacer reclamaciones tanto a Google como a otras empresas para la retirada de contenidos que cumplan los requisitos legales para ser retirados.

sorrillo

hace 10 meses

#88: #86 Si estaba publicado en Internet tú podías haberlo visto navegando y ChatGPT también ha podido verlo.

No te lo pueden quitar de tu cerebro, lo mismo con GPT.

A quien hay que perseguir es a quien publicó de forma ilegal, no a quien lo vió publicado y aprendió de ello.

sorrillo

hace 10 meses

#30: #19 Google sí es capaz de reescribirlos completos, como se puede ver cuando se consulta el caché de una web que sale en sus resultados.

Por contra ChatGPT lo que hace es aprender de los contenidos y luego hace una creación nueva en base al aprendizaje obtenido, no es distinto a que tú te pasees por Internet y luego escribas en menéame en base a lo que has aprendido. ¿Crees que deberías pagar a todas las webs que has visto en tu vida por el comentario que acabas de escribir en menéame?

sorrillo

hace 10 meses

#22: #6 Ten en cuenta que ChatGPT es con ánimo de lucro, pide pago por usarlo sin ciertos límites, y además se está integrando en productos comerciales. El origen no comercial de la empresa no importa si el producto final lo es.

danim

hace 10 meses

#76: #62 Te has olvidado de aportar la prueba.

Ya lo hago yo por ti, y si quieres comprobarlo verás que se lo ha inventado, eso no es literal de los libros.

sorrillo

hace 10 meses

#98: #18 Esto es lo que no comprende #13.

Tu puedes acceder a un numero infinito de contenidos en la red sin tener que pagar. El problema surge en el momento que haces un uso secundario de esos contenidos a los que has accedido libremente.

https://en.wikipedia.org/wiki/Creative_Commons_license#/media/File:Creative_commons_license_spectrum.svg

Don_Brais

hace 10 meses

#92: #59, uno de los grandes problemas que tienen estos modelos es el de las alucinaciones, porque justamente lo que no hacen es memorizar textos al pie de la letra sino aprender a construir frases con sentido.

rojo_separatista

hace 10 meses

#77: #74 Veamos, se puede estar en contra de los derechos de autor y a favor del progreso y, aún así, darse cuenta de que vivimos en un mundo donde los derechos de autor son muy importantes y una empresa privada parece estar ganando muchísimo dinero gracias al contenido de terceros que puede estar protegido por derechos de autor, sin pedir permiso ni pagarles nada a cambio. Pues no sé, yo a eso no lo llamo "progreso".

mamarracher

hace 10 meses

#12: #6 A ver qué sale. Si los condenan las empresas de lA se van a tener que mudar todas a Japón.

#4 ahora que lo recuerdo demandaron a Google por indexar la web y Google ganó el caso porque quién no quisiera que se enlazase su contenido podía utilizar el robots.txt para indicarlo.

Gry

hace 10 meses

Comentarios

Mejores hilos

#13

fugaz

hace 10 meses

editado

#11 ¿Acceso ilegítimo a la wikipedia? ¿a libros? ¿a posts en foros? ¿acceso ilegítimo a este comentario?

¿cómo va a ser eso ilegítimo?

Surrealista, como estamos acostumbrados en este mundo de jetas y locos del copyright.

V 88

K 595

#18

danim

hace 10 meses

#13 Acceso a todo tipo de fuentes ofrecidas por Microsoft que no puede decir (imagino que mensajes y datos privados). Hay textos con licencias concretas que se han ignorado totalmente.

V 8

K 61

#98

Don_Brais

hace 10 meses

#18 Esto es lo que no comprende #13.

Tu puedes acceder a un numero infinito de contenidos en la red sin tener que pagar. El problema surge en el momento que haces un uso secundario de esos contenidos a los que has accedido libremente.

https://en.wikipedia.org/wiki/Creative_Commons_license#/media/File:Creative_commons_license_spectrum.svg

V 4

K 38

#113

KoLoRo

hace 10 meses

#98 Tu puedes acceder a un numero infinito de contenidos en la red sin tener que pagar.

Pero entonces... no es Ilegitimo si esta en la red y accesible a cualquiera, no?

V 2

K 21

#145

aritzg

hace 10 meses

#98 Seguro que tu has aprendido cosas de los contenidos libres y gratuitos de internet y luego los has aplicado en tu trabajo o te has lucrado de ello. No?

V 2

K 28

#169

mettro

hace 10 meses

#98 Eso es como decir que puedo acceder a la wikipedia pero luego no puedo hablar con alguien y explicarle lo que he aprendido. Una estupidez que se basa en no entender lo que es una IA.

V 3

K 30

#20

danim

hace 10 meses

editado

#4 #13 Porque ha aprendido de datos privados (de Microsoft) como texto de emails, y porque es capaz de memorizar textos completos que tienen sus respectivas licencias que se han ignorado. Incluso se ha descubierto que ha aprendido de un libro de Harry Potter (aunque la mayoría de libros que conoce son anteriores a 1928, creo recordar, por temas de licencia).

V 11

K 53

#36

Desactivado

hace 10 meses

editado

#20 "es capaz de memorizar textos completos"
Esto... lo dudo mucho muchisimo

V 5

K 47

#59

Deathmosfear

hace 10 meses

#36 Por qué lo dudas? Si precisamente lo que hace esta IA es memorizar datos.

V 4

K 0

#61

Desactivado

hace 10 meses

editado

#59 "Si precisamente lo que hace esta IA es memorizar datos."
Si por "memoriar datos" te refieres al "memorizar textos completos" de antes, estas muy equivocado

V 6

K 52

#62

Deathmosfear

hace 10 meses

#61 Qué es para tí un texto completo? Un párrafo, cien, un libro entero? Ya por curiosidad le acabo de preguntar que me escriba un fragmento de Harry Potter (mas que nada porque mi hijo tiene el libro aquí al lado) y lo ha escrito tal cual.

V 4

K 16

#76

sorrillo

hace 10 meses

#62 Te has olvidado de aportar la prueba.

Ya lo hago yo por ti, y si quieres comprobarlo verás que se lo ha inventado, eso no es literal de los libros.

V 7

K 70

#116

fanchulitopico

hace 10 meses

#62 no sabes cómo funciona según se deduce de tus comentarios.

V 3

K 32

#173

UncleOwen

hace 10 meses

#62 Pues qué casualidad que justo la traducción que tiene tu hijo y la traducción hecha por gpt sean la misma.

V 0

K 6

#92

rojo_separatista

hace 10 meses

#59, uno de los grandes problemas que tienen estos modelos es el de las alucinaciones, porque justamente lo que no hacen es memorizar textos al pie de la letra sino aprender a construir frases con sentido.

V 5

K 52

#105

Sisko69_

hace 10 meses

#59 No, no hace eso. Se ha repetido millones de veces.

V 2

K 26

#117

overhead

hace 10 meses

#59 La IA está pensada para responder siempre, lo que es seguro es que la respuesta que dé no va a ser correcta siempre.
Si le pides que te escriba un fragmento de harry potter seguramente se lo inventará con los datos que tenga relacionados con ese tema, compruébalo con el libro y veras que no coincide y seguramente meterá la pata en algo.

V 1

K 18

#159

danky

hace 10 meses

#59 No. Lo que hace es analizar y aprender como se relacionan unas palabras con otras. No "memoriza". Hace algo parecido a lo que hacemos nosotros, buscar conceptos entre las palabras y relacionarlos entre sí. Almacena esa relación entre conceptos, no el texto original.

V 1

K 18

#72

Shinu

hace 10 meses

#20 ¿Y por qué es problemático que sea capaz de memorizar libros enteros?

V 0

K 10

#128

crioyo

hace 10 meses

editado

#72 Por lo mismo que tu no puedes fotocopiar y revender o regalar un libro sin permiso del autor.

V 3

K 33

#134

crateo

hace 10 meses

#72 Eso no es problematico. Lo problematico viene de cobrar despues por acceder al resultado. Hay libros que desarrollan ideas economicas, investigaciones o algoritmos para los que incluso un resumen supone un lucro cesante.

V 0

K 10

#135

chavi

hace 10 meses

#20 Si, mi disco duro es capaz de memorizar libros, películas y hasta videojuegos...

V 0

K 10

#46

iigtd

hace 10 meses

#13 ha accedido a historial médico privado y confidencial, y hay pruebas de ello. Ni fair use ni pollas.

V 7

K 56

#70

Desactivado

hace 10 meses

#46 ¿Y donde están esas pruebas?

V 1

K 21

#80

iigtd

hace 10 meses

#70 aquí un artículo hablando al respecto de como los datasets que se usan para entrenar los modelos de AI recogen de todo independientemente de que sea legal o no https://the-decoder.com/patient-images-in-laion-datasets-are-only-a-sample-of-a-larger-issue/

V 0

K 7

#82

sorrillo

hace 10 meses

editado

#80 De la fuente que citas:

The doctor died in 2018, and the artist assumes that the images were stolen after his death and published on the Internet.

Pues igual que un buscador como Google. Si tú haces una entrada en un blog y pones una foto robada en esa entrada Google lo indexará sin comprobar la legalidad de esa fotografía. El responsable de hacerla pública es quien crea la entrada del blog, los robots como Google u OpenIA u otros lo que hacen es pasearse por lo que hay publicado y lo indexan, respetando en todo caso el robots.txt.

Existen procedimientos para hacer reclamaciones tanto a Google como a otras empresas para la retirada de contenidos que cumplan los requisitos legales para ser retirados.

V 5

K 56

#86

iigtd

hace 10 meses

#82 el hilo original (donde la artista adjuntaba diferentes artículos al respecto) estaba mejor explicado, pero tuiter es una mierda ahora mismo y buscar a partir de google es un infierno, así que bueno. Perdón por una fuente tan pobre.

Igualmente, demuestra como el contenido que utilizan no es en su inmensa mayoría ni legal ni autorizado, ya que usan bases de datos que eso no lo respetan. Podrás solicitar que quiten tus imágenes, pero no tienes como sacarlas de los modelos de entrenamiento una vez la han aprendido ni tienes cómo saber cuales o cuantas la tienen en su base de datos ya.
Todos tenemos derecho a que nuestra información personal e imagen se respete y no se use sin nuestra autorización. Si no, podríamos permitir que las páginas webs almacenaran como quisieran las cookies y ya si no te gusta pues les pides después que las borren.

V 2

K 21

#88

sorrillo

hace 10 meses

#86 Si estaba publicado en Internet tú podías haberlo visto navegando y ChatGPT también ha podido verlo.

No te lo pueden quitar de tu cerebro, lo mismo con GPT.

A quien hay que perseguir es a quien publicó de forma ilegal, no a quien lo vió publicado y aprendió de ello.

V 6

K 63

#89

iigtd

hace 10 meses

#88 podría discutirse que la persona a cargo de elegir las bases de datos debería revisarlo, o que quien pone dichas bases a disposición tiene la responsabilidad de asegurar que esos datos cumplan con la legislación. Por supuesto, la persona que accedió y publicó información médica confidencial debería asumir su responsabilidad también.

V 2

K 25

#166

sorrillo

hace 10 meses

#89 ¿Crees que haya alguien en Google o en Bing que ha revisado todo el contenido de su base de datos y ha investigado cada dato, cada fotografía, para conocer su legalidad?

Lo que pides no es realista, por eso las leyes lo que contemplan son procedimientos para reclamar a esas empresas la retirada de datos concretos. Las reclamaciones sí pueden revisarse una por una, todo Internet no.

V 2

K 34

#142

chavi

hace 10 meses

#88 Vaya que no. De ChatGPT se elimina si se quiere

Otro tema es el coste económico

V 0

K 10

#95

turuleto

hace 10 meses

editado

#86 Si está publicado en internet es legal y autorizado que sea leído, tanto por humano, robot, alien o armadillo.

Deja de retorcer los hechos para que se adapten a tu visión "marxista-hay-quepagar-por-leer" de la realidad. "Progresistas" que quieren impedir que se lea internet gratis sin pagar, porque es que los derechos de los propietarios de un artículo para leer gratis. Mientras te dicen lo que puedes hacer con tu casa, con tu coche y con tus cosas. Es que es alucinante.

V 6

K -12

#136

Varlak

hace 10 meses

editado

#95 a ver, si está en internet puede ser leído, pero no necesariamente tienes permiso para lucrarte con ello. Yo puedo oír canciones en Spotify o en Youtube pero no las puedo usar en una película, puedo leer libros pero no usarlos en un libro mío, etc.

V 3

K 34

#220

discovery3

hace 10 meses

#95 No fuciona así. Hay licencias. Además en internet hay libros subidos sin el consentimiento de su autor, y no por ello es legal y autorizado.

V 0

K 6

#219

discovery3

hace 10 meses

#86 Las paginas web no almacenan las cookies. Es tu browser y computadora la que las almacena.

V 0

K 6

#175

UncleOwen

hace 10 meses

#80 En resumen, que no hay pruebas y te lo has inventado todo.

V 0

K 6

#130

fugaz

hace 10 meses

editado

#46 Ese es otro tema COMPLETAMENTE DISTINTO al tratado.

Si se accede a unos datos privados, la primera pregunta es ¿por qué están accesibles?
y la segunda es ¿hubo alguna INTENCIONALIDAD o fue completamente accidental?

V 2

K 24

#133

UnaPersonaCualquiera

hace 10 meses

editado

#46 ¿ya han aprendido a jaquear las IAs? O si no, como han accedido a esos datos supuestamente privados y confidenciales? ¿Por que no estaban esos datos correctamente protegidos? La culpa es de quien alojara esos datos por no protegerlos adecuadamente.

V 1

K 14

#226

discovery3

hace 10 meses

#46 Yo creo que cualquiera que pone voluntariamente información en internet, está sujeto a que esa información sea pública, y no puede reclamar por ello. Si no te gusta, no la pongas. O ponela detrás de un login, paywall o similar.

Si chatgpt evade la seguridad del documento, ya ahí no me parece bien. Pero mientras la información esté accesible, nada para reclamar.

V 1

K 18

#55

ioxoi

hace 10 meses

#13 el acceso no es ilegítimo, pero privatizar información de uso público bajo licencias viricas, si lo es ( cc-sa p.e.), la informacion debe ser libre y sus derivados también, que les jod* y bien.

V 5

K 29

#129

fugaz

hace 10 meses

#55 No.

No se privatiza la información.
Las licencias víricas no se reproducen cuando se hace fair use de ellas.

Ejemplo: Yo cojo cien mil programas GPL y alguien aprende a programar a partir de ellos. Cuando quiere hacer un bucle, selecciona el modo que mas le gusta. No copia el programa, pero si aprende de ellos. Y a partir de ahí haces nuevas cosas.

No digáis burradas. Aprender no es violar derechos de autor

V 2

K 19

#64

ostiayajoder

hace 10 meses

#13 Es que existen los derechos de autor, tio....

Y una cosa que cuenta MUCHO en estos temas de derechos de autor es si haces, o no, negocio con el contenido generado por otros...

V 7

K 56

#110

Marcelino_Pérez_Luna

hace 10 meses

#64 Si yo tengo un vblog de reseñas de películas y gano dinero con ello, estoy ganado dinero con el contenido de otros, pero no es una violación de los derechos de autor.

V 4

K 36

#123

fugaz

hace 10 meses

editado

#64 Fair Use.

Tu has aprendido todo lo que sabes del resto del mundo, cada palabra que usas, cada expresión.

No llevemos al límite absurdo los derechos de autor, intentando prohibir aprender.

Una cosa es plagiar y otra es aprender. ¿Qué haces cuando repites los argumentos de otros que mas te han convencido, con tu propia capacidad lingüística, después de procesarlos, elegirlos, mezclarlos y seleccionarlos? ¿es eso plagio?

La creatividad es humana pero son gotas que añades en un mar de hacer un collage de ideas, expresiones, conocimientos e historias de otros.

Una IA no añade esas gotas de creatividad. Pero no infringe derechos de autor al buscar, seleccionar, valorar, resumir, argumentos.

Una IA igual que un humano necesita nutrirse de información.

Querer llevar los derechos de autor a ese nivel es maquiavélico.

V 2

K 20

#125

KevinCarter

hace 10 meses

editado

#13 Si tú coges un texto y lo fusilas literalmente, sin citar, eres un plagiador. Y que hables de "jetas y locos del copyright" cuando en estos 15 últimos años ha habido gente montando webs y lucrándose con libros y películas ajenas, ya dice bastante de, o bien la poca idea que tenéis sobre derecho, o lo ladrones naturales que sois. Eso sí, luego a llorar porque no os pagan las horas extras. Lo que está claro es que el discurso este os ha gustado siempre porque el otro no os supone beneficio.

V 3

K 4

alexwing

hace 10 meses

¿Y por qué tenía que pedir permiso para leer datos accesibles en la web, que por ejemplo Google lleva indexando décadas?

V 39

K 298

#10

tdgwho

hace 10 meses

#4 Porque han visto que pueden sacar tajada.

V 8

K 95

#12

Gry

hace 10 meses

editado

#6 A ver qué sale. Si los condenan las empresas de lA se van a tener que mudar todas a Japón.

#4 ahora que lo recuerdo demandaron a Google por indexar la web y Google ganó el caso porque quién no quisiera que se enlazase su contenido podía utilizar el robots.txt para indicarlo.

V 9

K 87

#15

alexwing

hace 10 meses

#12 Apuesto, que el rastreador que usan en openAI, también tenia en cuenta el robots.txt

V 4

K 49

#19

danim

hace 10 meses

#15 No, no tenía. Además, Google indexa, ChatGPT coge los datos, y es capaz de reescribirlos completos, no es lo mismo.

V 2

K 18

#30

sorrillo

hace 10 meses

#19 Google sí es capaz de reescribirlos completos, como se puede ver cuando se consulta el caché de una web que sale en sus resultados.

Por contra ChatGPT lo que hace es aprender de los contenidos y luego hace una creación nueva en base al aprendizaje obtenido, no es distinto a que tú te pasees por Internet y luego escribas en menéame en base a lo que has aprendido. ¿Crees que deberías pagar a todas las webs que has visto en tu vida por el comentario que acabas de escribir en menéame?

V 11

K 89

#33

danim

hace 10 meses

editado

#30 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.
Tras aprender puede escribir texto similar, pero también el original. Y es secreto la fuente de sus datos, y admiten haber aprendido de datos que no pueden hacer públicos (lo cual es sospechoso de haber aprendido de datos privados).

V 2

K 22

#34

sorrillo

hace 10 meses

#33 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.

Esa es una hipótesis que está por demostrar. Desconocemos si OpenAI ha respetado el robots.txt.

Tras aprender puede escribir texto similar, pero también el original.

Puede escribir el texto original en los mismos términos que puedes hacerlo tú intentando recordar lo que leíste, puedes intentarlo, puedes acercarte, a veces puedes conseguirlo, en otras tantas ocasiones solo será parecido.

V 5

K 57

#38

danim

hace 10 meses

#34 Se supone que respeta robots.txt pero solo si se indica expresamente el User-Agent, que lo dieron a conocer con posterioridad: https://platform.openai.com/docs/plugins/bot https://www.makeuseof.com/block-ai-chatbot-scraping-website/
Puede escribir el original si se lo pides explícitamente (ahora no puedo probarlo, me dice que me pasé de cuota).

V 0

K 6

#48

sorrillo

hace 10 meses

#38 Eso sigue sin demostrar la hipotesis que no respetasen el robots.txt antes de publicar una forma explícita para IA u OpenIA.

Puede escribir el original si se lo pides explícitamente

Si se lo pides puede intentarlo, como tú.

Y si se le da acceso a Internet lo puede consultar cuando se lo pides, como tú.

V 1

K 23

#53

danim

hace 10 meses

#48 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

A ver, el modelo de IA no es como yo, a diferencia de técnicas de DL se diferencian bastante de cómo trabaja una persona. Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros (no siempre acierta, siempre tiene algo de aleatoriedad), si tienes curiosidad tienes el siguiente trabajo analizándolo (no hay datos públicos sobre su entrenamiento): https://arxiv.org/abs/2305.00118

V 0

K 6

#58

sorrillo

hace 10 meses

#53 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

Robots.txt ya existía, han podido respetarlo perfectamente por mucho que tú dudes de ello.

Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros

Posiblemente haya humanos capaces de hacerlo mejor que tú o yo, y su cerebro se basa en los mismos principios. ChatGPT no es una base de datos como sí lo es el buscador de Google.

V 3

K 41

#42

ny80

hace 10 meses

#33 ¿Que puede escribir el original? ¿De dónde sacas eso? En realidad, aunque puede decirte de que va un libro y resumir su contenido, no es capaz de recitar frase por frase el contenido del libro pues NO lo almacena en ningún sitio, sino que se queda con las ideas del mismo y la forma de escribir, lo que se llama el "modelo", pero el original no lo guarda.

V 5

K 47

#35

ChukNorris

hace 10 meses

#30 Es terreno pantanoso, yo no cobro por ello, no me puedo leer todo internet y no puedo responder de manera simultánea a millones de personas. (No le reviento el negocio a nadie).

V 0

K 10

#49

sorrillo

hace 10 meses

#35 Hay quien sí cobra de ello, escribiendo artículos, y no por eso paga a todas las webs de las que ha aprendido.

V 0

K 12

#85

ChukNorris

hace 10 meses

#49 ¿Se ha leído toda internet y puede trabajar para todas las editoriales de forma simultánea escribiendo artículos?

V 0

K 10

#87

sorrillo

hace 10 meses

#85 La parte que sea, y ni un céntimo paga por ello.

Cero multiplicado por mil millones sigue siendo cero.

V 1

K 23

#101

ChukNorris

hace 10 meses

editado

#87 ... Para qué inventarían las licencias y derechos de autor. Si está en internet Sorrillo te lo lee y te lo publica o hace una obra derivada sin citar nada.

V 1

K 16

#103

ChukNorris

hace 10 meses

#87 Lo explica muy bienAcido en sus comentarios 93 96 y 97 creo.

© No quiere decir que a mi me parezcan bien los derechos de autor, copiright, patentes y demás mierdas ...

V 1

K 17

#112

Acido

hace 10 meses

#103 #87
Escribí en #93 #96 y #99

Pero no traté a fondo lo que estáis debatiendo.

Mi opinión es que es lícito el derecho de cita, quizá sin citar al autor original. Puedes decir:
«Alguien dijo "Luke, yo soy tu padre"» y no mencionar al autor original de esa frase. Esto, que es una copia, puede estar incluido en una obra tuya con ánimo de lucro y no creo que puedan demandarte por haberte lucrado con obras de otros.
Ahora bien, si escribes un libro que tenga todos los diálogos de Star Wars y lo haces con ánimo de lucro, recibiendo dinero por ello, entonces sí te podrían demandar, ya que excede ampliamente el derecho de cita.

La cuestión es ¿ChatGPT permite dar todo el texto de obras completas que no son de dominio público? O, dicho de otra forma: ¿Excede el derecho de cita o "fair use"?
Creo que el juicio va de esto y en la sentencia veremos qué opina un juez...
No me refiero a que preguntes por el texto de Harry Potter y que ChatGPT te lo recite completo, cosa que no creo que haga... sino más bien que poco a poco, con preguntas sencillas como "¿Cuál es la primera frase del tal libro? ¿Y qué frase sigue?" creo que sí da textos largos, aunque no te dé un libro de 100 páginas... Y, por tanto, estaría cobrando dinero con obras de otros y sin permiso, lo cual sería claramente un abuso.

En mi opinión, sin ser jurista, y sin conocer a fondo lo que ChatGPT puede hacer y lo que no, creo que sí es posible (no lo sé seguro) que se haya excedido del uso aceptable... Y podría ser un frenazo a la IA o al menos a la forma de operar de empresas como OpenAI. Habría que o bien quitar el lucro, o bien tener más cuidadoso con los datos usados para entrenar la IA... ¡O ambas cosas! Y, claro, si quitas el ánimo de lucro, y teniendo en cuenta que entrenar y mantener en funcionamiento un sistema así cuesta dinero, a ver quién es el que va a dar este servicio gratis, sin lucrarse.

Y aunque no se lucre, poner a disposición obras de otros, como una web de descarga de libros está en los límites de la ética: por un lado es ayudar a la gente, pero por otro es fastidiar el negocio justo y lícito de los autores legítimos. En algunos casos, como dar artículos científicos para salvar vidas puede ser razonable defenderlo, como hizo el hacktivista Aaron Schwartz. Es razonable que salvar vidas esté por encima de derechos de autor, y el uso de textos o imágenes con fines educativos se considera aceptable. Ahora bien, una obra de entretenimiento que no es cuestión de vida o muerte ya es más dudoso defender que se difunda... aunque no haya lucro.

V 3

K 33

#121

ahoraquelodices

hace 10 meses

#87 Y habrá quien si pague por ello y respete copyrights y patentes. La mayoría han pagado por aprender...

Estás comparando lo que asumes que hace todo el mundo que escribe artículos y cobra por ello con lo que es capaz de hacer una IA. Es absurdo.

Se nos lleva machacando a nosotros con el tema desde hace años, pero openai se lo puede saltar todo y se lo ha saltado.

V 0

K 6

#67

ostiayajoder

hace 10 meses

#30 ChatGTP tambien puede reescribirte una pagina.

Por otro lado: pagare gustoso el 100% de lo que recibo comentando en meneame a todas esas paginas que he visitado.

V 4

K 33

#71

sorrillo

hace 10 meses

#c-67" class="content-link" style="color: rgb(227, 86, 20)" data-toggle="popover" data-popover-type="comment" data-popover-url="/tooltip/comment/3830998/order/67">#67 Te respondo en # 34: chatgpt-apuros-openai-demandada-robar-todo-ha-escrito-internet/c034#c-34

Publicado hace 10 meses por geralt_ a firstpost.com

ChatGPT en apuros: OpenAI demandada por robar todo...

firstpost.com

V 0

K 12

#47

iigtd

hace 10 meses

#12 me temo informarte de que en Japón ya están banneando creaciones hechas con AI o en las que haya sido partícipe siquiera, así que pueden buscarse otra casa.

V 0

K 7

#52

Gry

hace 10 meses

#47 Supongo que si prohibes el contenido generado por IA te da igual que utilicen materiales protegidos por derechos de autor para entrenar: El gobierno de Japón reafirmó que no hará cumplir los derechos de autor sobre los datos utilizados en el entrenamiento de IA [EN]

Publicado hace 11 meses por Chitauri a technomancers.ai

El gobierno de Japón reafirmó que no hará cumplir ...

technomancers.ai

V 1

K 27

#68

iigtd

hace 10 meses

#52 eso es porque se arriesgan a cargarse toda la cultura otaku de hacerlo, que se mantiene en un area gris de "si nadie afirma nada entonces se puede". Pero el rechazo de la población continua creciendo y no son bienvenidos (específicamente por el peligro que suponen a sus formas de vida). Ya encontrarán una forma de echarlos sin infligirse daño a sí mismos.

V 0

K 7

#118

overhead

hace 10 meses

#12 es curioso lo de la demanda y el robots.txt, es como si yo cojo una pistola y le disparo a alguien, lo mato y luego en el juicio le digo al juez, "coño, pero si no quería morir por qué no se ha puesto un chaleco antibalas?", es básicamente lo mismo, yo hago algo mal y te hecho la culpa a ti por no hacer algo, de locos...

V 0

K 6

#164

crioyo

hace 10 meses

#12 En Japon hay penas de carcel por descarga de musica y videos...

V 0

K 7

#24

Fingolfin

hace 10 meses

#4 Que los datos sean accesibles no quiere decir que se renuncie a los derechos de copia. Google no incurre en ningún delito porque tan sólo muestra una pequeña cita y te pone el enlace de la fuente, chatGPT copia todo sin mencionar fuentes. Si haces preguntas muy específicas sobre contenidos e una página, puedes llegar a obtener textos literales de la página web en la respuesta

V 14

K 108

#26

rojo_separatista

hace 10 meses

editado

#24, esto no es verdad, es casi imposible obtener copias literales de nada con chatGPT. Tienes un ejemplo de lo que dices?

V 10

K 84

#29

Fingolfin

hace 10 meses

#26 Si haces preguntas sobre código muy concretas puede darte respuestas que hagan referencia al único repositorio de github que contenga ese código

V 2

K 23

#32

ChukNorris

hace 10 meses

editado

#29 ¿Cuál es el problema si es de Ms?

¿Cual es el problema si te da resultados literales de comentarios de esta web si son libres de uso y copia?

De todos modos solo tendrían que copiar el estilo de citas de Bing.

V 1

K 20

#114

KoLoRo

hace 10 meses

#29 Y eso es un problema?

Si mañana le pregunto a una IA dime el comentario de Fingolfin de las 23:42 y me lo pone literal, es ilegal? Por que si yo puedo acceder de forma gratuita, un robot tambien puede.

V 0

K 7

#119

Acido

hace 10 meses

editado

#114
Si te lo dice gratis, seguramente es legal (como hace Google)... Ahora bien, si te dice "me debes pagar 0.02 euros por decírtelo" entonces aunque sean solo dos céntimos sería ilegal, a menos que esa IA tenga un derecho de explotación.

Cuando Fingolfin se registró daría su permiso para la explotación a Meneame, y quizá a terceras empresas que Meneame elija. Con ese permiso si Meneame dio derecho a OpenAI (habitualmente previo pago, a Meneame, y Fingolfin no huele ni un duro) entonces sí podría lucrarse OpenAI. Pero si ni Filgolfin ni Meneame dieron permiso, entonces el lucro ese sería ilegal... Sería básicamente como hacer fotocopias de Harry Potter y venderlas, sin permiso de quienes tienen derecho legal para venderlo. No importa que los libros de Harry Potter estén en bibliotecas públicas y puedas leerlos gratis...

Si en lugar de un solo libro, como el primero de Harry Potter, lo que haces es fotocopiar miles de libros y venderlos no solo a una persona sino a cientos o millones, entonces la cosa es bastante más gorda.

Cc: #29

V 1

K 17

#28

leporcine

hace 10 meses

#24 No lo uso demasiado, pero siempre suele poner enlaces a las fuentes.

V 0

K 7

#69

ostiayajoder

hace 10 meses

#28 inventados?

V 0

K 6

#44

jonolulu

hace 10 meses

editado

#4 Porque Google lo puede bloquear en robots.txt. Aparte Google solo enlaza

V 1

K 24

#107

NotVizzini

hace 10 meses

#44 jajajaja

V 0

K 10

#63

ostiayajoder

hace 10 meses

#4 Bueno, la verdad es que Google no te indexa sino quieres....

V 1

K 14

#96

Acido

hace 10 meses

editado

#4 #43
No es solo permiso para "leer".
Si alguien como yo escribe algo de forma pública, como un blog, o este comentario de Meneame, se entiende que das permiso a cualquiera para leerlo. Por tanto, que lo "lean" no es problema.
El problema es si tomas un blog escrito por otro, lo copias, y lo pones en una web tuya ¡como si lo hubieras escrito tú! Sin mencionar al autor original. Esto es lo que se llama plagio, una violación de copyright. No mencionar al autor original es violar el derecho de reconocimiento (BY). Todo autor tiene derecho a que se reconozca que él fue el autor de esa obra.
Por otro lado, desde el momento que ChatGPT u otras herramientas de OpenAI cobran dinero por sus servicios, se están lucrando. Te dan información de obras que otros han creado y te cobran por ello... Eso es ánimo de lucro.

Lo de Google es diferente porque:

1. Aunque no sepa o no diga cuál es el autor original, te da el enlace a la fuente. Lo que quiere decir esto es que Google deja claro que esas creaciones NO son creación suya... No es un plagio. El enlace a la fuente lo que viene a decir es : alguien, en tal sitio escribió esto y puedes ir a la fuente...

2. Google no muestra la obra completa, sino un extracto. Esto creo que se considera uso aceptable (fair use) avalado por lo que conoce como "derecho de cita". No es que publique un artículo de periódico entero, sino que dice "estas frases aparecen en tal obra", como quien nombra una frase de una peli o de una novela.

3. Google no cobra a quienes da la información / frases escritas por otros... No se lucra exactamente con ese trabajo de otros, sino que cobra a unos anunciantes que quieren aparecer en las búsquedas.

4. Google da el derecho a ser excluido, a no aparecer en las búsquedas. Aunque no sé si el mismo "robots.txt" impediría a OpenAI usar esos datos.

5. El buscador Google no te muestra textos de mensajes privados, como podrían ser emails que alguien escribió en Gmail. Por lo que dicen otros, parece ser que OpenAI sí ha usado datos privados...

#9 Aunque el artículo meneado usa la palabra "robar", sin embargo, creo que puede ser un titular sensacionalista o una forma de hablar.
En lenguaje jurídico un robo es sustraer algo con violencia o amenaza (ej: a punta de pistola, o estrellando un coche contra un escaparate). En el caso de OpenAI no hay violencia, así que no puede ser "robo" en ese sentido jurídico. Por otro lado está el "hurto", que es sustraer algo sin violencia. Pero creo que tampoco es eso porque sustraer es quitar algo de forma que el dueño legítimo no pueda disfrutar de ello, aunque sea dinero de una cuenta y no un objeto físico. Si copias una peli, la publicas en Internet y te lucras con ello no impides que otros tengan su copia y puedan disfrutar de ella, así que no es hurto sino violación de derechos de autor... El autor original es quien tiene derecho, o bien a lucrarse o bien a dar permiso de explotación a otro para que otro se lucre, pero en general es ilegal lucrarse con las obras de otros sin que te hayan dado permiso.

Un caso relacionado podría ser el de PirateBay, una web que daba enlaces para descargarse obras como películas. Mientras no se lucrara no estaba violando ninguna ley. Además, no copiaba ni transmitía la obra en sí, sino un enlace, generalmente de P2P donde se podría descargar la obra sin ningún pago.
Una diferencia entre esto y Google es que esto se refiere a obras como pelis que buscan un lucro y que no están a disposición pública.

Desde mi punto de vista, lo que hace OpenAi se parece un poco a las copias piratas de productos como zapatillas Adidas cambiando el nombre y llamándolas zapatillas Adios. Se aprovechan del trabajo de otros y se lucran con ello, sin permiso del autor original. La diferencia es que en estos productos hay unas marcas registradas protegidas legalmente y en general en los datos usados por OpenAI no suele haber marcas, o no usan la marca para engañar a quien paga.

Cc: #7

V 6

K 57

#185

snowdenknows

hace 10 meses

editado

#161 es más invasivo roba snippets literales (hoy en día de varios párrafos) y pone su publi a cambio te llevas 0 #96

V 0

K 9

#186

snowdenknows

hace 10 meses

#96 openai solo le dió de leer a su IA, no plagia, es como si a mi me pidieran una regalía de mi sueldo todos los bloggers tech que he leído

V 0

K 9

#97

ralph

hace 10 meses

#4 Como dicen otros, Google y otros buscadores (supuestamente) no indexan si no se quiere. Y dan el link directo.
No tiene nada que ver con lo que hacen las "IA" genéricas...

V 0

K 8

#100

Reanor

hace 10 meses

editado

#4 indexar tiene como objetivo enlazar, dar visibilidad a un trabajo. Y eso beneficia al autor del trabajo.

Openai tiene como objetivo remplazar al autor, y desconectarlo del beneficio de su trabajo. Quieren darte ellos la información, sin proporcionar siquiera reconocimiento a la fuente.

V 0

K 6

#104

Reanor

hace 10 meses

#4 #9 tampoco se ha pedido autorización a las empresas que almacenan y sirven esos datos. Estás han perdido un ancho de banda importante, a cambio de nada.

Además, la creación de estas IAs ha tenido repercusiones para todos los que usan la red. Twitter y Reddit han capado sus servicios, afectado a miles de aplicaciones que eran directamente útiles para muchas personas.

V 1

K 9

#181

temu

hace 10 meses

#4 que sea accesible quiere decir siempre que es publico?

si tienes un documento tuyo en una url accesible sin proteccion pero que no lo has publicado en ningun sitio... es publico?

las cosas que tienes dentro de la valla de un metro de tu jardin... son accesibles... son publicas tambien?

V 0

K 9

Gry

hace 10 meses

which is used for profit

Van a tener que demostrar eso. OpenAI es una entidad sin ánimo de lucro. La financiación la obtienen de una subsidiaria con beneficios limitados.

https://openai.com/our-structure

V 21

K 187

Unregistered

hace 10 meses

editado

#3 También han demandado a los propietarios de esa subsidiaria (p.ej. Microsoft), entre otros.

vs OPENAI LP, OPENAI INCORPORATED, OPENAI GP, LLC, OPENAI STARTUP FUND I, LP, OPENAI STARTUP FUND GP I, LLC, OPENAI STARTUP FUND MANAGEMENT LLC, MICROSOFT CORPORATION

https://clarksonlawfirm.com/wp-content/uploads/2023/06/0001.-2023.06.28-OpenAI-Complaint.pdf (157 páginas )

V 12

K 117

#22

danim

hace 10 meses

#6 Ten en cuenta que ChatGPT es con ánimo de lucro, pide pago por usarlo sin ciertos límites, y además se está integrando en productos comerciales. El origen no comercial de la empresa no importa si el producto final lo es.

V 15

K 109

#27

mcfgdbbn3

hace 10 meses

editado

#3: Con la licencia CC BY-SA puedes lucrarte, lo que no puedes es impedir la copia sucesiva o las modificaciones. Además de que debes mencionar al autor original.

V 0

K 14

#247

Acido

hace 10 meses

editado

#3

De tu mismo enlace, en el primer párrafo:

"OpenAI’s structure—a partnership between our original Nonprofit and a new capped profit arm—"

Lo que he marcado en negrita significa: «y un nuevo "brazo" (división / rama / sección) con ánimo de lucro limitado». Que el lucro esté "limitado" (capped) no implica que no tengan ánimo de lucro.

Pero es que por mucho que OpenAI dijera "nosotros somos una ONG sin ánimo de lucro", da igual lo que publiciten o digan ellos, lo que importa es lo que hacen, no lo que digan que hacen. Puedes comprobar fácilmente que hay versiones o subscripciones de pago de ChatGPT y otros productos de OpenAI. Por tanto, se está lucrando.
También puedes comprobar que hizo un acuerdo de licencia con Microsoft y que el producto, aunque sea modificado, está en el buscador Bing de Microsoft, el cual gana dinero con publicidad.

Por último, es un hecho público que OpenAI ha recibido muchos millones de dólares de inversores... entre otros del propio Microsoft. Si tienes una organización/ empresa creada, por ejemplo, con 1 millón de acciones repartidas entre 10 socios, por decir algo, y llega alguien y ofrece 100 millones por el 10% de la compañía, entonces al venderle ese 10% toda la empresa se valora en 1000 millones. Y el hecho de vender una parte significa que se han lucrado. ¿Se han lucrado con su trabajo y el de sus empleados? En parte sí, han creado software, pero también buena parte de su popularidad la han conseguido con el trabajo realizado por autores a los que no han pedido permiso para lucrarse. Cuando escribimos comentarios como este de Meneame damos implícitamente permiso para leerlo, sí, leerlo sin pagar, pero, atención, no damos permiso a cualquiera para revenderlo. Quizá damos permiso a Meneame para revenderlo, pero no a cualquiera.

V 0

K 10

Rorschach_

hace 10 meses

Sin pedir permiso y lucrándose, así les saquen los higadillos.

V 15

K 100

fugaz

hace 10 meses

editado

#1 O a lo mejor es fair use.
Que sería lo lógico para una IA que aprende de lo que ve, si no estuviéramos atontados por la exageración de celo en derechos de autor.

V 32

K 252

#11

Rorschach_

hace 10 meses

#7 No se han mencionado derechos de nada, se trata de acceso ilegítimo.

V 5

K 44

#93

Acido

hace 10 meses

editado

#11
Sí se han mencionado "derechos de autor" porque el artículo meneado dice la palabra "copyright", y eso es un derecho de autor.

Otra cosa es que la justicia sentencie o no que se ha vulnerado ese derecho, pero ese derecho sí se ha mencionado.

También el artículo menciona "privacy" que puede relacionarse con el acceso ilegítimo a datos privados, como pueden ser correos electrónicos privados. Es decir, que haya algún acceso ilegítimo no implica que no pueda también haber violación de derechos de autor, y, viceversa.

V 2

K 24

#111

AGlC

hace 10 meses

#11 Creo que eso está un poco por ver.
Habrá que analizar a que accedió y si ese acceso era o no ilegítimo.
No se, no aún no me he revisado todo el historial de navegación de OoenID y supongo que tú tampoco.

V 0

K 7

#171

dirok

hace 10 meses

#11 ¿Cuál es la diferencia con la indexación que hace Google?

V 1

K 21

#50

Capitan_Centollo

hace 10 meses

#7 En derechos de autor no, en derechos de explotación.

V 2

K 22

#43

snowdenknows

hace 10 meses

#1 y lo de google?

V 1

K 19

#161

crioyo

hace 10 meses

#43 es un enlazador, no tiene mucho que ver.

V 1

K 16

#54

Drebian

hace 10 meses

#1 tendrían que sacarnoslos a todos los que leemos cualquier cosa en Internet

V 0

K 9

#162

crioyo

hace 10 meses

editado

#54 No tiene que ver con el hecho de leer, sino con el derecho de explotacion.

V 0

K 7

#74

Desactivado

hace 10 meses

#1 Primero mi dinero, luego ya, el progreso.

V 0

K 6

#77

mamarracher

hace 10 meses

#74 Veamos, se puede estar en contra de los derechos de autor y a favor del progreso y, aún así, darse cuenta de que vivimos en un mundo donde los derechos de autor son muy importantes y una empresa privada parece estar ganando muchísimo dinero gracias al contenido de terceros que puede estar protegido por derechos de autor, sin pedir permiso ni pagarles nada a cambio. Pues no sé, yo a eso no lo llamo "progreso".

V 6

K 41

#83

Desactivado

hace 10 meses

#77 Avaricia, muchas maneras de llegar a lo mismo, avaricia. Todos esos rollos infumables legales de derechos de autor y patentes son avaricia.

V 2

K 23

#94

turuleto

hace 10 meses

editado

#1 Típico comentario del votante de izquierdas en una web de izquierdas.
Tan progresistas y luego tan celosos de la PROPIEDAD que no se puede hasta ni leer sin pagar, sin permiso.
Y con positivos.

"así les saquen los higadillos. " Izquierda siempre envidiosa. Violenta.

Izquiera hipócrita y retrógrada siempre. Lo de "progresista" es otra mentira, como todo en la izquierda.

V 4

K -18

#106

amoreno.carlos

hace 10 meses

editado

#1 A ver, que te voy a poner el vídeo de primaria para entender lo que significa robar.
Copy is not theft.

V 2

K 25

kastanedowski

hace 10 meses

Robar es un termino muy interesante... Vamos a ver que tan lejos llega todo esto

V 4

K 42

#102

Reanor

hace 10 meses

#9 es el término preciso. Nadie ha dado consentimiento para que usen sus comentarios, y contribuciones a la red para que se entrenen IAs que pueden, potencialmente, reemplazante en muchos ámbitos.

V 0

K 6

#16

jaramero

hace 10 meses

Esto lo auguraba desde hace meses en las noticias sobre IA.

El día que auditaran las fuentes de datos utilizadas para los entrenamientos se iban a frotar las manos los abogados.

Chatgpt necesita una cantidad inmensa de datos para entrenar y un "internet" entero cacheado para poder responder con agilidad. Ese funcionamiento por fuerza bruta no es viable y algún día tenía que estrellarse. Cuando Musk, Gates y otros dijeron de echar el freno a las IA no descartaría que fuera por esto, porque no les ha dado tiempo a blindarse jurídicamente.

Microsoft podría recuperar encarta y su chatbot, se forrarían.

V 4

K 41

#23

MacMagic

hace 10 meses

#16 Joder Encarta, cuanto tiempo leyendo esa enciclopedia mediante el cdroom.

V 3

K 35

#25

chavi

hace 10 meses

Eso es tan "fair use" como copiarlo, publicar un libro y venderlo

V 3

K 40

ezbirro

hace 10 meses

Digno de supervillano.

V 3

K 40

#14

fugaz

hace 10 meses

#2 Si te refieres a los demandantes, sí.

V 10

K 90

#99

Acido

hace 10 meses

#51
No exactamente.

Todo lo escribes tú o yo, es una obra que en cierto modo pertenece a su autor. Ya sea una poesía breve o un comentario de Twitter o de Meneame.

Luego están los derechos de explotación, y otros derechos de difusión, copia, etc... Como usuario de una red social firmas un acuerdo por el cual cedes a cada empresa el derecho a difundir tu obra y lucrarse con ella, o incluso que terceros puedan difundir tu obra y lucrarse con ella... Creo que en general no pierdes tu derecho a lucrarte. Puedes hacer una canción con una poesía escrita en Menéame o en Twitter y lucrarte con esa canción sin que Twitter ni Meneame puedan decir que esa obra "es suya", porque no lo es, no es "suya", solo tienen unos derechos de difusión y explotación de la misma, nada más. Si copias Linux tienes derecho a distribuirlo si quieres, porque los autores te dieron ese permiso, o a lucrarte con él, pero eso NO significa que Linux sea "tuyo". Sigue siendo de sus autores.

Existen un tipo de derechos llamados "derechos morales" que son derechos de autor irrenunciables. Es decir, aunque Meneame te pagara dinero para que les des permiso para decir que tu comentario no lo escribiste tú sino que fue creado por Fulano... NO es legal renunciar a la autoría, tú sigues siendo el autor, por mucho que hayas cobrado dinero para negar que el autor fuiste tú. Y como autor tienes derecho a que se te reconozca la autoría, por tanto, después de haber cobrado dinero podrías demandar a quien diga que es el autor sin ser verdaderamente el autor. Puedes exigir que deje de decir que es el autor sin serlo de verdad, porque eso es mentir y los autores tienen derechos irrenunciables. A lo que sí puedes renunciar es a la explotación, a cobrar dinero por tu obra. Sigues siendo el autor, y la obra es "tuya" en ese sentido, pero otro la puede explotar y ser "suya" en este otro sentido.
Creo que ni en Twitter ni en Menéame se renuncia a la explotación así que sigue siendo tuya en el sentido de explotación, aunque no enteramente tuya, sino compartida con una empresa.

V 3

K 33

#17

colorincolorado

hace 10 meses

A mí me gustaría saber cómo van a demostrar los demandantes qué datos son los que se han usado una vez creada la IA.

V 3

K 30

#21

Andercam

hace 10 meses

#17 tendrán toneladas de logs pero si el fondo está complicado.

V 2

K 30

#65

ostiayajoder

hace 10 meses

#17 Bueno, parece claro por los datos que dicen que han utilizado que ha sido asi...

Que muiestren a un juez sino ha sido asi y listo....

Estos casos, como los de mala praxis medica, son asi: el acusado puede demostrar FACILMENTE que es inocente, el acusador dificilmente puede demostrar nada por muy obvio que sea, de modo que se le pide al acusado que se exculpe con pruebas o se asume que miente.

V 0

K 6

#109

NotVizzini

hace 10 meses

#65 En la mayoría de paises, la prueba recae en quien denuncia, no al revés...

V 0

K 10

Desactivado

hace 10 meses

Qué lo demuestren

V 1

K 29

#37

zeioth

hace 10 meses

editado

Lo guapo es a ver como lo demuestras si es que es así. Yo no me creo que Microsoft no esté preparado para esto.

V 2

K 29

#73

Carapedo

hace 10 meses

- Queremos que ChatGPT sea comunal!
- Y turgente!

V 2

K 28

#41

Commodore

hace 10 meses

Los tontos que salen con que para entrenar a la IA se usa contenido protegido o privado... cuando es contenido disponible de maneral ibre para todo el mundo en Internet.

Los defensores del copyright y estas leyes de mierda se van a llevar una ostia buena con todos los cambios que trae la tecnología de la IA al sector y a la sociedad.

Están intentando desprestigar estas aplicaciones generadoras de texto y las generadoras de imágenes... metiendo miedo conque van a traer desastres, pérdidas de trabajo, que estemos quietos 6 meses sin usarlas y blablabla.

Tonterías. La tecnología avanza y es imparable. Y se va a pasar todos los copyrights de la faz de la tierra por el mismísmo forro de los cojones.

V 3

K 15

#57

juanac

hace 10 meses

#41 Buen argumento. Te sobraba empezar con el insulto; ahí te caes con todo el equipo.

V 2

K 23

pitercio

hace 10 meses

A veeee... que si está en la Internez no es de nadie, es de primero de jáquel.

V 0

K 13

#51

antares_567

hace 10 meses

#8 bueno, lo que escribes en Twitter es de Twitter, no tuyo y lo que escribes en meneame supongo que será de meneame

V 0

K 6

#81

MAVERISCH

hace 10 meses

Los derechos de autor, como todos los otros derechos que tú tienes, se deben defender con celo contra la gente que no los tiene y quiere arrebatárselos. Por supuesto.

V 0

K 11

#40

eljuligallego

hace 10 meses

todos nos hemos bajado todo internet y metido en un diskete y nadie no ha demandado por eso

V 0

K 10

#45

Desactivado

hace 10 meses

Que se cambien de país. Esto es imparable.

V 0

K 10

#79

lawnmowerdog

hace 10 meses

Exacto. Si cualquier persona puede leerlo, entonces no veo problema. Otro tema sería entrenar esas IAs con material privado, pero mientras sea público, no veo problema.

Igual que con las imágenes. Si puedo ver una foto o una pintura, ¿cuál es el problema?

Todo lo que tuviera copyright abusivo* debería ser privado completamente. Ya verías tú que pronto se acabaría todo este mamoneo de los derechos abusivos.

* copyright lo tiene siempre el autor por el simple hecho de ser el autor de la obra.

V 0

K 9

#56

Dondik

hace 10 meses

algo de razón hay en la queja

V 0

K 7

#91

Desactivado

hace 10 meses

editado

Tiene a Tío Sam detrás. Tranquilos.

V 0

K 7

#31

Pitufo

hace 10 meses

Muchos hemos leído y aprendido de Internet. ¿Hemos hecho algo ilegal por ello? ¿Cuál es la diferencia con si quien aprende es una IA o un humano?

V 0

K 7

#39

Desactivado

hace 10 meses

#31 no hay nada malo, solo quieren sacar tajada

V 0

K 7

#60

Senorito_Rosa

hace 10 meses

Mi formación y la de las personas con ganas de aprender se ha disparado desde que se popularizó esta tecnología. Dista de ser perfecta, pero es una herramienta que bien usada, facilita la autoformación una barbaridad.

Para mi, estas acciones son otro mensaje claro diciendo: estáis abajo y ahí os vais a quedar.

V 0

K 6

#66

Canario79

hace 10 meses

Mi comentario en la línea de lo que muchos esgrimen aquí: ¿como se puede llamar apropiación o robo a la recopilación de datos de dominio público? Veo más una campaña para ralentizar el desarrollo de ChatGPT no con fines altruistas si no como tácticas de competencia desleal.

V 0

K 6

#75

Desactivado

hace 10 meses

Esta demanda tiene menos recorrido que los paseos que se daba mi abuela con 96 años.

V 0

K 6

#78

NiñoMono

hace 10 meses

Menos mal que nos quedan los abogados para parar el progreso!! Gracias abogadooooooooooooooooOOO

V 0

K 6

#84

jmav

hace 10 meses

"Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos"

Igual que yo. Por ejemplo, cuando entro en la Wikipedia.

V 0

K 6

#90

Gurripander

hace 10 meses

Empiezo a pensar que ChatGPT no es más que un interfaz chulesco, que tira de la wiki y de otras enciclopedias...como un Cadillac con motor de seiscientos...

V 0

K 6

1 2 3

ChatGPT en apuros: OpenAI demandada por robar todo lo que se ha escrito en Internet [ENG]

Etiquetas

comentarios destacados

Comentarios

ChatGPT en apuros: OpenAI demandada por robar todo...

El gobierno de Japón reafirmó que no hará cumplir ...