Hace 10 meses | Por geralt_ a firstpost.com
Publicado hace 10 meses por geralt_ a firstpost.com

OpenAI recopiló una enorme cantidad de datos de diversas fuentes de Internet para entrenar sus avanzados modelos lingüísticos de IA. Estos conjuntos de datos consisten en una amplia gama de materiales, como artículos de Wikipedia, libros populares, publicaciones en redes sociales e incluso contenido explícito de géneros especializados. Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos.

Comentarios

d

#13 Acceso a todo tipo de fuentes ofrecidas por Microsoft que no puede decir (imagino que mensajes y datos privados). Hay textos con licencias concretas que se han ignorado totalmente.

KoLoRo

#98 Tu puedes acceder a un numero infinito de contenidos en la red sin tener que pagar.

Pero entonces... no es Ilegitimo si esta en la red y accesible a cualquiera, no?

aritzg

#98 Seguro que tu has aprendido cosas de los contenidos libres y gratuitos de internet y luego los has aplicado en tu trabajo o te has lucrado de ello. No?

m

#98 Eso es como decir que puedo acceder a la wikipedia pero luego no puedo hablar con alguien y explicarle lo que he aprendido. Una estupidez que se basa en no entender lo que es una IA.

d

#4 #13 Porque ha aprendido de datos privados (de Microsoft) como texto de emails, y porque es capaz de memorizar textos completos que tienen sus respectivas licencias que se han ignorado. Incluso se ha descubierto que ha aprendido de un libro de Harry Potter (aunque la mayoría de libros que conoce son anteriores a 1928, creo recordar, por temas de licencia).

D

#20 "es capaz de memorizar textos completos"
Esto... lo dudo mucho muchisimo

Deathmosfear

#36 Por qué lo dudas? Si precisamente lo que hace esta IA es memorizar datos.

D

#59 "Si precisamente lo que hace esta IA es memorizar datos."
Si por "memoriar datos" te refieres al "memorizar textos completos" de antes, estas muy equivocado

Deathmosfear

#61 Qué es para tí un texto completo? Un párrafo, cien, un libro entero? Ya por curiosidad le acabo de preguntar que me escriba un fragmento de Harry Potter (mas que nada porque mi hijo tiene el libro aquí al lado) y lo ha escrito tal cual.

fanchulitopico

#62 no sabes cómo funciona según se deduce de tus comentarios.

U

#62 Pues qué casualidad que justo la traducción que tiene tu hijo y la traducción hecha por gpt sean la misma.

S

#59 No, no hace eso. Se ha repetido millones de veces.

o

#59 La IA está pensada para responder siempre, lo que es seguro es que la respuesta que dé no va a ser correcta siempre.
Si le pides que te escriba un fragmento de harry potter seguramente se lo inventará con los datos que tenga relacionados con ese tema, compruébalo con el libro y veras que no coincide y seguramente meterá la pata en algo.

d

#59 No. Lo que hace es analizar y aprender como se relacionan unas palabras con otras. No "memoriza". Hace algo parecido a lo que hacemos nosotros, buscar conceptos entre las palabras y relacionarlos entre sí. Almacena esa relación entre conceptos, no el texto original.

Shinu

#20 ¿Y por qué es problemático que sea capaz de memorizar libros enteros?

c

#72 Por lo mismo que tu no puedes fotocopiar y revender o regalar un libro sin permiso del autor.

crateo

#72 Eso no es problematico. Lo problematico viene de cobrar despues por acceder al resultado. Hay libros que desarrollan ideas economicas, investigaciones o algoritmos para los que incluso un resumen supone un lucro cesante.

c

#20 Si, mi disco duro es capaz de memorizar libros, películas y hasta videojuegos...

i

#13 ha accedido a historial médico privado y confidencial, y hay pruebas de ello. Ni fair use ni pollas.

D

#46 ¿Y donde están esas pruebas?

i

#70 aquí un artículo hablando al respecto de como los datasets que se usan para entrenar los modelos de AI recogen de todo independientemente de que sea legal o no https://the-decoder.com/patient-images-in-laion-datasets-are-only-a-sample-of-a-larger-issue/

i

#82 el hilo original (donde la artista adjuntaba diferentes artículos al respecto) estaba mejor explicado, pero tuiter es una mierda ahora mismo y buscar a partir de google es un infierno, así que bueno. Perdón por una fuente tan pobre.

Igualmente, demuestra como el contenido que utilizan no es en su inmensa mayoría ni legal ni autorizado, ya que usan bases de datos que eso no lo respetan. Podrás solicitar que quiten tus imágenes, pero no tienes como sacarlas de los modelos de entrenamiento una vez la han aprendido ni tienes cómo saber cuales o cuantas la tienen en su base de datos ya.
Todos tenemos derecho a que nuestra información personal e imagen se respete y no se use sin nuestra autorización. Si no, podríamos permitir que las páginas webs almacenaran como quisieran las cookies y ya si no te gusta pues les pides después que las borren.

i

#88 podría discutirse que la persona a cargo de elegir las bases de datos debería revisarlo, o que quien pone dichas bases a disposición tiene la responsabilidad de asegurar que esos datos cumplan con la legislación. Por supuesto, la persona que accedió y publicó información médica confidencial debería asumir su responsabilidad también.

sorrillo

#89 ¿Crees que haya alguien en Google o en Bing que ha revisado todo el contenido de su base de datos y ha investigado cada dato, cada fotografía, para conocer su legalidad?

Lo que pides no es realista, por eso las leyes lo que contemplan son procedimientos para reclamar a esas empresas la retirada de datos concretos. Las reclamaciones sí pueden revisarse una por una, todo Internet no.

c

#88 Vaya que no. De ChatGPT se elimina si se quiere

Otro tema es el coste económico

t

#86 Si está publicado en internet es legal y autorizado que sea leído, tanto por humano, robot, alien o armadillo.

Deja de retorcer los hechos para que se adapten a tu visión "marxista-hay-quepagar-por-leer" de la realidad. "Progresistas" que quieren impedir que se lea internet gratis sin pagar, porque es que los derechos de los propietarios de un artículo para leer gratis. Mientras te dicen lo que puedes hacer con tu casa, con tu coche y con tus cosas. Es que es alucinante.

Varlak

#95 a ver, si está en internet puede ser leído, pero no necesariamente tienes permiso para lucrarte con ello. Yo puedo oír canciones en Spotify o en Youtube pero no las puedo usar en una película, puedo leer libros pero no usarlos en un libro mío, etc.

d

#95 No fuciona así. Hay licencias. Además en internet hay libros subidos sin el consentimiento de su autor, y no por ello es legal y autorizado.

d

#86 Las paginas web no almacenan las cookies. Es tu browser y computadora la que las almacena.

U

#80 En resumen, que no hay pruebas y te lo has inventado todo.

fugaz

#46 Ese es otro tema COMPLETAMENTE DISTINTO al tratado.

Si se accede a unos datos privados, la primera pregunta es ¿por qué están accesibles?
y la segunda es ¿hubo alguna INTENCIONALIDAD o fue completamente accidental?

U

#46 ¿ya han aprendido a jaquear las IAs? O si no, como han accedido a esos datos supuestamente privados y confidenciales? ¿Por que no estaban esos datos correctamente protegidos? La culpa es de quien alojara esos datos por no protegerlos adecuadamente.

d

#46 Yo creo que cualquiera que pone voluntariamente información en internet, está sujeto a que esa información sea pública, y no puede reclamar por ello. Si no te gusta, no la pongas. O ponela detrás de un login, paywall o similar.

Si chatgpt evade la seguridad del documento, ya ahí no me parece bien. Pero mientras la información esté accesible, nada para reclamar.

ioxoi

#13 el acceso no es ilegítimo, pero privatizar información de uso público bajo licencias viricas, si lo es ( cc-sa p.e.), la informacion debe ser libre y sus derivados también, que les jod* y bien.

fugaz

#55 No.

No se privatiza la información.
Las licencias víricas no se reproducen cuando se hace fair use de ellas.

Ejemplo: Yo cojo cien mil programas GPL y alguien aprende a programar a partir de ellos. Cuando quiere hacer un bucle, selecciona el modo que mas le gusta. No copia el programa, pero si aprende de ellos. Y a partir de ahí haces nuevas cosas.

No digáis burradas. Aprender no es violar derechos de autor

ostiayajoder

#13 Es que existen los derechos de autor, tio....

Y una cosa que cuenta MUCHO en estos temas de derechos de autor es si haces, o no, negocio con el contenido generado por otros...

#64 Si yo tengo un vblog de reseñas de películas y gano dinero con ello, estoy ganado dinero con el contenido de otros, pero no es una violación de los derechos de autor.

fugaz

#64 Fair Use.

Tu has aprendido todo lo que sabes del resto del mundo, cada palabra que usas, cada expresión.

No llevemos al límite absurdo los derechos de autor, intentando prohibir aprender.

Una cosa es plagiar y otra es aprender. ¿Qué haces cuando repites los argumentos de otros que mas te han convencido, con tu propia capacidad lingüística, después de procesarlos, elegirlos, mezclarlos y seleccionarlos? ¿es eso plagio?

La creatividad es humana pero son gotas que añades en un mar de hacer un collage de ideas, expresiones, conocimientos e historias de otros.

Una IA no añade esas gotas de creatividad. Pero no infringe derechos de autor al buscar, seleccionar, valorar, resumir, argumentos.

Una IA igual que un humano necesita nutrirse de información.

Querer llevar los derechos de autor a ese nivel es maquiavélico.

KevinCarter

#13 Si tú coges un texto y lo fusilas literalmente, sin citar, eres un plagiador. Y que hables de "jetas y locos del copyright" cuando en estos 15 últimos años ha habido gente montando webs y lucrándose con libros y películas ajenas, ya dice bastante de, o bien la poca idea que tenéis sobre derecho, o lo ladrones naturales que sois. Eso sí, luego a llorar porque no os pagan las horas extras. Lo que está claro es que el discurso este os ha gustado siempre porque el otro no os supone beneficio.

tdgwho

#4 Porque han visto que pueden sacar tajada.

alexwing

#12 Apuesto, que el rastreador que usan en openAI, también tenia en cuenta el robots.txt

d

#15 No, no tenía. Además, Google indexa, ChatGPT coge los datos, y es capaz de reescribirlos completos, no es lo mismo.

d

#30 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.
Tras aprender puede escribir texto similar, pero también el original. Y es secreto la fuente de sus datos, y admiten haber aprendido de datos que no pueden hacer públicos (lo cual es sospechoso de haber aprendido de datos privados).

sorrillo

#33 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.

Esa es una hipótesis que está por demostrar. Desconocemos si OpenAI ha respetado el robots.txt.

Tras aprender puede escribir texto similar, pero también el original.

Puede escribir el texto original en los mismos términos que puedes hacerlo tú intentando recordar lo que leíste, puedes intentarlo, puedes acercarte, a veces puedes conseguirlo, en otras tantas ocasiones solo será parecido.

d

#34 Se supone que respeta robots.txt pero solo si se indica expresamente el User-Agent, que lo dieron a conocer con posterioridad: https://platform.openai.com/docs/plugins/bot https://www.makeuseof.com/block-ai-chatbot-scraping-website/
Puede escribir el original si se lo pides explícitamente (ahora no puedo probarlo, me dice que me pasé de cuota).

sorrillo

#38 Eso sigue sin demostrar la hipotesis que no respetasen el robots.txt antes de publicar una forma explícita para IA u OpenIA.

Puede escribir el original si se lo pides explícitamente

Si se lo pides puede intentarlo, como tú.

Y si se le da acceso a Internet lo puede consultar cuando se lo pides, como tú.

d

#48 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

A ver, el modelo de IA no es como yo, a diferencia de técnicas de DL se diferencian bastante de cómo trabaja una persona. Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros (no siempre acierta, siempre tiene algo de aleatoriedad), si tienes curiosidad tienes el siguiente trabajo analizándolo (no hay datos públicos sobre su entrenamiento): https://arxiv.org/abs/2305.00118

sorrillo

#53 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

Robots.txt ya existía, han podido respetarlo perfectamente por mucho que tú dudes de ello.

Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros

Posiblemente haya humanos capaces de hacerlo mejor que tú o yo, y su cerebro se basa en los mismos principios. ChatGPT no es una base de datos como sí lo es el buscador de Google.

ny80

#33 ¿Que puede escribir el original? ¿De dónde sacas eso? En realidad, aunque puede decirte de que va un libro y resumir su contenido, no es capaz de recitar frase por frase el contenido del libro pues NO lo almacena en ningún sitio, sino que se queda con las ideas del mismo y la forma de escribir, lo que se llama el "modelo", pero el original no lo guarda.

ChukNorris

#30 Es terreno pantanoso, yo no cobro por ello, no me puedo leer todo internet y no puedo responder de manera simultánea a millones de personas. (No le reviento el negocio a nadie).

sorrillo

#35 Hay quien sí cobra de ello, escribiendo artículos, y no por eso paga a todas las webs de las que ha aprendido.

ChukNorris

#49 ¿Se ha leído toda internet y puede trabajar para todas las editoriales de forma simultánea escribiendo artículos?

sorrillo

#85 La parte que sea, y ni un céntimo paga por ello.

Cero multiplicado por mil millones sigue siendo cero.

ChukNorris

#87 ... Para qué inventarían las licencias y derechos de autor. Si está en internet Sorrillo te lo lee y te lo publica o hace una obra derivada sin citar nada.

ChukNorris

#87 Lo explica muy bienAcidoAcido en sus comentarios 93 96 y 97 creo.

© No quiere decir que a mi me parezcan bien los derechos de autor, copiright, patentes y demás mierdas ...

Acido

#103 #87
Escribí en #93 #96 y #99

Pero no traté a fondo lo que estáis debatiendo.

Mi opinión es que es lícito el derecho de cita, quizá sin citar al autor original. Puedes decir:
«Alguien dijo "Luke, yo soy tu padre"» y no mencionar al autor original de esa frase. Esto, que es una copia, puede estar incluido en una obra tuya con ánimo de lucro y no creo que puedan demandarte por haberte lucrado con obras de otros.
Ahora bien, si escribes un libro que tenga todos los diálogos de Star Wars y lo haces con ánimo de lucro, recibiendo dinero por ello, entonces sí te podrían demandar, ya que excede ampliamente el derecho de cita.

La cuestión es ¿ChatGPT permite dar todo el texto de obras completas que no son de dominio público? O, dicho de otra forma: ¿Excede el derecho de cita o "fair use"?
Creo que el juicio va de esto y en la sentencia veremos qué opina un juez...
No me refiero a que preguntes por el texto de Harry Potter y que ChatGPT te lo recite completo, cosa que no creo que haga... sino más bien que poco a poco, con preguntas sencillas como "¿Cuál es la primera frase del tal libro? ¿Y qué frase sigue?" creo que sí da textos largos, aunque no te dé un libro de 100 páginas... Y, por tanto, estaría cobrando dinero con obras de otros y sin permiso, lo cual sería claramente un abuso.

En mi opinión, sin ser jurista, y sin conocer a fondo lo que ChatGPT puede hacer y lo que no, creo que sí es posible (no lo sé seguro) que se haya excedido del uso aceptable... Y podría ser un frenazo a la IA o al menos a la forma de operar de empresas como OpenAI. Habría que o bien quitar el lucro, o bien tener más cuidadoso con los datos usados para entrenar la IA... ¡O ambas cosas! Y, claro, si quitas el ánimo de lucro, y teniendo en cuenta que entrenar y mantener en funcionamiento un sistema así cuesta dinero, a ver quién es el que va a dar este servicio gratis, sin lucrarse.

Y aunque no se lucre, poner a disposición obras de otros, como una web de descarga de libros está en los límites de la ética: por un lado es ayudar a la gente, pero por otro es fastidiar el negocio justo y lícito de los autores legítimos. En algunos casos, como dar artículos científicos para salvar vidas puede ser razonable defenderlo, como hizo el hacktivista Aaron Schwartz. Es razonable que salvar vidas esté por encima de derechos de autor, y el uso de textos o imágenes con fines educativos se considera aceptable. Ahora bien, una obra de entretenimiento que no es cuestión de vida o muerte ya es más dudoso defender que se difunda... aunque no haya lucro.

ahoraquelodices

#87 Y habrá quien si pague por ello y respete copyrights y patentes. La mayoría han pagado por aprender...

Estás comparando lo que asumes que hace todo el mundo que escribe artículos y cobra por ello con lo que es capaz de hacer una IA. Es absurdo.

Se nos lleva machacando a nosotros con el tema desde hace años, pero openai se lo puede saltar todo y se lo ha saltado.

ostiayajoder

#30 ChatGTP tambien puede reescribirte una pagina.

Por otro lado: pagare gustoso el 100% de lo que recibo comentando en meneame a todas esas paginas que he visitado.

sorrillo

#c-67" class="content-link" style="color: rgb(227, 86, 20)" data-toggle="popover" data-popover-type="comment" data-popover-url="/tooltip/comment/3830998/order/67">#67 Te respondo en # 34: chatgpt-apuros-openai-demandada-robar-todo-ha-escrito-internet/c034#c-34

Hace 10 meses | Por geralt_ a firstpost.com

i

#12 me temo informarte de que en Japón ya están banneando creaciones hechas con AI o en las que haya sido partícipe siquiera, así que pueden buscarse otra casa.

Gry

#47 Supongo que si prohibes el contenido generado por IA te da igual que utilicen materiales protegidos por derechos de autor para entrenar: El gobierno de Japón reafirmó que no hará cumplir los derechos de autor sobre los datos utilizados en el entrenamiento de IA [EN]

Hace 11 meses | Por Chitauri a technomancers.ai

i

#52 eso es porque se arriesgan a cargarse toda la cultura otaku de hacerlo, que se mantiene en un area gris de "si nadie afirma nada entonces se puede". Pero el rechazo de la población continua creciendo y no son bienvenidos (específicamente por el peligro que suponen a sus formas de vida). Ya encontrarán una forma de echarlos sin infligirse daño a sí mismos.

o

#12 es curioso lo de la demanda y el robots.txt, es como si yo cojo una pistola y le disparo a alguien, lo mato y luego en el juicio le digo al juez, "coño, pero si no quería morir por qué no se ha puesto un chaleco antibalas?", es básicamente lo mismo, yo hago algo mal y te hecho la culpa a ti por no hacer algo, de locos...

c

#12 En Japon hay penas de carcel por descarga de musica y videos...

rojo_separatista

#24, esto no es verdad, es casi imposible obtener copias literales de nada con chatGPT. Tienes un ejemplo de lo que dices?

Fingolfin

#26 Si haces preguntas sobre código muy concretas puede darte respuestas que hagan referencia al único repositorio de github que contenga ese código

ChukNorris

#29 ¿Cuál es el problema si es de Ms?

¿Cual es el problema si te da resultados literales de comentarios de esta web si son libres de uso y copia?

De todos modos solo tendrían que copiar el estilo de citas de Bing.

KoLoRo

#29 Y eso es un problema?

Si mañana le pregunto a una IA dime el comentario de Fingolfin de las 23:42 y me lo pone literal, es ilegal? Por que si yo puedo acceder de forma gratuita, un robot tambien puede.

Acido

#114
Si te lo dice gratis, seguramente es legal (como hace Google)... Ahora bien, si te dice "me debes pagar 0.02 euros por decírtelo" entonces aunque sean solo dos céntimos sería ilegal, a menos que esa IA tenga un derecho de explotación.

Cuando Fingolfin se registró daría su permiso para la explotación a Meneame, y quizá a terceras empresas que Meneame elija. Con ese permiso si Meneame dio derecho a OpenAI (habitualmente previo pago, a Meneame, y Fingolfin no huele ni un duro) entonces sí podría lucrarse OpenAI. Pero si ni Filgolfin ni Meneame dieron permiso, entonces el lucro ese sería ilegal... Sería básicamente como hacer fotocopias de Harry Potter y venderlas, sin permiso de quienes tienen derecho legal para venderlo. No importa que los libros de Harry Potter estén en bibliotecas públicas y puedas leerlos gratis...

Si en lugar de un solo libro, como el primero de Harry Potter, lo que haces es fotocopiar miles de libros y venderlos no solo a una persona sino a cientos o millones, entonces la cosa es bastante más gorda.

Cc: #29

leporcine

#24 No lo uso demasiado, pero siempre suele poner enlaces a las fuentes.

ostiayajoder

#28 inventados?

jonolulu

#4 Porque Google lo puede bloquear en robots.txt. Aparte Google solo enlaza

NotVizzini

#44 jajajaja

ostiayajoder

#4 Bueno, la verdad es que Google no te indexa sino quieres....

snowdenknows

#161 es más invasivo roba snippets literales (hoy en día de varios párrafos) y pone su publi a cambio te llevas 0 #96

snowdenknows

#96 openai solo le dió de leer a su IA, no plagia, es como si a mi me pidieran una regalía de mi sueldo todos los bloggers tech que he leído

r

#4 Como dicen otros, Google y otros buscadores (supuestamente) no indexan si no se quiere. Y dan el link directo.
No tiene nada que ver con lo que hacen las "IA" genéricas...

R

#4 indexar tiene como objetivo enlazar, dar visibilidad a un trabajo. Y eso beneficia al autor del trabajo.

Openai tiene como objetivo remplazar al autor, y desconectarlo del beneficio de su trabajo. Quieren darte ellos la información, sin proporcionar siquiera reconocimiento a la fuente.

R

#4 #9 tampoco se ha pedido autorización a las empresas que almacenan y sirven esos datos. Estás han perdido un ancho de banda importante, a cambio de nada.

Además, la creación de estas IAs ha tenido repercusiones para todos los que usan la red. Twitter y Reddit han capado sus servicios, afectado a miles de aplicaciones que eran directamente útiles para muchas personas.

temu

#4 que sea accesible quiere decir siempre que es publico?

si tienes un documento tuyo en una url accesible sin proteccion pero que no lo has publicado en ningun sitio... es publico?

las cosas que tienes dentro de la valla de un metro de tu jardin... son accesibles... son publicas tambien?

m

#3: Con la licencia CC BY-SA puedes lucrarte, lo que no puedes es impedir la copia sucesiva o las modificaciones. Además de que debes mencionar al autor original.

Acido

#3

De tu mismo enlace, en el primer párrafo:

"OpenAI’s structure—a partnership between our original Nonprofit and a new capped profit arm—"

Lo que he marcado en negrita significa: «y un nuevo "brazo" (división / rama / sección) con ánimo de lucro limitado». Que el lucro esté "limitado" (capped) no implica que no tengan ánimo de lucro.

Pero es que por mucho que OpenAI dijera "nosotros somos una ONG sin ánimo de lucro", da igual lo que publiciten o digan ellos, lo que importa es lo que hacen, no lo que digan que hacen. Puedes comprobar fácilmente que hay versiones o subscripciones de pago de ChatGPT y otros productos de OpenAI. Por tanto, se está lucrando.
También puedes comprobar que hizo un acuerdo de licencia con Microsoft y que el producto, aunque sea modificado, está en el buscador Bing de Microsoft, el cual gana dinero con publicidad.

Por último, es un hecho público que OpenAI ha recibido muchos millones de dólares de inversores... entre otros del propio Microsoft. Si tienes una organización/ empresa creada, por ejemplo, con 1 millón de acciones repartidas entre 10 socios, por decir algo, y llega alguien y ofrece 100 millones por el 10% de la compañía, entonces al venderle ese 10% toda la empresa se valora en 1000 millones. Y el hecho de vender una parte significa que se han lucrado. ¿Se han lucrado con su trabajo y el de sus empleados? En parte sí, han creado software, pero también buena parte de su popularidad la han conseguido con el trabajo realizado por autores a los que no han pedido permiso para lucrarse. Cuando escribimos comentarios como este de Meneame damos implícitamente permiso para leerlo, sí, leerlo sin pagar, pero, atención, no damos permiso a cualquiera para revenderlo. Quizá damos permiso a Meneame para revenderlo, pero no a cualquiera.

Rorschach_

Sin pedir permiso y lucrándose, así les saquen los higadillos.

Rorschach_

#7 No se han mencionado derechos de nada, se trata de acceso ilegítimo.

Acido

#11
Sí se han mencionado "derechos de autor" porque el artículo meneado dice la palabra "copyright", y eso es un derecho de autor.

Otra cosa es que la justicia sentencie o no que se ha vulnerado ese derecho, pero ese derecho sí se ha mencionado.

También el artículo menciona "privacy" que puede relacionarse con el acceso ilegítimo a datos privados, como pueden ser correos electrónicos privados. Es decir, que haya algún acceso ilegítimo no implica que no pueda también haber violación de derechos de autor, y, viceversa.

A

#11 Creo que eso está un poco por ver.
Habrá que analizar a que accedió y si ese acceso era o no ilegítimo.
No se, no aún no me he revisado todo el historial de navegación de OoenID y supongo que tú tampoco.

d

#11 ¿Cuál es la diferencia con la indexación que hace Google?

Capitan_Centollo

#7 En derechos de autor no, en derechos de explotación.

snowdenknows

#1 y lo de google?

c

#43 es un enlazador, no tiene mucho que ver.

Drebian

#1 tendrían que sacarnoslos a todos los que leemos cualquier cosa en Internet

c

#54 No tiene que ver con el hecho de leer, sino con el derecho de explotacion.

D

#1 Primero mi dinero, luego ya, el progreso.

D

#77 Avaricia, muchas maneras de llegar a lo mismo, avaricia. Todos esos rollos infumables legales de derechos de autor y patentes son avaricia.

t

#1 Típico comentario del votante de izquierdas en una web de izquierdas.
Tan progresistas y luego tan celosos de la PROPIEDAD que no se puede hasta ni leer sin pagar, sin permiso.
Y con positivos.

"así les saquen los higadillos.
" Izquierda siempre envidiosa. Violenta.

Izquiera hipócrita y retrógrada siempre. Lo de "progresista" es otra mentira, como todo en la izquierda.

amoreno.carlos

#1 A ver, que te voy a poner el vídeo de primaria para entender lo que significa robar.
Copy is not theft.

kastanedowski

Robar es un termino muy interesante... Vamos a ver que tan lejos llega todo esto

R

#9 es el término preciso. Nadie ha dado consentimiento para que usen sus comentarios, y contribuciones a la red para que se entrenen IAs que pueden, potencialmente, reemplazante en muchos ámbitos.

j

Esto lo auguraba desde hace meses en las noticias sobre IA.

El día que auditaran las fuentes de datos utilizadas para los entrenamientos se iban a frotar las manos los abogados.

Chatgpt necesita una cantidad inmensa de datos para entrenar y un "internet" entero cacheado para poder responder con agilidad. Ese funcionamiento por fuerza bruta no es viable y algún día tenía que estrellarse. Cuando Musk, Gates y otros dijeron de echar el freno a las IA no descartaría que fuera por esto, porque no les ha dado tiempo a blindarse jurídicamente.

Microsoft podría recuperar encarta y su chatbot, se forrarían.

MacMagic

#16 Joder Encarta, cuanto tiempo leyendo esa enciclopedia mediante el cdroom.

c

Eso es tan "fair use" como copiarlo, publicar un libro y venderlo

ezbirro

Digno de supervillano.

fugaz

#2 Si te refieres a los demandantes, sí.

Acido

#51
No exactamente.

Todo lo escribes tú o yo, es una obra que en cierto modo pertenece a su autor. Ya sea una poesía breve o un comentario de Twitter o de Meneame.

Luego están los derechos de explotación, y otros derechos de difusión, copia, etc... Como usuario de una red social firmas un acuerdo por el cual cedes a cada empresa el derecho a difundir tu obra y lucrarse con ella, o incluso que terceros puedan difundir tu obra y lucrarse con ella... Creo que en general no pierdes tu derecho a lucrarte. Puedes hacer una canción con una poesía escrita en Menéame o en Twitter y lucrarte con esa canción sin que Twitter ni Meneame puedan decir que esa obra "es suya", porque no lo es, no es "suya", solo tienen unos derechos de difusión y explotación de la misma, nada más. Si copias Linux tienes derecho a distribuirlo si quieres, porque los autores te dieron ese permiso, o a lucrarte con él, pero eso NO significa que Linux sea "tuyo". Sigue siendo de sus autores.

Existen un tipo de derechos llamados "derechos morales" que son derechos de autor irrenunciables. Es decir, aunque Meneame te pagara dinero para que les des permiso para decir que tu comentario no lo escribiste tú sino que fue creado por Fulano... NO es legal renunciar a la autoría, tú sigues siendo el autor, por mucho que hayas cobrado dinero para negar que el autor fuiste tú. Y como autor tienes derecho a que se te reconozca la autoría, por tanto, después de haber cobrado dinero podrías demandar a quien diga que es el autor sin ser verdaderamente el autor. Puedes exigir que deje de decir que es el autor sin serlo de verdad, porque eso es mentir y los autores tienen derechos irrenunciables. A lo que sí puedes renunciar es a la explotación, a cobrar dinero por tu obra. Sigues siendo el autor, y la obra es "tuya" en ese sentido, pero otro la puede explotar y ser "suya" en este otro sentido.
Creo que ni en Twitter ni en Menéame se renuncia a la explotación así que sigue siendo tuya en el sentido de explotación, aunque no enteramente tuya, sino compartida con una empresa.

c

A mí me gustaría saber cómo van a demostrar los demandantes qué datos son los que se han usado una vez creada la IA.

A

#17 tendrán toneladas de logs pero si el fondo está complicado.

ostiayajoder

#17 Bueno, parece claro por los datos que dicen que han utilizado que ha sido asi...

Que muiestren a un juez sino ha sido asi y listo....

Estos casos, como los de mala praxis medica, son asi: el acusado puede demostrar FACILMENTE que es inocente, el acusador dificilmente puede demostrar nada por muy obvio que sea, de modo que se le pide al acusado que se exculpe con pruebas o se asume que miente.

NotVizzini

#65 En la mayoría de paises, la prueba recae en quien denuncia, no al revés...

D

Qué lo demuestren

zeioth

Lo guapo es a ver como lo demuestras si es que es así. Yo no me creo que Microsoft no esté preparado para esto.

C

- Queremos que ChatGPT sea comunal!
- Y turgente!

Commodore

Los tontos que salen con que para entrenar a la IA se usa contenido protegido o privado... cuando es contenido disponible de maneral ibre para todo el mundo en Internet.

Los defensores del copyright y estas leyes de mierda se van a llevar una ostia buena con todos los cambios que trae la tecnología de la IA al sector y a la sociedad.

Están intentando desprestigar estas aplicaciones generadoras de texto y las generadoras de imágenes... metiendo miedo conque van a traer desastres, pérdidas de trabajo, que estemos quietos 6 meses sin usarlas y blablabla.

Tonterías. La tecnología avanza y es imparable. Y se va a pasar todos los copyrights de la faz de la tierra por el mismísmo forro de los cojones.

j

#41 Buen argumento. Te sobraba empezar con el insulto; ahí te caes con todo el equipo.

pitercio

A veeee... que si está en la Internez no es de nadie, es de primero de jáquel.

antares_567

#8 bueno, lo que escribes en Twitter es de Twitter, no tuyo y lo que escribes en meneame supongo que será de meneame

MAVERISCH

Los derechos de autor, como todos los otros derechos que tú tienes, se deben defender con celo contra la gente que no los tiene y quiere arrebatárselos. Por supuesto.

e

todos nos hemos bajado todo internet y metido en un diskete y nadie no ha demandado por eso

D

Que se cambien de país. Esto es imparable.

lawnmowerdog

Exacto. Si cualquier persona puede leerlo, entonces no veo problema. Otro tema sería entrenar esas IAs con material privado, pero mientras sea público, no veo problema.

Igual que con las imágenes. Si puedo ver una foto o una pintura, ¿cuál es el problema?

Todo lo que tuviera copyright abusivo* debería ser privado completamente. Ya verías tú que pronto se acabaría todo este mamoneo de los derechos abusivos.

* copyright lo tiene siempre el autor por el simple hecho de ser el autor de la obra.

Dondik

algo de razón hay en la queja

D

Tiene a Tío Sam detrás. Tranquilos.

P

Muchos hemos leído y aprendido de Internet. ¿Hemos hecho algo ilegal por ello? ¿Cuál es la diferencia con si quien aprende es una IA o un humano?

D

#31 no hay nada malo, solo quieren sacar tajada

S

Mi formación y la de las personas con ganas de aprender se ha disparado desde que se popularizó esta tecnología. Dista de ser perfecta, pero es una herramienta que bien usada, facilita la autoformación una barbaridad.

Para mi, estas acciones son otro mensaje claro diciendo: estáis abajo y ahí os vais a quedar.

C

Mi comentario en la línea de lo que muchos esgrimen aquí: ¿como se puede llamar apropiación o robo a la recopilación de datos de dominio público? Veo más una campaña para ralentizar el desarrollo de ChatGPT no con fines altruistas si no como tácticas de competencia desleal. 

D

Esta demanda tiene menos recorrido que los paseos que se daba mi abuela con 96 años.

NiñoMono

Menos mal que nos quedan los abogados para parar el progreso!! Gracias abogadooooooooooooooooOOO

j

"Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos"

Igual que yo. Por ejemplo, cuando entro en la Wikipedia.

G

Empiezo a pensar que ChatGPT no es más que un interfaz chulesco, que tira de la wiki y de otras enciclopedias...como un Cadillac con motor de seiscientos...

1 2 3