Hace 2 años | Por RoyBatty66 a softzone.es
Publicado hace 2 años por RoyBatty66 a softzone.es

La Free Software Foundation considera que GitHub Copilot, la IA que ha aprendido a programar leyendo todo el código de GitHub, podría ser ilegal.

Comentarios

D

#4
Algún día banearán a ADSLZone de Menéame.

SaulBadman

#5 ADSLzone no está tan mal en comparación de sus webs hermanas (HardZone y SoftZone), pero la que da puro asco es ComputerHoy: Tienen clickbaits y datos incorrectos mansalva

obmultimedia

#18 que no esta mal? si es la okdiario de la tecnologia!

U

#8 Correcto, sólo un apunte. La FSF considera que la comunidad debe decidir o puede opinar si copilot es ético al margen del marco legal. Ellos mismos advierten que podría no ser ético aunque esté legalizado. Es decir, piden los informes legales por si la comunidad se muestra en contra para poder denunciar y llevar el caso si procede. No es que pregunten por la ley para formarse una opinión, son dos preguntas separadas: una es cuál es la posición ética o moral de la comunidad y la otra si es legal o no.

D

#7 pero entonces si sacas código de stackoverflow es ilegal?

Una función que pone la primera letra en mayúsculas de un texto tiene derechos de autor?

Si fusila el proyecto completo lo puedo entender

Pero si lo que te autocomplementa es una línea de código...

Rudolf_Rocker

#9 En Github cada repositorio tiene una licencia, no tiene nada que ver con Stackoverflow.

D

#11 ni es lo mismo leer código y generar uno nuevo que fusilar un repo

Rudolf_Rocker

#14 ¿Conoces como funcionan las licencias de derechos de autor? ¿O estás hablando por hablar?

D

#21 Pues como le pillen con codigo bajo GPL sin respetar la licencia, no quisiera estar en su pellejo. Y menos en una empresa.

D

#23 todos a la cárcel si

D

#34 Carcel no pero como los afectados demanden a la empresa se le puede caer el pelo. La FSF y la gente con el resto de licencias no juega con estas cosas.

D

#38 te reto a que demandes a alguien por un método para hacer una cosa común y que se ha hecho desde que el mundo es mundo. Como leer un fichero u ordenar un array.. A ver hasta donde llegas.

D

#42 No entiendes nada de licencias, verdad?

D

#43 pues dame algún ejemplo.

D

#42 Tu puedes implementar sort() como te salga de la polla pero no usar el sort() de GNU sin cumplir la licencia.

Copilot fusilando funciones literales se arriesga a litigios graves, y eso junto a millones de usuarios puede generar una multa gordisima a MS. Hablo de cientos de miles de dolares por AFECTADO.

D

#21 pues explicarlo que lo debo de pillar

a

#9 Si el código que la gente pone en stack overflow tiene una licencia con copyleft, deberás cumplirla si quieres cumplir la ley (y los principios éticos que te han ofrecido ese software)

...que es el caso: https://stackoverflow.com/help/licensing
Tienes que acreditar la autoría y, si lo modificas, compartirlo con la misma licencia:


Usted es libre de:

Compartir — copiar y redistribuir el material en cualquier medio o formato
Adaptar — remezclar, transformar y crear a partir del material
para cualquier finalidad, incluso comercial.

El licenciador no puede revocar estas libertades mientras cumpla con los términos de la licencia.

Bajo las condiciones siguientes:

Reconocimiento — Debe reconocer adecuadamente la autoría, proporcionar un enlace a la licencia e indicar si se han realizado cambios

D

#12 Juas, esta si q no la sabía.

Soberana tonteria me parece la verdad.

D

#13 Tonteria hasta que tu empresa usa codigo GPL por sus cojones morenos, el desarrollador se cosca y le toca pagar multa y por supuesto liberar TODO bajo la GPL.

Por ejemplo, tu fusila codigo de readline para anyadir un bonito autocompletado en tu programa privativo de terminal.

Veras donde acaba tu proyecto.

D

#44 venga si tira.

a

#9 O explicado de otra manera, esa función de mierda escrita en 3 minutos, sí, tiene derechos de autor. Y te explico porque es bueno. Yo colaboro de vez en cuando en stack overflow. Normalmente no pico código, suelo compartir experiencias o guiar hacia las soluciones, pero de vez en cuando lo hago, sobre todo scripts.

Ten seguro que si no tuviera esta garantía de que ese código que pico -en ocasiones exclusivamente para SO- no tuviera esa licencia, no me molestaría en regalar mi tiempo para que otros privaticen mi código.

Y al final saldríamos perdiendo la humanidad, como conjunto: adiós a una herramienta de aprendizaje colaborativo, en la que compartir dudas, soluciones y puntos de vista, bienvenido a un foro más dónde podrás encontrar indicaciones, pero no código porque te lo vampirizarían. Y si stack overflow es la web más popular entre quien programa es por los puntos de vista, ¿verdad?

D

#16 pues ten cuidado, por que si seguimos por esta senda podría llegar uno y demandarte por qué el tenia publicado un script igual al tuyo.

Ya le metemos derechos de autor a los métodos de ordenación, o los bucles a ver si así pierde aún más la humanidad.




Yo juraría que hace años esto era al revés, los que querían que un puñetero for tuviese derechos de autor eran las empresas.. como cambia el mundo.

a

#17 No cambia tanto, si lo piensas. Cambia el uso que se hace de los derechos de autor. Cuando antes tenían un sentido restrictivo, ahora se utiliza todo el armazón legal que han montado en torno a ellos precisamente para garantizar que esa idea nunca será restringida.

Es un cambio de estrategia -que tampoco es novedoso, esto tiene bastantes años- pero responde al mismo fin.

Imagínate que desarrollas una vacuna pero quieres que su uso sea libre para todo aquel que la pueda producir. Puedes publicarla sin más, con lo que si alguien la coge, la mejora un poco y no la publica, la humanidad ha perdido un avance o... puedes publicarla con una licencia libre con copyleft, de manera que todo el mundo puede producirla y si alguien la mejora, todo el mundo podrá también disfrutar de esa mejora.

Como dicen en GNU:
Copyleft

Ciertos tipos de reglas sobre la manera de distribuir software libre son aceptables, cuando no entran en conflicto con las libertades principales. Por ejemplo, el copyleft , definido muy sucintamente, es la regla en base a la cual, cuando redistribuye el programa, no se puede agregar restricciones para denegar a los demás las libertades principales. Esta regla no entra en conflicto con las libertades principales, más bien las protege.

D

#19 aquí estas comparando coger una vacuna completa y seguir su desarrollo. Y estamos hablando de leer millones de líneas de código y registra o "aprende" formas de hacer tareas.

Si después de analizar millones de proyectos, el aprende que para abrir un fichero la gente usa
File.open() y te lo autocomplementa...
A quién pertenece ese código. Que licencia deberia seguir en ese caso?

kyle

#27 pues ese es el problema, que nadie tiene ni puñetera idea de qué licencia debería tener. En el caso de los humanos, aprendemos a base de leer código de otros y reproduciéndolo más o menos parecido para resolver el problema que tengamos delante. La diferencia es que ahora hay una "máquina" que es capaz de hacerlo a escalas y fidelidad nunca vistas.

- Si un alumno aprende 100% leyendo código bajo licencia GPL (por decir una), ¿sus desarrollos posteriores deberían ser todos GPL?
- Si el corpus de entrenamiento de Copilot son todo códigos bajo licencia GPL ... ¿qué licencia deberia tener lo que genere?

Leí un comentario de alguien que abogaba por dar un paso atrás y pensar si esto beneficia o no a los intereses finales de la FSF: la libertad de los usuarios de computadoras. El argumento iba más o menos por aquí: "Si un usuario es capaz de pedir algo a un sistema, y este le da el código que lo resuelve bajo la licencia que necesita, ¿es más o menos libre que antes?" . Eso es lo que tiene que dilucidar la FSF.

D

#32 me parece perfecto el ejemplo de el alumno. Bajo mi punto de vista, igual que no tendríamos que ponerle cortapisas al alumno, tampoco a una IA.

trivi

#9 hay soluciones a problemas complejos que no puedes coger y copiar porque sí y ni tan siquiera citar al autor, y menos de forma sistemática como permite hacer copilot

#22 hasta cierto punto, no puedes coger la estructura de un proyecto libre y fusilarla en tus proyectos comerciales (dependiendo de las licencias concretas)

También afecta a la visibilidad de librerías, por ejemplo, haces una librería no muy compleja que sirve para resolver un problema común. Copilot puede decidir "copiar" el código cada vez que alguien tenga ese problema en lugar de importar la librería directamente, de manera que el autor no tendría ningún reconocimiento y eso puede afectar incluso a la carrera profesional de la gente.

A

#30 Bibliotecas.

Perdón por ser tiquismiquis, pero tengo una cruzada un tanto quijotesca con esto.

trivi

#39 sin problema, soy consciente de que la traducción del inglés no es correcta, pero en el ámbito de la programación se hace uso indistinto de las 2 palabras y según la RAE ninguna encaja en el uso que hacemos.

A diario hay cosas mucho peores, como "mergear", "loguear" (para iniciar sesión, no para generar un archivo de logs) y otros tantos verbos que españolizamos.

A

#40 A diario hay cosas mucho peores, como "mergear", "loguear" (para iniciar sesión, no para generar un archivo de logs) y otros tantos verbos que españolizamos.

¡¡¡¡DEJA DE TORTURARME!!!!

a

#7 O mejor aún, tratar de demostrar que no ha usado distintas fuentes de código con licencias incompatibles entre si... lol Welcome to license's hell!

Caresth

#7 Si fuese un humano no tendríamos ninguna duda de que puedes crear código privativo aunque hayas aprendido con ejemplos de código libre.

a

#22 Cierto, pero no lo es. Se parece más a un remix, en mi opinión.

D

#22 el tema es que no es un humano y, con estos modelos de lenguaje enormes, nadie se pone de acuerdo si sintetizan cosas porque aprenden alguna representación de esos conceptos o simplemente van memorizando esos fragmentos y cuando es probable que sean apropiados.

Yo creo que es más bien lo segundo.

D

Llevo utilizando Copilot desde hace 1 mes. La verdad es que es una pasada. Me autocompleta incluso frases generadas inteligentemente y no únicamente un copy paste. Realmente es el software del año sin lugar a dudas. Fácilmente me autocompleta el 30% del código y otro porcentaje me aporta código que retoco. Algunas veces hace pura magia, me incrusta variables totalmente custom de mi código. Hoy escribí en una web: "Te encuentras en la web de XXXX" y en las XXXX incrusto el nombre de la compañía. Algunas veces construye hasta frases largas exactas a lo que buscabas escribir, nada de copy / paste. Al principio pensé que iba a ser una basura.

m

Si esa AI copia y pega código GPL...

Yo lo veo así: si fue alimentada con código GPL, lo que escriba debería ir con licencia GPL, si no le gusta al usuario, que alimente la AI con código que no sea GPL.

dudo

#25 no copia y pega, es una inteligencia que ha aprendido y por supuesto puede generar código privado.

Igual que si un humano aprende a programar viendo código público, luego podrá programar código privado.

m

#29: Una inteligencia artificial no aprende como nosotros, es una palabra que se usa para simplificar el proceso.

Lo que ocurre es que se ajustan los valores de una serie de matrices y parámetros, pero eso se hace a partir de un código GPL, por lo tanto esos valores son GPL. Sin código GPL esos valores no se ajustarían igual, así que algo habrá.

Si no quieren tener problemas que se limiten a usar código con licencias MIT y BSD.

Tendrán que sacar una GPLv4 que prohíba de forma expresa su uso en IAs, si bien la licencia ahora mismo lo impediría si el resultado final no es GPL. Sólo faltaba eso, que se pusieran a ponerle Copyright a lo que mucha gente ha publicado como un patrimonio público...

dudo

#36 No es código generado a partir de código, es un aprendizaaje generado a partir de código, y este aprendizaje es el que genera el código, igual que un humano que aprende con código abierto, luego puede usar lo aprendido haciendo código cerrado.

Y sí, las inteligencias artificiales nacen de imitar aa la inteligencia natural, aun que no sabemos realmente como funciona, es una aproximación. No es perfecta, pero ya consigue resultados valiosos.

m

#49: Si el resultado está influido por la presencia de código GPL en el "aprendizaje", el resultado debería ser GPL también.

El "aprendizaje" consiste en el uso de código para configurar unas matrices internas. Revolver mucho el código o trocearlo no lo hace menos GPL. Y como dije, si no quieren tener problemas, que se limiten a usar código no GPL y listo.

D

-Oye, en el form de usuario, valida el formato del dni y fechas.

-programo y añado las funciones en la lib de formutils?

-No hombre copia las funciones de algún foro y las añades.

-A vale q susto...

-Eres tonto? Cómo vas a copiarlas de un foro si gh copilot lo hace por ti? Aprende del becario coño! Q estás anclado en el pasado.

MisturaFina

Datos publicos = propiedad publica.
Lo mismo con el big data en general. Nadie puede leer los datos de millones de personas y luego decir que "es su base de datos" LOS DATOS NO SON SUYOS. Recopilar datos no te hace propietario de nada. Si el big data fuera publico no habria las guerras estupidas que hay hoy con los proveedores de tecnologia que solo quieren robar datos publicos. Ni siquiera hay que pedirle a google que entregue sus datos. Lo unico que debemos hacer es usar solo software libre siempre. Asi el problema se vuelve publico.

pkreuzt

D

Pues las denuncias contra Microsoft pueden ser guapas de juntarse miles de afectados.

socialista_comunista

Como su nombre indica, es un copiloto, nunca será decisivo, en este momento lo que hace es codificar algo muy muy concreto según un input: una descripción o un código inicial al que sugerir el resto, nunca un sistema entero o cazar el fallo.

Pero los sudores fríos empiezan a recorrer muchas frentes de programadores endiosados.

Futuros perfiles preferentes serán relativos a investigación y creación de nuevas tecnologías, eso de momento no lo hace una IA.

En lo relativo al meneo, toda la razón a la FSF.