Hace 1 año | Por ccguy a sfconservancy.org
Publicado hace 1 año por ccguy a sfconservancy.org

Los que olvidan la historia a menudo la repiten sin querer. Algunos recordamos que hace veintiún años, el sitio de alojamiento de código más popular, un sitio totalmente libre y de código abierto (FOSS) llamado SourceForge, privatizó todo su código, para no volver a hacerlo FOSS. Los principales proyectos de software libre abandonaron poco a poco SourceForge, ya que ahora era, en sí mismo, un sistema privativo, y antitético al software libre. Las comunidades de software libre aprendieron que era un error permitir que una empresa (...)

Comentarios

D

#2
Firefox Translations (Proyecto Bergamot)

Esperamos que este post en particular genere mucha discusión. Le damos la bienvenida a interactuar con el personal de SFC en nuestra lista de correo público sobre este esfuerzo.

Nota de pie

0 Sin embargo, no hemos analizado CodeWhisperer en profundidad por lo que no podemos decir con seguridad si la implementación de Amazon cumple con las respectivas licencias. Sin embargo, El comportamiento de Amazon aquí muestra un fuerte contraste con GitHub de Microsoft: Amazon reconoce el hecho obvio de que hay obligaciones de licencia que merecen atención y cuidado a la hora de construir soluciones de programación asistidas por IA.

mas886

Un aviso para todos los que siguen defendiendo a Microsoft, o otras grandes empresas que basan la mayoría de su negocio en código privativo, como defensora y garante del programario libre. Que sepan que lo tienen como aliado incómdo, el día que se lo puedan merendar lo harán, y dejarán por el camino a quien sea, ya pasó a tantos otros proyectos, no me hagáis poner la lista.

e

#8 Permiteme que discrepe. No hay nada mejor para las grandes empresas, y para todas en realidad, que exista el software libre, al menos que no tengan licencia GPL como tal y puedan usarse en entornos empresariales sin problemas de licencia.
Ayudar a ese ecosistema sólo puede mejorar en beneficio de todos, de la comunidad de software, de los desarrolladores y de las empresas.
Como ejemplo clásico tenemos a Linux, incluso siendo GPL como es, no estaríamos donde estamos hoy sin él y ahí le tienes ( https://github.com/torvalds/linux ).
A partir de ahí, todas las librerías que se te ocurran y prácticamente todo lo demás. Si yo tuviera que hacer una app/web desde cero sin usar software libre sería impensable a nivel personal y a nivel empresarial el coste sería inmenso.
Dicho ésto, entiendo las reticencias a confiar.

mas886

#12 Grandes empresas si, pero grandes empresas éticas respecto al software, que las hay. No puedo confiar en ciertas empresas, ya que trístemente la historia se repite. Por cierto, la licencia GPL se puede usar sin ningún problema en entornos empresariales. Lo que se asegura con ella és que todo el futuro desarrollo contribuya. MIT o BSD lo único que consiguen és que las empresas lo usen sin retornar absolutamente nada la mayoría de veces.

s

#14 Exacto, es precisamente a eso a lo que voy.

p

Igual me he perdido algo, pero no me suena que hayan pillado a Github inyectando código en los ejecutables/instaladores de tu repositorio.

yocaminoapata

#5 igual debes leer la noticia

D

#25 Lo que tú produces, mientras estás a sueldo de tu jefe, es de tu jefe, tras haber firmado un contrato sobre ello.
¿Te convierte eso en un producto o solución comercial? No. ¿Te están vendiendo a ti o a tu trabajo?

¿Copilot está usando el resultado del trabajo de mi código? No, está usando directamente mi código. ¿Tu jefe está usando el producto de tu trabajo o te está usando a ti directamente?

Tengo en mi proyecto de FOSS una cláusula que dice que cualquiera que use mi código lo documentará en el suyo. Y copilot usa el código, lo integra en su base de conocimiento de una manera que no es la misma que utilizamos los programadores.
¿Hace eso que Copilot esté infringiendo la licencia si lo ha usado y no lo ha documentado? Pues eso parece.

Es complicado, sí. Pero fíjate que otras compañías como Amazon que aprovechan el código de proyectos FOSS para alimentar IAs de asistencia a la programación sí piensan que es un uso de ese código y que merece cuando menos reconocimiento. Solo Microsoft piensa que es mejor sencillamente pasar hasta el culo de los desarrolladores FOSS y de sus rollos legales.

s

#41 Claro, pero lo que se está diciendo ahí es ligeramente diferente. A esto: "[...] which has led to fears that the outputted code is insufficiently transformative enough to be classified as fair use [...]" es a lo que me refería en #9, ¿cuántos programadores consultan algo en Stackoverflow y lo transforman suficientemente para que no sea plagio?

#27 Microsoft ha tenido (y sigue teniendo) muy poca vergüenza en ese aspecto, lo cual da coraje pero no sorprende. De todas maneras, para mí, el objetivo del debate no es Copilot en sí, sino en la legitimidad de usar según qué datos para entrenar a modelos profundos. Piensa en DALL-E o en GPT-x. Al final todas han aprendido de imagenes o textos (respectivamente) posiblemente con Copyright y, sin embargo, lo que están crean no es una burda copia. Si le dan una vueltecita a Copilot de tal manera que se comporte de forma "novedosa", ¿sigue siendo problemático aprender de código GPL? ¿No hacemos eso también nosotros?

D

#26 La cuestión es que si revisas el código que hace Copilot, verás que es un pastiche de código ya existente, no es "código nuevo".

r

#29 Define qué es código nuevo. La inmensa mayoría de código que escribo es parecido o calcado al que puedan escribir otros porque es la forma óptima (o en algunos casos la única) de hacer esa tarea. Y que yo sepa, en ningún momento Copilot promete crear código nuevo e innovador

D

#33 Ya, pero una cosa es que tú hayas visto un código hace meses y, al hacer otra cosa, "te salga algo similar", y otra muy diferente es que para hacer algo vayas a github y cojas cachitos de aquí y de allí para hacer código nuevo. Por la forma en que funciona Copilot eso es lo que hace realmente. Copilot no "sabe programar" realmente.

#40 Pues como si buscas en stackoverflow, te copias el código que más o menos hace lo que quieres y lo adaptas a tu caso particular, sólo que Copilot te lo hace todo de forma casi automática a partir de lo que pretendes hacer y usando el contexto del código que has escrito. ¿Para ti el que busca en stackoverflow y copia/inspira no sabe programar? ¿El que reutiliza código que ya ha escrito en anteriores proyectos tampoco sabe programar? Pues nada, a la hoguera el 90 por ciento de programadores de todo el mundo.

D

#44 Pero yo no digo que el problema sea "saber o no programar", sino copiar cachos de código con una licencia vírica. El código en stack overflow te lo dan expresamente para que lo copies y hagas con él lo que quieras, cosa que NO ocurre con el código en Github.

#45 es que el concepto de copiar en el caso de Copilot no aplica porque por detrás hay un modelo que genera texto. Es lo que decía en mi primer mensaje, que si estás tratando el código del que se nutre como dato para el aprendizaje la violación de las licencias no está nada claro.

D

#50 Lo mismo que la conducción "autónoma" es útil para quien sabe conducir pero, aún así, tienes que asegurarte de que no te meta debajo de un camión.

D

los mismos que luego van a StackOverflow a coger "ideas". Siempre las mismas sandeces. La mayoria del codigo que hay es una puta mierda.

Me recuerda a los que ponen el copia/pega en Facebook de que no autorizan el uso de sus fotos. Si, tus fotos en Badajoz son un bestseller en la deep web.

D

#24 Pues lo son... tener fotos de personas anónimas es genial para montar páginas de estafas sin que te pillen por usar fotos de stock.

barni

#32 para qué quieres fotos de personas anónimas cuando puedes generarlas por IA?

D

#38 Podrás empezar a hacerlo ahora.

ktzar

Gogs!

e

#36 por lo menos en el uso que le hago yo, no noto que falte nada ...

Magankie

Parece que han encontrado el talón de Aquiles del Open Source. Por mucho que se vayan de GitHub, mientras el código sea abierto será utilizado para alimentar a Copilot y aprovechar todas esas horas de trabajo gratis. Veremos cómo sigue...

e

#9 "El problema es que no sé hasta qué punto aprende o simplemente replica".

Venga, ¿cuántas veces al día haces copy/paste de stackoverflow? lol

D

#7 Si aprendes de alguien que te dice "yo te enseño artes marciales gratis pero solo si nunca las vas a usar para matar a gente indefensa" y tú aceptas y firmas un papelito, pero luego vas por ahí matando gente y negando haber firmado ningún papelito...

#9 Pero no es que aprenda para luego aplicarlo en soluciones comerciales, es que aprende para convertirse en sí misma en una solución comercial. Esa IA es un producto en sí mismo, mientras que un programador no es un producto.

#11 Si han utilizado código de proyectos con licencia no comercial, es argumentable que están infringiendo la licencia (están utilizando el código en un producto comercial). Incluso si usan código de licencias comerciales, el hecho de que no indiquen esas licencias y esos proyectos de los que beben es también un infringimiento de licencia.

s

#20 Tengo una claúsula en mi contrato que dice que todo lo que invente y/o produzca mientras dure el mismo, aunque sea en mi tiempo libre, pertenece (industrialmente hablando) a mi empresa. Eso me convierte en una solución comercial, ¿no?

Habrá que revisar las licencias para contemplar estos casos, porque con lo que hay no es suficiente. Puedo argumentar a favor de ambos puntos de vista.

JanSmite

#9 No es lo mismo: si tú, creador de una rutina protegida por copyright, ni que sea Creative Commons Non-Commercial, crees que otro programador la ha copiado para ponerla en su producto comercial, puedes presentar una demanda por infracción de ese copyright.

En el caso de CoPilot, ya han reconocido que la IA la han entrenado con todo el código disponible en GitHub (y de más sitios), pasándose por el forro las licencias. De la Wikipedia:

"Licensing controversy

Although most code outputted by Copilot can be classified as a transformative work, GitHub admits that a small proportion is copied verbatim, which has led to fears that the outputted code is insufficiently transformative enough to be classified as fair use and may infringe on the copyright of the original owner."


y apunta a este artículo de The Verge:

https://www.theverge.com/2021/7/7/22561180/github-copilot-legal-copyright-fair-use-public-code

snowdenknows

#9 Es un poco las 2 cosas, realmente aprende, pero digamos que también "chapa" materia y te puede soltar algún trozo casi copy/paste (pero es casi imposible que sea un copypaste 100%)

c

#7 "Aprender" es muy distinto de hacer copy-paste.

Por otra parte si tienes acceso a código fuente privativo tienes complicado publicar una herramienta equivalente de código libre sin problemas legales

#7 Si se considera el código como "datos" para tu IA, entiendo que bastaría con informar a los usuarios de GitHub de su finalidad, cosa que supongo que ya hicieron en su momento. No se trata de que estás vendiendo un código que tiene un tipo de licencia no comercial, sino de que estás utilizándolo para que Copilot pueda aprender y generar su propio código.

valar_morghulis

#7 Hay muchos matices, una IA no es una persona, no deja de ser un software, en el momento que una IA tenga los mismos derechos que yo, entiendo que ese paralelismo que planteas podría aplicarse, pero a día de hoy no deja de ser un producto comercial, aunque claro, dicho esto, todo depende de la legislación de cada sitio y del juez (si hubiere denuncia de por medio) que llegase a evaluar este posible caso.

Entiendo que los abogados de MS estarán revisando este caso con lupa por lo que pudiera suceder, jajajaja.

JanSmite

#7 La parte REALMENTE interesante del asunto es: ¿por qué Microsoft no quiere que CoPilot se entrene con su software, Windows y Office? ¿No será porque teme que copie partes de ese software y los ponga en proyectos de otras personas? Entonces, SÍ que hay un riesgo claro de que se infrinjan derechos de autor, si el propio propietario (valga la repugnancia) de la IA no quiere que su software propietario se vea involucrado, sólo quiere código de otros.

D

#6 Déjame que te responda con otra pregunta: ¿qué pasa si miro el código fuente de tu programa, analizo cómo has resuelto un problema e, inspirándome en tu código, creo mi propia implementación sin copiar una sola línea de código?

c

#13 Que te demandan. Y ganan.

s

#23 ¿Seguro? Los algoritmos no son patentables. Si #13 analiza tu código, lo que extrae es el algoritmo; si luego crea su propia implementación, suya es. ¿No?

D

#13 Buena pregunta, la cual ya fue respondida hace más de cuarenta años cuando Compaq creó la primera BIOS realmente independiente de IBM, y los muchos "cadáveres" que fueron quedando por el camino.

Esta IA no tiene un diseño de "sala limpia": https://en.wikipedia.org/wiki/Clean_room_design

D

#6 Lo dicen en el artículo, parece que Microsoft solo responde a preguntas cuyas respuestas le dejan bien, y se la suda cualquier otra cosa.

alexwing

#4 ¿Y que problema hay por qué se utilice en copilot? ¿Acaso tú no has puesto precisamente una licencia GPL para que sea reutilizado lo que públicas?

D

#11 La cuestión es que ha utilizado una licencia vírica para que, si te aprovechas de su código, tengas que compartir tu código. Con el co-pilot te estás beneficiando pero no estás aportándole nada. roll

alexwing

#15 bueno yo uso Copilot y todos mis desarrollos personales los subo en GitHub, así que lo que me ayude lo estoy volviendo a compartir.

Copilot te ayuda con algunos fragmentos repetitivos y algunas funciones simples, pero si lo dejas a su bola se le va bastante la olla, no programa por ti.

D

#17 Debe ser algo así como la conducción autónoma de Tesla, que conduce sola pero si la dejas sin atender acabas debajo de un camión de bomberos.

snowdenknows

#19 Na realmente para informáticos es muy útil

e

Personalmente teniendo Gitlab que es opensource y equiparable a github, para que quiero Github?

K

#34 la razón es que la interfaz UI de GitHub está a años luz de cualquier otro

mdotg

#36 Eso es porque estás solo acostumbrado a GitHub. Usa Gitlab dos semanas y te pasará lo mismo

MisturaFina

Me parece perfecto! Incluso necesario! Obvio tambien.