Hace 2 años | Por Falagar a copilot.github.com
Publicado hace 2 años por Falagar a copilot.github.com

Github Copilot se integra directamente en tu editor sugiriendo lineas o funciones enteras generadas por una inteligencia artificial entrenada con miles de millones de líneas de código público.

Comentarios

Wallack

#3 el hardware donde corre también es público?

trivi

#18 #21 ¿las licencias de TODO el código libre que han usado permiten ese uso y que el resultado sea usado comercialmente sin ser open source?

inconnito

#23 Con total seguridad, sí. Por varios motivos:

1.- El resultado de procesar todo ese código para entrenar una IA no implica que haya una sola porción de código en el resultado final; lo que habrá será algo similar a una matriz gigantesca y una serie de coeficientes que unen sintaxis básica. Más allá de trivialidades como "for (int i = 0; i < n; i++)" no habrá ninguna línea de código en el resultado que puedas decir "ese trozo de código proviene de tal fichero fuente con licencia X".
2.- Poca, o ninguna, licencia habrá que impida "procesar el código fuente para, sin linkar ni una parte del código, entrenar una IA sin que dicha IA sea libre"
3.- Aunque pueda existir alguna licencia que impida expresamente eso, las más conocidas (GPLv2, BSD, MIT, Apache, etc) no incluyen ninguna cláusula similar. Así que en GitHub, que no son idiotas y tienen abogados, habrán restringido el entrenamiento a repositorios de licencia conocida con la certeza de que lo que hacen es legal.

trivi

#53 gracias por la confirmación!

D

#53 No están distribuyendo software con licencia GPL (ni ninguna otra licencia). Utilizan ese software para entrenar a una IA de autocompletado, que después rellena en base a lo que escribe el programador. No es redistribución de código, y ni la licencia GPL ni otras cubren el entrenamiento de IAs usando el código. Si estuvieran redistribuyendo código propio de una librería, podría entenderse que están violando la licencia GPL, pero suerte probándolo. El argumento legal no es que ellos no estén redistribuyendo el código (que lo hace la máquina, tal y como indican tus referencias). El argumento legal es que no es el mismo código, y que la lectura (no reproducción) de ese código, no implica tener que mantener el tipo de licencia.

D

#55 No hay ninguna excepción de Copyright que les permita utilizar trabajos con Copyright para entrenar su IA sin permiso en un trabajo de ámbito no científico y comercial.
https://www.copyrightuser.org/understand/exceptions/

D

#56 GPL y apache son copyleft, y si bien no hay ninguna excepción que permita ese uso en las licencias copyright, tampoco hay ninguna prohibición que restrinja ese uso o exija que una librería entrenada con dicho código tenga el mismo tipo de licencia, o que haya derechos de atribución adheridos a la misma. Además de la cuestión práctica de "suerte probando que hemos usado tu librería para entrenar nuestra NN".

PD: revisando esa lista, también estaría cubierto por las excepciones del copyright (aunque no sean de aplicación). Lo que hace una NN con ese código es clasificable dentro de "text and data mining".

D

#57
Veo que no has entendido lo de «no comercial» y «ámbito científico».

D

#58 Y veo que no has entendido dos cosas: que GPL y Apache no son copyright, y que no existe la prohibición explicita en esas licencias de hacer lo que ha hecho github (y otros tantos antes que ellos). Aparte de que "no comercial" y "ámbito científico" es una cita parcial: "non-commercial research and private study, quotation, news reporting, education, and other uses." Other uses es lo que cubre esa lista que enlazas, que incluye el text and data mining.

Pero no nos desviemos de la realidad por el simple hecho de que hayas enlazado una web sobre copyright, ya que no es aplicable al open source: Las licencias que tiene casi todo el open source (GPL, Apache, MIT) permite el uso libre del código, y exigen que otros softwares que reproduzcan dicho código estén sujetos a la misma licencia. Esto se podría clasificar como uso y no reproducción, o incluso como algo distinto del uso. Y si no, cuelga algún repo en github, esperate a que lo usen para entrenar su IA, y denúnciales, es así de fácil.

D

#61 Pero qué pesado eres. El Copyleft es una forma de Copyright. Y lo que hace GitHub está explícitamente impedido en la GPL, secciones 4 y 5.
Además el uso no es científico ni no comercial, luego no pueden hacer uso de ninguna de las excepciones permitidas por el Copyright sin autorización.

Finalmente léete los términos de uso de GitHub, secciones D.4 y D.5, junto con la definición de «service». La licencia que le das a GitHub no autoriza a vender tu contenido.

PD: estás mezclando código abierto (open source) con software libre. Churras con merinas.

Heni

#18 Si lo ejecutas en Arduino, pues sí

Si tienes paciencia también puedes esperar un poco a que salgan las primeras implementaciones comerciales del RISC-V

D

#21 Además que todo el código es original de uno mismo. Sobretodo por aquello de no reinventar la rueda. #3

D

#3 la comunidad ya tiene GitHub gratis. No si encima hay que regalarlo todo.

El soporte profesional de cualquier distribución Linux es de pago, de algo tendrá que vivir la gente.

D

#36 El soporte de GitHub es de pago, igual que el de las distros de Linux. Y tienen cosas como las "Actions" y el "Marketplace", que son de pago. No creo que esto tenga un papel muy relevante en la estrategia económica de GitHub, dudo que sea cuestión de dinero.

Esto lo ha hecho github aprovechando que tienen el código alojado, pero no hay nada que impida que lo haga cualquier otra empresa, ya que los repositorios con los que se ha entrenado son públicos (se supone), por lo que tenemos acceso todos. La diferencia es tener que hacerte un scrapper que vaya haciendo un git-clone de cada repositorio, en vez de que esté ya alojado por el propio usuario en tu servidor.

D

#3
Necesitamos una GPLv4.

D

#2 No te preocupes. Saldran mierdas XXL y tras fallos y exploits gordos con perdidas chungas no van a permitir dichas "sugerencias" en ningun sitio serio.

M

#2 Me suena a que si la evolución de la sociedad dependiera de ti, todavia viviríamos en las cavernas.

Sebastian_Wilder

#14 Me suena a que debe ser de java y copiar la misma basura de todas partes igual que los "javascripteros" y "pythoneros" pero viene con el pecho hinchado por que la suya se compila y nadie mira el jar.

D

#14 Entonces la solución a los problemas de las sociedad son millones de líneas de códigos de scripts guarros, ¿no?

Muy Silicon Valley.

JungSpinoza

#1 a mi me da verguenza que la AI me quite el trabajo. Ahora sabra que me paso el dia poniendo chascarrillos en meneame

D

#4 para eso la IA no sirve lol

D

#6 nah... El sentimiento de troll, el fiel a su ideología, el que se aburre, el alto, el bajo y el equidistante, el que no entiende nada, incluso para los admins. Para todos maradona y rabo (coca cola).

No se puede.

i

#8 Haría falta una IA que se comporte como un ofendidito, porque de IN (Idiotez Natural) de eso hay mucho.

D

#6 Este comentario ya lo has puesto varias veces cambiando ligeramente las palabras, confiesa.

D

#26 visto visto... Glubs

mr_x

#39 miedito da.

D

#50 ya... Pero más curioso sera ver al jefe intermedio gritandole a la IA lol

D

Suena regular, si pienso en el día a día que tenemos hoy en la oficina no creo que pudiera ofrecer ni una solución.

Si es código genérico para realizar cosas genéricas,es más o menos lo que hacemos cuando vamos a stackoverflow buscando una solución y copiamos/pegamos el trozo de código.

Luego estas cosas suelen ser mejores de lo que a priori parecen. Pero a priori bi parece tener mucho sentido.

vicvic

terminará escribiendo por ti jeje

ktzar

No sé los demás, pero en mi caso escribir código (y hablo cuando tengo el rol de desarrollador) es el 5% del trabajo, el resto es pensar, limpiar, refactorizar, explicar y documentar. Y de todas formas programar es una parte muy pequeña.

l

hoy te da atajos... para mañana quitarte el trabajo wall

Tannhauser

#16 Fue a pedir trabajo y le comieron lo de abajo.

Moussenger

Vereis cuando se piquen los de Stack Overflow...

e

#10 tiene que existir lo mismo pero con sugerencias de stackoverflow

D

#10 Me veo haciendo hilos con código erróneo, para que la IA lo interprete como bueno y haga la función inversa a la deseada. El trolleo puede ser épico, al nivel de quién ponía anuncios en Ebay vendiendo fotos de PS5 a precio de gráfica inflada. Héroe anónimo vende fotos de la PS5 en eBay para que las compren los bots especuladores

Hace 3 años | Por knzio a es.gizmodo.com

Imag0

Le pones en un chat con el cliente y el comercial que se entiendan entre ellos, me parece una puta maravilla de invento 🙌 🙌 🙌

c

Nunca hay que olvidar esto:

daphoene

#47 Ese señor y yo compartimos opinión, y me imagino que contigo somos al menos tres...

devil-bao

Es un autocompletado mejor.

carles

#31 Github tiene repos privados gratuitos también...

ochoceros

Parece muy bonito, y con el acceso cerrado a unos pocos elegidos.

Una buena idea para hacerse con el código fuente de unas cuantas empresas jugosas, a saber quién anda detrás.

P

#59 lol

SiCk

Ya existe algo parecido por si lo queréis probar: https://www.tabnine.com/
Con vscode tenéis extensión, y bueno si es más o menos lo mismo, es útil pero no es para tanto: https://marketplace.visualstudio.com/items?itemName=TabNine.tabnine-vscode

Ehorus

hum... un bucle while(1) ... y mientras la IA se entretiene en resolverlo, a desarrollar se ha dicho.

D

Que pesado eres tú, compañero. Si, el copyleft es una forma de propiedad intelectual similar al copyright, pero NO es copyright. El copyright y el copyleft son figuras independientes, con intenciones similares, por mucho que te empeñes en que no lo son.

Respecto a lo que dices de las secciones 4 y 5 hablan de la distribución de código verbatim y modificado. Entrenar una IA no supone distribución de ese código. Y lo mismo respecto a los términos de uso de Github. No distribuyen ni venden tu código, entrenan una IA con ese código, y esa IA genera código nuevo. Buena suerte demostrando que es una modificación o un verbatim.

Pero venga, insiste en la alocada idea de que Github deben ser idiotas y no gastan dinero en abogados. Lo mismo los de kite. O los de codota. O los de tabnine.

Efnauj72

La culpa es de la IA.

D

Esto es bastante similar a extensiones como Kite, que para ciertas cosas está bastante bien. Yo no me preocuparía porque quitara el trabajo, simplemente facilita el escribir bloques de código habituales, básicamente ahorrándote buscarlos en otro script en el que ya lo tengas y hacer ctrl+C - ctrl+V. Vamos, que un 1% del tiempo te vale para el autocompletar un bloquecillo de código, un 9% te vale para autocompletar una linea completa (normalmente bastante corta), y el resto del tiempo valen para lo mismo que el autocomplete de cualquier IDE. No creo que esta versión de github sea un salto muy grande, la verdad.

D

ya estoy oyendo a la gente decir "te vamos a pagar menos porque no es tan dificil, total, lo dificil lo va a resolver una inteligencia artificial por ti"

Tontos los developers que usen cada vez mas esto. El que no sepa programar no necesita una IA, lo que necesita es programar mas y punto. Esto solo nos trae salarios mas bajos

KiKiLLo

Pero esto es un project del propio team de github o cómo está el tema? Dónde está el código si son los propios de github? Que lo han metido en un bitbucket o que? wtf

kaostias

#29 Es un proyecto de github para vendérselo a empresas, github tiene repos privados también (en opciones de pago, vaya)

D

Esto ya lo hacía el Basic de MSX...

P

#20 ¿El Basic de MSX tenía una IA que miraba millones de líneas de código para sugerirte en base al nombre de tus funciones y a los comentarios que pones? Cuéntanos más lol

D

#38 El mío sí, lo que pasa es que no había internet en esa época y la IA se comunicaba con cintas de cassette en mercadillos de segunda mano e iba tan lento que nunca obtenías resultados...