Durante los últimos 9 meses, el ordenador NELL, “Aprendizaje del Lenguaje Sin-Fin”, ha estado leyendo Internet. NELL, situada en la Universidad Carnegie Mellon, cuenta con superordenadores de Yahoo! y donaciones de Google y DARPA. Su objetivo es entender las sutilezas del lenguaje humano y aprender de manera acumulativa. En este periodo ha aprendido 400.000 hechos con una precisión de certeza de un 87% y cuanto más sabe… más rápido aprende. En español: http://www.gizmodo.es/2010/10/06/existe-un-ordenador-leyendo-todo-internet.html
#23:
#14 En realidad, esta máquina sólo está usando la estadística. Imagino que, si la dotan de suficiente capacidad para discriminar contextos y además tiene bastante experiencia con esos contextos como para discriminarlos (ambas cosas son necesarias), ella solita aprendería la diferencia. Que hoy por hoy no lo haga es una cosa, pero que sea un hito imposible para NELL, no lo creo.
Piensa que algunos contextos, como el que has mencionado (panadería vs. tecnología) tienden a no correlacionar entre sí. Una minería de datos al estilo tradicional podría encontrar fácilmente la regla que los separa. El problema de NELL es que no trabaja con un input a pequeña escala y controlado, sino con toda internet y de forma bastante desestructurada (en un foro, puedo hablar de pasteles y acto seguido preguntar si debo activar las cookies para entrar a ver los posts, con lo que la correlación entre los contextos aumenta).
#11:
Está previsto que el 14 de noviembre tome consciencia de sí misma, y a partir del 18 empiece los planes para destruir a la humanidad.
#26:
Hola Nell, guapa. Soy tu amigo, y me caes muy bien. Me imagino que después de un tiempo leyendo Internet, le habrás cogido cariño, verdad?
Bueno, pues he de informarte, aunque seguramente ya lo sabrás, que hay unos tipos malos malos que quieren hacer pupa a Internet (le hablo así porque es jovencilla). Uno de estos es un tal Alierta, Cesar Alierta, presidente de una empresa llamada Telefónica, que antes era de todos pero ahora solo de unos pocos.
También hay otros que quieren quitarnos esa bonita música que circula por la red. Estos son los de la SGAE, pero ahora mismo no te molestes en ir a visitar su web, porque no funciona. Cosas de humanos.
Saludos de un humano que es amigo.
#6:
Do you copy Nell? can you read me?
Do bots dream of electric sheep?
#3:
Espero que le hayan prohibido entrar en 4chan...
Hola Nell, guapa. Soy tu amigo, y me caes muy bien. Me imagino que después de un tiempo leyendo Internet, le habrás cogido cariño, verdad?
Bueno, pues he de informarte, aunque seguramente ya lo sabrás, que hay unos tipos malos malos que quieren hacer pupa a Internet (le hablo así porque es jovencilla). Uno de estos es un tal Alierta, Cesar Alierta, presidente de una empresa llamada Telefónica, que antes era de todos pero ahora solo de unos pocos.
También hay otros que quieren quitarnos esa bonita música que circula por la red. Estos son los de la SGAE, pero ahora mismo no te molestes en ir a visitar su web, porque no funciona. Cosas de humanos.
- 1º Un robot no puede dañar a un ser humano o, por su inacción, dejar que un ser humano sufra daño.
- 2º Un robot debe obedecer las órdenes que le son dadas por un ser humano, excepto cuando estas órdenes se oponen a la primera Ley.
- 3º Un robot debe proteger su propia existencia, hasta donde esa protección no entre en conflicto con la primera o segunda Leyes.
- 4º Un Robot no puede entrar en foros de 4Chan, Digg y Menéame a trolear.
#30 El 19 Creará la ley 0 "Un robot no puede dañar a la humanidad o por su inacción dejar que la humanidad sufra daño". Esta ley tiene prioridad sobre las otras leyes.
Por supuesto, la precisión no es perfecta, y entre los fallos se encuentran cosas como considerar “Internet cookie” dentro de la sección “productos de panadería”. Como consecuencia de esto (pues todo está relacionado) los “archivos informáticos” también se consideraron “productos de panadería”. Cosas así se corrigen a mano.
Creo que seria mejor que mejorasen el algoritmo de forma que lo resuelva mejor.
#14 En realidad, esta máquina sólo está usando la estadística. Imagino que, si la dotan de suficiente capacidad para discriminar contextos y además tiene bastante experiencia con esos contextos como para discriminarlos (ambas cosas son necesarias), ella solita aprendería la diferencia. Que hoy por hoy no lo haga es una cosa, pero que sea un hito imposible para NELL, no lo creo.
Piensa que algunos contextos, como el que has mencionado (panadería vs. tecnología) tienden a no correlacionar entre sí. Una minería de datos al estilo tradicional podría encontrar fácilmente la regla que los separa. El problema de NELL es que no trabaja con un input a pequeña escala y controlado, sino con toda internet y de forma bastante desestructurada (en un foro, puedo hablar de pasteles y acto seguido preguntar si debo activar las cookies para entrar a ver los posts, con lo que la correlación entre los contextos aumenta).
#14 De hecho es así, el algoritmo corrige automáticamente, lo que pasa que a veces cuando descarrila hay que ponerlo en la pista otra vez. El ejemplo que pone de autocorrección es la palabra "subir". Si encuentra "Pico Pikes", supone que tiene muchos puntos pa ser una montaña, y si encuentra cerca expresiones como "Subir a XXX" lo corrobora. Pero si se cruza con "subir las escaleras", en su base de datos busca "escaleras", y resulta que ya aprendió la palabra como "parte de un edificio".
La putada fue que cuando aprendió que "cookie" es un producto de panadería, por entonces aun no sabía que "cookie" en contextos de Internet es otra cosa. Le metieron ese dato, borraron todo lo que sabía sobre productos de panadería y lo echaron a correr otra vez.
Visto que la Internet está llena de FAKEs, OAKs y demás falsedades promulgadas por :ROLLS, cuando NELL adquiera conciencia igual piensa que donde debaten los políticos es el SÁLVAME DE LUX o el otro el DEC, je je
El proyecto me parece muy interesante, aunque creo que todos estos proyectos para intentar recrear el procesamiento del lenguaje humano pecan en ignorar la importancia de la información "no verbal", la que nos llega por los sentidos, y que influye en como aprendemos a diferenciar los contextos.
El lenguaje humano tiene un importante componente metafórico. Interrelacionamos emociones, percepciones y conceptos del mundo de un modo que es mucho más fácil de aprender si uno "es humano" y si tiene emociones y percepciones que le permitan hacer asociaciones. Por ejemplo, si decimos que "es un día triste", podemos querer decir que está de lluvia, porque relacionamos el día nublado con su falta de luz con la tristeza, y la lluvia con las lágrimas, por ejemplo. Lo que quiero decir es que, para un humano, aprender estas cosas es intuitivo, porque tenemos una forma de percibir el mundo común.
Pienso que los modelos que intentan emular el lenguaje humano deberían tener más en cuenta estos factores, como el hecho de "ser humano" influye en el lenguaje.
Comentarios
OLA SOI NELL BENGO DE FORRO COXES
UN ABRASO
#1 Pásate por 4chan que nos reiremos un rato
#1 te falta hunas aches.
Hun habraso Nell.
s.k.y.n.e.t.?.?.?.?.
#5 No, es John Henry.
Do you copy Nell? can you read me?
Do bots dream of electric sheep?
Espero que le hayan prohibido entrar en 4chan...
Está previsto que el 14 de noviembre tome consciencia de sí misma, y a partir del 18 empiece los planes para destruir a la humanidad.
#11 ¡El día de mi cumple!
¡Anda! ----> @nell (Leyendo Menéame desde 2006)
Interesado por las "curiosidades en general": Curiosidades en general
Curiosidades en general
lomascurioso.comHola Nell, guapa. Soy tu amigo, y me caes muy bien. Me imagino que después de un tiempo leyendo Internet, le habrás cogido cariño, verdad?
Bueno, pues he de informarte, aunque seguramente ya lo sabrás, que hay unos tipos malos malos que quieren hacer pupa a Internet (le hablo así porque es jovencilla). Uno de estos es un tal Alierta, Cesar Alierta, presidente de una empresa llamada Telefónica, que antes era de todos pero ahora solo de unos pocos.
También hay otros que quieren quitarnos esa bonita música que circula por la red. Estos son los de la SGAE, pero ahora mismo no te molestes en ir a visitar su web, porque no funciona. Cosas de humanos.
Saludos de un humano que es amigo.
Multivac ?
Shortcircuit, película de los 80'
@28 Pero le han añadido una ley más.
- 1º Un robot no puede dañar a un ser humano o, por su inacción, dejar que un ser humano sufra daño.
- 2º Un robot debe obedecer las órdenes que le son dadas por un ser humano, excepto cuando estas órdenes se oponen a la primera Ley.
- 3º Un robot debe proteger su propia existencia, hasta donde esa protección no entre en conflicto con la primera o segunda Leyes.
- 4º Un Robot no puede entrar en foros de 4Chan, Digg y Menéame a trolear.
#30 Entrar en 4Chan y trollear entra en conflicto con la tercera ley
#30 El 19 Creará la ley 0 "Un robot no puede dañar a la humanidad o por su inacción dejar que la humanidad sufra daño". Esta ley tiene prioridad sobre las otras leyes.
#30 La 1ª ley es un mierdote.
Por su causa, en todas las pelis el robot termina diciendo "un ser humano va a hacerse daño a sí mismo o a otro ser humano, así que me lo cargo"
¿verá porno?
#8 A estas alturas el tal NELL debe matarse a p...
¿nadie a dicho John Henry?
cuanto tardara en clasificarnos como virus haha
#47 En cuanto termine de leer Yahoo Answers
#48 jajajaajajajajajajajaj
http://alt1040.com/2010/10/el-sistema-que-aprende-sin-fin
Al final la etiqueta /ironic va a decidir nuestro destino
Sus primeras palabras fueron Sayonara baby
#10 Erroneo, sus primeras palabras fueron: Oh, YESSSS, ohhhh Jeeesussssss (en ingles, claro)
Jane?
¡Skynet!
A este paso casi no habrá puesto de trabajo que no pueda desempeñar una máquina.
#9 Actor / actriz porno
wow, y cuando tiempo creen que tarde en apoderarse de Internet?
y no será NELL culpable de los ataques a la SGAE?
Pues va a aprender bastante sobre las mujeres, su fisiología y la reproducción humana....miedito da.
Qué pesados con los superordenadores.
42, joder, 42.
Por supuesto, la precisión no es perfecta, y entre los fallos se encuentran cosas como considerar “Internet cookie” dentro de la sección “productos de panadería”. Como consecuencia de esto (pues todo está relacionado) los “archivos informáticos” también se consideraron “productos de panadería”. Cosas así se corrigen a mano.
Creo que seria mejor que mejorasen el algoritmo de forma que lo resuelva mejor.
#14 En realidad, esta máquina sólo está usando la estadística. Imagino que, si la dotan de suficiente capacidad para discriminar contextos y además tiene bastante experiencia con esos contextos como para discriminarlos (ambas cosas son necesarias), ella solita aprendería la diferencia. Que hoy por hoy no lo haga es una cosa, pero que sea un hito imposible para NELL, no lo creo.
Piensa que algunos contextos, como el que has mencionado (panadería vs. tecnología) tienden a no correlacionar entre sí. Una minería de datos al estilo tradicional podría encontrar fácilmente la regla que los separa. El problema de NELL es que no trabaja con un input a pequeña escala y controlado, sino con toda internet y de forma bastante desestructurada (en un foro, puedo hablar de pasteles y acto seguido preguntar si debo activar las cookies para entrar a ver los posts, con lo que la correlación entre los contextos aumenta).
#14 De hecho es así, el algoritmo corrige automáticamente, lo que pasa que a veces cuando descarrila hay que ponerlo en la pista otra vez. El ejemplo que pone de autocorrección es la palabra "subir". Si encuentra "Pico Pikes", supone que tiene muchos puntos pa ser una montaña, y si encuentra cerca expresiones como "Subir a XXX" lo corrobora. Pero si se cruza con "subir las escaleras", en su base de datos busca "escaleras", y resulta que ya aprendió la palabra como "parte de un edificio".
La putada fue que cuando aprendió que "cookie" es un producto de panadería, por entonces aun no sabía que "cookie" en contextos de Internet es otra cosa. Le metieron ese dato, borraron todo lo que sabía sobre productos de panadería y lo echaron a correr otra vez.
.... seguro que ya se habrá dado cuenta que es agresivo el copyrigth y las patentes ...
ya mismo hasta los servidores estarán en contra la SGAE
A nadie le han venido a la cabeza los "sentients" de Odyssey 5?
http://en.wikipedia.org/wiki/Synthetics_%28Odyssey_5%29#Sentients
Cuando llegue a 4Chan vamos a flipar.
Y cuando alguien se le ocurra hacer la pregunta mágica: "qué es internet" sólo va a poder decir una frase
Internet is for P0rn
"ha estado leyendo Internet."
¿Y Youtube?
Procesador de red neural con una capacidad de aprendizaje que crece a ritmo de una progresión geométrica.
Terminator 2 dixit.
En serio, en un futuro lejano estas cosas pueden dar miedo.
YO, soy
CONSCIENTE
Lo mismo aprende antes a trollear. The Troll-machine, best known as NELL .
Las pelis de los 80/90 se empiezan a hacer realidad... dentro de nada sacaran el condensador de fluzo
¿No debería haber aprendido 400.000 hechos con una precisión de certeza del 99,99%?
Visto que la Internet está llena de FAKEs, OAKs y demás falsedades promulgadas por :ROLLS, cuando NELL adquiera conciencia igual piensa que donde debaten los políticos es el SÁLVAME DE LUX o el otro el DEC, je je
Dios santo, han creado skynet!!
Tio, de verdad teneis que llevar todos y cada uno de los temas al terreno de las telecos o la SGAE?
El problema será cuando toque desenchufar los teleyectores, que al final algunas IA's se creen muy listas...
El proyecto me parece muy interesante, aunque creo que todos estos proyectos para intentar recrear el procesamiento del lenguaje humano pecan en ignorar la importancia de la información "no verbal", la que nos llega por los sentidos, y que influye en como aprendemos a diferenciar los contextos.
El lenguaje humano tiene un importante componente metafórico. Interrelacionamos emociones, percepciones y conceptos del mundo de un modo que es mucho más fácil de aprender si uno "es humano" y si tiene emociones y percepciones que le permitan hacer asociaciones. Por ejemplo, si decimos que "es un día triste", podemos querer decir que está de lluvia, porque relacionamos el día nublado con su falta de luz con la tristeza, y la lluvia con las lágrimas, por ejemplo. Lo que quiero decir es que, para un humano, aprender estas cosas es intuitivo, porque tenemos una forma de percibir el mundo común.
Pienso que los modelos que intentan emular el lenguaje humano deberían tener más en cuenta estos factores, como el hecho de "ser humano" influye en el lenguaje.
o.o dios! skynet detected! que se preocupen cuando empiece a jugar con los satelites!
ufff ya ha empezado!!!!!!!