Publicado hace 6 años por --309819-- a ajedrezcuellar.blogspot.ie

AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.

pichorro

Es fascinante lo rápido que puede llegar a aprender una inteligencia artificial.

D

#2
Pues a mí no me parece nada fascinante cuando las condiciones de juego no son las mismas dejando a StockFish sin toda su capacidad.

i

#2 depende de lo que se entienda por rápido. Para saber si 4 horas es mucho o poco habría que saber cuánto duran las partidas de media. Es CPU vs CPU, el tiempo de "pensamiento" de cada jugada se contará en nanosegundos, y no hay ni dibujado del tablero ni nada, simplemente la matriz del tablero y las posiciones de las piezas. No es nada descabellado decir que cada partida puede durar menos de 1 segundo.

Varlak

#5 em.... y si cada partida dura menos de 1 segundo no te parece rápido?

PD: Probablemente en 1 segundo haya jugado varios miles de partidas

D

No digo que no tenga mérito, pero ¿qué utilidad tiene un programa que juega al ajedrez?

D

4 horas de entrenamiento consigo mismo

Y yo aquí con días enteros sin conseguir ningún hito.

fisico

en la tabla pone que cada máquina tuvo 1 minuto de reflexión en cada jugada

Shinu

¿Y tú qué utilidad tienes? Ahora en serio, no es el hecho de que haya ganado a uno de los motores de ajedrez más potentes del mundo entrenando 4 horas, sino las posibles aplicaciones que pueda tener esta tecnología para resolver otro tipo de problemas.

a

4 horas con la capacidad de Google no es poco

b

Si tan listo es, que le expliquen cómo funciona el Cáncer y que llegue a la cura

thingoldedoriath

#7 La de hacer más pequeños a lo humanos que se sienten medio dioses por ganar a otros humanos al ajedrez?? Y... todo lo que eso conlleva para los humanos a los que les gusta el ajedrez...

D

#7 Pues que si quieres mejorar en este juego no necesitas andar buscando gente para jugar con ellos. Te pones a jugar al juego cada vez que tu quieras.

POLE288

Puestos a ser exigentes, no entiendo por qué tuvo entrenar, salvo que en ese tiempo le haya generado todas las jugadas posibles, que ya no serían 4 horas "nuestras", si no vidas lol

D

Interesante pero habría que indagar más en el tema técnico.

Me parece que comparan algo así como churras con merinas, por comentar un detalle que salta a la vista sin leer el paper completo:
- Potencia de cálculo. Según he leído se le dió 1 minuto por movimiento. StockFish solo utiliza un hilo/núcleo y Deepmind utilizó otro hardware que llaman TPU ( Tensor Flow Unit ) que básicamente es un ASIC específico para IA, por lo que sin poder comparar potencia de computación ya es comparar cosas diferentes.

- En el paper habla de que AlphaZero "descubrió" las aperturas más jugadas por los humanos en la última década... No sé, es un paper corto, raro y que huele mal.

NeoFlash

#7 Para los jugadores profesionales de ajedrez lo va a ser

P

Me gustaría ver un día que la IA encuentra curas para el cáncer y estas cosas que nos importan a los humanos, está bien jugar al ajedrez un ratito

D

#2 Es fascinante tener la capacidad de aprender sin que te hayan programado

r

Ni siquiera un adolescente es capaz de autoentrenarse tanto tiempo seguido. Ni para aprender.

u_1cualquiera

Voy a proponer un programa a Tele5
Meter las principales Inteligencias Artificiales en el mismo ordenador y que convivan y se relacionen, sólo puede quedar una
Me voy a forrar 🍹 🍜

D

#18 Quería poner 4 TPUs pero no me deja editarlo ya.
https://en.wikipedia.org/wiki/Tensor_processing_unit

j

#7 que aprendio a jugar solito.

D

#20 eso eso, que haga avances en cosas importantes, como la homeopatía, gestionar los sms de sálvame que aparecen durante la emisión o aniquilar humanos. Jugar al ajederz es cosa de Atari

D
D

#18 Pues si, Google no ha hecho un combate justo. Aunque lo importante realmente ha sido la capacidad de aprendizaje.

d

#7 ya lo verás ya...

D

#5 El tiempo por movimiento de Stockfish depende del número de jugadas/turnos que calcule. Hace poco ví "algo" de una partida de un campeonato de varias CPU. Por cada jugada se tiraban unos 5 minutos. No aguanté mucho.

pichorro

#18 Lo de las aperturas también me ha dejado algo descolocado a mí. A ver si publican algo más claro.

Ferran

#22 Yo de adolescente autoentrenaba para hacer el amor más horas seguidas...

Pichaflauta

#3 alphazero siempre es blancas?

Spirito

#9 La bolsa se la devoraría en un mes, incluídas las criptomonedas.

De hecho, la bolsa está diseñada para los humanos, con sus incertidumbres y sus miedos, no para una IA con unos algoritmos supersofisticados.

D

#14 Ya llegará. Las IA están empezando a utilizarse en el diagnóstico y tratamiento del cáncer con muy buenos resultados.
No te puedo dar referencias pero sé que he leído varías noticias al respecto últimamente.

M

#5 Creo que confundes el tiempo que dura una partida con el tiempo en que la máquina aprendió a jugar al ajedrez con ese nivel de maestría que es a lo que se refiere #2.

infestissumam

#11 O para crearlos

Aprovechad, ingenieros de google, antes de que aprenda a masturbarse!

ChiquiVigo

#36 Creo que jugó 2 con nengras y 8 con blancas. Pero tampoco se mucho de ajedrez jugando módulos, ni el tiempo ni que Elo tenía el otro

D

#36 No. 50%

D

#7 Imagina que puedes programarlo para aprender a combatir virus.

Un algoritmo que prueba millones de combinaciones para eliminar virus. ¿No te parece una posiblidad fascinante?

Pilfer

#2 el ajedrez es un juego limitado con unas variables definidas y limitadas. Las ia de momento no pueden con juegos no tan definidos, por ejemplo, starcraft:

Aún queda esperanza: el hombre derrota a la máquina jugando al StarCraft

Hace 6 años | Por --546793-- a technologyreview.es

c

#37 La bolsa la mueven más las máquinas que los inversores de carne y hueso.

D

#23 No sé cuál será esa iluminadora explicación pero aprender es aprender, si no sabe readaptarse puede aprender a hacerlo, en muchos casos los humanos tampoco sabemos readaptarnos.
Si lo que te da miedo son las implicaciones de hablar de las IA como si fuesen mentes... es que son mentes, con los matices que quieras pero mentes, no creo que falte tanto para que adquieran conciencia de sí mismas, si es que no lo están limitando ya para que no ocurra.

Shinu

#11 iba para #7...

Varlak

#7 reformulo la pregunta "Qué utilidad tiene un programa que, partiendo de unas premisas básicas, es capaz de optimizar el proceso a un nivel surrealista en un tiempo ridículo"?

El tema no es ajedrez, el tema es que la humanidad lleva un milenio "optimizando" un juego complejo, y esa IA en 4 horas ha llegado a un nivel parecido que la humanidad en un milenio. La clave aquí es extrapolar esa capacidad de aprender.

Varlak

#16

D

#7, lo importante n les que juegue al ajedrez, lo importante es lo que consigue este tipo de inteligencia se podría llegar a hacer.

D

#45 Pero no con IA tan avanzadas. Este es uno de los motivos por los que estas investigaciones estarán recibiendo financiación como si no hubiera un mañana (¿Nunca mejor dicho?)

D

#41 Es compatible, nosotros podemos ser un problema.

D

#50 tinfoil

Narukami

#50 Conciencia de si mismas en cualquier momento sucedera, conforme siga progresando esta tecnologia y sean las IA cada vez mas complejas y avanzadas. Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo. En el caso de los humanos ya traemos de serie el deseo de sobrevivir y reproducirnos y la inteligencia es un instrumento que ponemos al servicio de ese objetivo; en el caso de la maquina esto no es asi.

#47 el problema es que los virus son un problema real. Por lo tanto la cantidad de combinaciones que puedes probar por segundo estan limitadas por la realidad. En estos juegos se tiene un modelo perfecto de las dinamicas del entorno, por lo tanto es muy facil simular millones de partidas y aprender de ellas. Pero a la que te enfrentas a un problema real (por ejemplo enseñar a un robot a andar), no tienes un modelo perfecto del entorno. Asi que, o lo entrenas en un simulador fisico que es solo una aproximacion de la realidad, para ver que luego cuando lo pruebas en condiciones reales falla, o lo entrenas directamente en un entorno real, para lo cual necesitarias millones de años para llegar al nivel de experiencia acumulafo por alphaZero. Es verdad que lo que esta haciendo deepMind es impresionante, pero se dedican a seleccionar problemas muy mediaticos pero mucho mas faciles de solucionar que problemas reales.

D

#60 Sí, pero imagina un laboratorio con una gran maquinaria en la que un algoritmo pueda probar (sino millones) miles de combinaciones para tratar ese virus en diferentes condiciones y analizar los resultados.

squanchy

#23 ¿Crees que una metáfora para explicar un concepto informático puede dar lugar a errores tremendos de comprensión? Pues prueba a explicarla sin metáforas, verás qué risa. lol
La medicina utiliza nombres complicados para explicar conceptos sencillos. La informática utiliza nombres sencillos para conceptos complicados.

squanchy

#37 Busca en google "trading de alta frecuencia", verás qué sorpresa te vas a llevar.

Frederic_Bourdin

#11 Que de momento son... cero.

squanchy

#11 Hoy evalúa movimientos de piezas de ajedrez para ganar una partida. Mañana evaluará movimientos de objetos en la calle para que tu coche los evite y no choque con ellos.

squanchy

#35 Querrás decir minutos. lol

Pandacolorido

#37 No tienes ni idea de lo que hablas. #45 si.

sieteymedio

Afortunadamente no nos vamos ni a enterar de cuando nos aniquilen las máquinas.

J

#63 eso se esta haciendo (en robotica seguro, y en diferentes aspectos de medicina tambien) y los resultados son realmente pobres. El problema es que la gente no se da cuenta de la cantidad de datos necesarios para entrenar estos algoritmos. Uno de los principales aspectos en los que los humanos son mejores que el machine learning es en la eficiencia por muestra, es decir, los humanos necesitan muchos menos datos para aprender una tarea. Adenas, los humanos son mucho mejores transfiriendo experiencia de una tarea a otra.

e

#48 Yo no estoy de acuerdo con que sea limitado, el árbol de juego tiene un tamaño bestial que los hay mas grandes si pero el ajedrez enorme....

Iosephus

#14 Ya están con ello también y, de hecho, avanza de manera bastante interesante. Entre los que hay ahora mismo creo que destaca Watson, de IBM (con, por ejemplo, http://bigthink.com/stephen-johnson/ibms-watson-supercomputer-found-treatments-for-323-cancer-patients-that-human-experts-overlooked ) y Google (no sé si estará basado en lo mismo que esta noticia, pero ahí va un enlace: http://omicrono.elespanol.com/2017/03/ia-de-google-en-el-diagnostico-de-cancer/ )

Me suena que hay más proyectos, pero nunca me quedo con el nombre, lo siento.

D

#72 Bien, si yo no digo que sea posible ya mismo. Pero el futuro luce muy prometedor.

D

#59 Creo que eso son dos claves importantes.
Conste que estoy cuñadeando.

" Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo"
Eso tendrá que ocurrir para dar respuestas mejores que las nuestras a los problemas, tendrá que buscar variables nuevas y su relevancia por propia voluntad con el fin último de resolver el problema, incluso de adelantarse a futuros problemas, no sé si me explico. Y eso posiblemente es el paso previo a la autoconsciencia.

En el tema de los instintos yo me atasco más porque no entiendo bien cómo funcionan las IA. Si se programa para querer aprender más y más... eso ya es como un instinto, una motivación primaria, curiosidad. Y si hay selección "natural", como con ciclos en los que trozos de código mueran y otros nazcan y generen nuevo código... También deberían surgir líneas cuyo único objetivo sea reproducirse, como ocurre en el ADN, entonces acabarían apareciendo instintos nuevos.

empe

#23 Si le cambias una regla aprende más rápido que tú y que yo.
De hecho aprendió solo, solamente le dijeron las reglas del ajedrez.
Si es capaz de aprender diciéndole sólo las reglas crees que no podría aprender si cambiáramos una sola?

Shinu

#67 Y eso cómo lo sabes? Trabajas en el sector de la IA? Y aunque así fuera no quiere decir que tenga implicaciones importantes en un futuro cercano.

D

#23 llevas razón un robot es inteligente solo en un entorno prederterminado y conocido. Una regla nueva en ajedrez significaria cambiar el entorno. Lo que hace en 4 horas imagino es simular partidas contra el mismo para evaluar situaciones de juego real y ver que movimientos son mejores para ganar. Luego repetira esos movimientos en dichas situaciones.

Raul_Lomi

#65 contra un solo jugador, el jugador es pro del Texas no limit, pero creo recordar que el duelo máquina VS pro fue en variante limit

Narukami

#77 Esa es la cosa, tienen "curiosidad", esa motivacion, porque alguien les programo para eso. Parece que solo podrian desarrollar objetivos y motivaciones derivados de esas instrucciones primarias recibidas. Claro que es verdad que si en algun momento llegan a asociar su supervivencia en el tiempo (y quiza su reproduccion) con un cumplimiento de los objetivos, podran empezar a hacerlo solas.
La siguiente cuestion seria saber si llegaran a disfrutar de su "vida" igual que los humanos, recibiendo algun tipo de estimulo positivo cuando cumplen sus objetivos (como nosotros al comer, o al tener sexo) o negativo cuando fallan y se alejan de conseguirlos. El instinto codigo las fuerza a actuar...la verdad es que te pones a pensar en las posibilidades y es una ida de olla.

Marinmenyo

#73 Desde la barra del bar digo que eso de sacrificar piezas puede ser muy importante, ya que si lo que hace stockfish es moverse mediante un arbol de decision tipo expectiminimax, y con tiempo limitado, puede dar por buenos movimientos, que sin bajar a mucha profundidad en el arbol dan muchos puntos ( juntando heuristicas ...) pero que un poco mas abajo igual resultan fatales. Pero bueno, supongo que el stockfish este no usara un algoritmo expectiminimax a secas

D

#58 no seran los preppers?

A

#23 Imagino que te refieres a esto que explican aqui utilizando como ejemplo pequeñas variaciones en la posicion de distintos elementos en los tipicos juegos de Atari:

D

#84 No conocía el término. Guay, soy un prepper
Los runners también pero no lo saben.

D

#81 "Libratus, an AI program developed by a team of researchers at Carnegie Mellon University, took on Dong Kim, Jimmy Chou, Daniel McAulay and Jason Les at no-limit Texas Hold’em in a Pittsburgh casino, eventually taking $1.76 million (£1.4 million) in chips"

elcoret

AlphaZero utiliza MonteCarlo Tree Search, igual que AlphaGo Zero. Lo de las redes neuronales y el auto-aprendizaje imagino que solo lo usan para la fase de seleccion (no he mirado el algoritmo), por lo tanto lo unico que se ha demostrado es que MCTS es mejor que Minimax con poda alpha-beta, incluso en juegos con menor numero de ramificaciones.

c

#14 "que le expliquen cómo funciona el Cáncer"

Creo que ese sería el problema.

PD: negativo por error cuando quería dar a responder

Dovlado

Al margen de que no hayan puesto al módulo stockfish en las mejores condiciones, la proeza es sobrecogedora. Cualquier aficionado (o Maestro) de ajedrez lo entenderá como yo

blackv

Hola doctor Falken...

D

#90
Cualquier experto informático, como ya han escrito por arriba, te dirá que está sesgado. Es probable que AlphaZero siga siendo vencedor pero sin dar tanta ventaja al algoritmo de Stockfish que igualmente puede ser implementado en hardware.

ajedrezcuellar

#10 Muy cierto, corregido, ¡gracias!

D

#83 Creo que no, que Stockfish no usa el arbol de decisiones tipo expectiminimax, sino que habían creado otra variante de minimax llamado alpha-beta. Pero te hablo también desde la ignorancia ya que esto lo he leído en alguna parte y no recuerdo ahora donde.

De todas formas si es importante que una engine de ajedrez aprenda a sacrificar, y más si son sacrificios posicionales como hace esta. Porque era el punto de aquiles de las engines de ajedrez, ya que todas suelen hacer sacrificios tácticos y de sólo ataque en su mayoría.

D

#4 aunque tuviera solo un cuarto de su capacidad, le ha ganado con solo 4 horas de entrenamiento!!

Ferran

#69 Que va, le daba a la manivela durante horas

devil-bao

Onanismo artificial

D

#64 No lo creo. He dicho en este caso, y los errores se dan porque veo a la gente opinando cosas muy locas. No he dicho que no se deban usar metáforas, pero la gente normal no está entiendiendo nada.

Por ej. #50. ¿Conciencia? No tengo miedo de la informática, yo programo a nivel hoby, pero conciencia ninguna, eso todavía está lejisimo. Y si se consigue no parece que vaya a ser como la humana.

D

#12 Mmm no lo había visto así, tienes razón

a

#23 Claro, coges un programa que juega al go, le enseñas las reglas de otro juego y practicando consigo mismo solo 4 horas ya juega como los mejores jugadores del mundo, y a eso lo llamas "no saber adaptarse", no se que tendran que hacer las computadorsas para convencerte quizás ser dios.

1 2