Hace 8 años | Por siembravientos a twitter.com
Publicado hace 8 años por siembravientos a twitter.com

AlphaGo de Google DeepMind derrota al campeón de Go Lee Sedol (9º Dan). Video: https://www.youtube.com/watch?v=vFr3K2DORc8

Comentarios

samsaga2

El video de la derrota



Vencer a un humano en el Go es un paso acojonante para la inteligencia artificial. Si comparamos AlphaGo con el Deep Blue, Deep Blue se queda en poco más que una ameba.

IAI

#0 Te me has adelantado. Por cierto, y a cuento del comentario de #1, no es menos cierto que desde DeepBlue los ordenadores se han hecho más potentes, amén de que ha habido más progresos en el campo de la inteligencia artificial.

Pero no olvidemos que, en el fondo, si ha ganado es porque tiene la capacidad de generar muchas combinaciones antes de realizar un movimiento. En este aspecto, es mucho mejor que lo que haría un ser humano, igual que un ordenador es mucho mejor calculando. Pero no es una "característica humana", como puede ser la improvisación https://www.wikiwand.com/en/Monte_Carlo_tree_search

siembravientos

#2 La principal diferencia del go con el ajedrez a nivel de ordenadores, es que en el ajedrez hay muchas situaciones resueltas (basadas sobre todo en partidas ya jugadas), en las que las jugadas ya están decididas y el ganador también. Además el go es infinitamente más complejo, con lo que el árbol resultante también requiere mucha más memoria, aunque a día de hoy no es tan complicado de solventar como antaño.

IAI

#3 Claro, ahí es donde quiero llegar, que la parte física tiene un papel crucial. Lo digo porque veremos titulares apocalípticos insinuando que de aquí a nada la inteligencia artificial superará a Beethoven.

E

Viendo la partida Lee Sedol empezó con mal pie y aun así remonto, a mitad de partida iba ganando... en la segunda mitad de la partida es donde AlphaGo ha jugado mejor haciendo un buen intercambio y ha terminado ganando (aunque el resultado oficial sea por rendición, la partida iba muy justa W+3.5 o mas o menos).

Yo creo que va a terminar 4 - 1 (quizás 3 - 2) a favor de Lee Sedol.

Me encanta como explica Michael Redmond (9p), a quien tengo la suerte de conocer en persona, pero para quien quiera mas análisis hay un breve comentario en:
https://gogameguru.com/alphago-defeats-lee-sedol-game-1/

#1 #2 #3 La diferencia del tamaño del árbol no es la única razón; de hecho la diferencia mas importante es que en ajedrez ambos, un profesional y una maquina pueden evaluar quien va ganando en una posición de tablero no final con mucha precisión (sin tener que mirar los siguientes movimientos), mientras que en Go, solo lo podían hacer los humanos. Es por lo que se tiene que utilizar MCTS, en vez de alpha-beta, por lo que no se puede podar el árbol de búsqueda fácilmente... y es precisamente lo que AlphaGo ha conseguido combinando MCTS y DNN.

#4 Si que han tenido que codificar las reglas del juego, no usa DNN de forma pura, solo las usa como evaluador y como tree policy del algoritmo MCTS.

#4 También hay mas partidas de ajedrez (10^82) que átomos en el universo (10^123).

#5 Ya hay programas que componen música, y es bastante indistinguible de los compositores humanos.

E

#4 Lo siento, al revés (#6):

También hay mas partidas de ajedrez (10^123) que átomos en el universo (10^80), y por muchisimo.

Las partidas de Go (10^360) son una barbaridad, es decir que si cada átomo del universo, fuera un universo, y los átomos de ese fueran a su vez universos que a su vez todos sus átomos fueran universos... la suma de todos los átomos de todos esos universos anidados (4 niveles) aun seria menor que el numero de partidas de Go posibles.

E

#6 Uff... las cosas no pintan tan bien para Lee Sedol ahora, en esta partida AlphaGo si que ha tenido movimientos brillantes, como siga asi, esto puede terminar en un 5-0

samsaga2

#2 AlphaGo es mejor que el Deep Blue no porque sea más potente el ordenador. Deep Blue no hacía más que probar el máximo numero de combinaciones posibles de jugadas y elegir la mejor. AlphaGo usa DNN que es lo que hace que esté a años luz del otro. Ni siquiera han tenido que codificar las reglas del juego, las ha aprendido por su cuenta mirando tan sólo las partidas. Ni que avanzara la computación mil años se podría usar el mismo algoritmo del Deep Blue para el go. Hay que tener en cuenta que hay más combinaciones de jugadas del go que átomos en el universo.

J

Para los que quieran saber en más detalle el funcionamiento de AlphaGo tenéis el siguiente documento publicado en Nature que lo explica:

https://vk.com/doc-44016343_437229031?dl=56ce06e325d42fbc72