Publicado hace 6 años por --309819-- a ajedrezcuellar.blogspot.ie

AlphaZero derrota a StockFish 8 tras tan sólo 4 horas de auto-aprendizaje

ajedrezcuellar.blogspot.ie

AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.

comentarios destacados

#73: La verdad que es una noticia escalofriante, he estado analizando las partidas y todavía tengo la piel de gallina.

Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado que una máquina puede aprender de si misma y mucho mejor sin que un humano le diga como.

Por lo que he leído, se han jugado 100 partidas a 1 minuto por movimiento, contra la que actualmente se considera mejor engine de ajedrez Stockfish 8 (las hay mejores, pero a fin de cuentas son mejoras mínimas del Stockfish) y bueno, el resultado final ha sido 28 victorias de AlfaZero y 62 tablas. Un resultado muy abultado para ser nueva.

Examinando ya las partidas que han publicado (10 partidas muy bonitas), se nota bastante que AlfaZero estaba funcionando en algún tipo de super-ordenador bastante más potente que el usado por Stockfish, pero aun así en las partidas publicadas AlfaZero hace sacrificios posicionales espectaculares, algo increíble para una máquina, ya que cuando ven un camino que gana directamente no pierden el tiempo con subterfugios y sacrificios sólo para mejorar su posición, atacan y punto. Pero esta Alfazero no le importa perder material, es capaz de evaluar que su juego es mejor aunque tenga piezas de menos incluso durante 10 o 20 movimientos (algo imposible de calcular actualmente ni con todos los ordenadores del mundo juntos y que se suele hacer los humanos sólo por intuición ).

--519297--

hace 6 años

#12: #7 Menuda pregunta. Tú eres de los que va al bosque y sólo ve árboles, ¿no? La cuestión no es que juegue al ajedrez, sino que él solo haya conseguido aprender a jugar en cuatro horas y sea el mejor del mundo.

--511338--

hace 6 años

#23: #2 No hace mucho en una noticia similar un meneante explicó lo que significa "aprender" en estos casos. A ver si vuelve a aparecer y lo explica, a mí ya se me olvidó. Pero está claro que no tiene mucho que ver con la capacidad de aprendizaje del ser humano porque si introduces una regla nueva en el juego el software hace kaputt, mientras que un ser humano puede readaptarse.

En general deberíamos empezar a tener cuidado con estas metáforas usadas por los ingenieros, porque IA no tiene mucho que ver con la inteligencia humana, igualmente "aprender" es otra cosa cuando hablamos de software. Hoy mismo leí la comparación de "minería" de Bitcoins con minería en una mina de oro. Lo siento, pero las dos actividades no tienen mucho que ver.

Sinceramente, creo que todas estas metáforas nos está llevando a unos errores tremendos de comprensión. Mi humilde opinión.

--501250--

hace 6 años

#9: #7 Espera a que usando los mismos algoritmos lo usen en bolsa...

--556831--

hace 6 años

#61: #32 El funcionamiento entonces es completamente inverso. Stockfish da una puntuación a un movimiento (con un heurístico), y si es rentable, hace el movimiento, y si no, evalúa otro movimiento. Su heurístico y la exploración del árbol de movimientos son su modo de jugar. Sin embargo, una IA se entrena moviendo primero, y evaluando después si ese movimiento ha sido bueno o malo comprobando el resultado. Aprende con el método de prueba y error. Si el resultado es bueno, refuerza positivamente esa forma de jugar, y si es malo, refuerza negativamente ese movimiento.

squanchy

hace 6 años

#45: #9 ya se usa desde hace bastantes años. Busca "High Frequency Trading".

--319549--

hace 6 años

#58: #57 Cualquier gorro de aluminio se queda corto si piensas en este tema.
Lo mejor es prepararse tranquilamente para el apocalipsis, como ya hacen los runners.

--525496--

hace 6 años

#62: #21 Le han programado la forma de aprender, que no es moco de pavo.

squanchy

hace 6 años

#26: #17 Tuvo que entrenar porque solo le explicaron las reglas. Solo eso. Por lo que la única manera de mejorar era practicar y lo hacía contra si mismo. Eso implica, que conforme iba mejorando, su contrincante también. La proeza es que a diferencia de las otras IA, a esta no le metieron un paquete de jugadas y partidas.

Ya hicieron algo similar con AlphaGo y los resultados fueron increibles. Os dejo este enlace porque no tiene desperdicio.

https://deepmind.com/blog/alphago-zero-learning-scratch/

Haplos

hace 6 años

#3: #1
https://www.youtube.com/watch?v=g-Bt7AXlpqo

ChiquiVigo

hace 6 años

Comentarios

Mejores hilos

#73

Desactivado

hace 6 años

La verdad que es una noticia escalofriante, he estado analizando las partidas y todavía tengo la piel de gallina.

Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado que una máquina puede aprender de si misma y mucho mejor sin que un humano le diga como.

Por lo que he leído, se han jugado 100 partidas a 1 minuto por movimiento, contra la que actualmente se considera mejor engine de ajedrez Stockfish 8 (las hay mejores, pero a fin de cuentas son mejoras mínimas del Stockfish) y bueno, el resultado final ha sido 28 victorias de AlfaZero y 62 tablas. Un resultado muy abultado para ser nueva.

Examinando ya las partidas que han publicado (10 partidas muy bonitas), se nota bastante que AlfaZero estaba funcionando en algún tipo de super-ordenador bastante más potente que el usado por Stockfish, pero aun así en las partidas publicadas AlfaZero hace sacrificios posicionales espectaculares, algo increíble para una máquina, ya que cuando ven un camino que gana directamente no pierden el tiempo con subterfugios y sacrificios sólo para mejorar su posición, atacan y punto. Pero esta Alfazero no le importa perder material, es capaz de evaluar que su juego es mejor aunque tenga piezas de menos incluso durante 10 o 20 movimientos (algo imposible de calcular actualmente ni con todos los ordenadores del mundo juntos y que se suele hacer los humanos sólo por intuición ).

V 18

K 107

#83

Marinmenyo

hace 6 años

#73 Desde la barra del bar digo que eso de sacrificar piezas puede ser muy importante, ya que si lo que hace stockfish es moverse mediante un arbol de decision tipo expectiminimax, y con tiempo limitado, puede dar por buenos movimientos, que sin bajar a mucha profundidad en el arbol dan muchos puntos ( juntando heuristicas ...) pero que un poco mas abajo igual resultan fatales. Pero bueno, supongo que el stockfish este no usara un algoritmo expectiminimax a secas

V 1

K 19

#94

Desactivado

hace 6 años

#83 Creo que no, que Stockfish no usa el arbol de decisiones tipo expectiminimax, sino que habían creado otra variante de minimax llamado alpha-beta. Pero te hablo también desde la ignorancia ya que esto lo he leído en alguna parte y no recuerdo ahora donde.

De todas formas si es importante que una engine de ajedrez aprenda a sacrificar, y más si son sacrificios posicionales como hace esta. Porque era el punto de aquiles de las engines de ajedrez, ya que todas suelen hacer sacrificios tácticos y de sólo ataque en su mayoría.

V 1

K 10

#58

Desactivado

hace 6 años

#57 Cualquier gorro de aluminio se queda corto si piensas en este tema.
Lo mejor es prepararse tranquilamente para el apocalipsis, como ya hacen los runners.

V 4

K 38

#84

Desactivado

hace 6 años

#58 no seran los preppers?

V 0

K 9

#86

Desactivado

hace 6 años

#84 No conocía el término. Guay, soy un prepper
Los runners también pero no lo saben.

V 0

K 7

#124

Desactivado

hace 6 años

#58 Con lycra?

V 0

K 11

#49

colomer

hace 6 años

#37 La bolsa la mueven más las máquinas que los inversores de carne y hueso.

V 5

K 37

Desactivado

hace 6 años

chiquivigo

V 2

K 36

ChiquiVigo

hace 6 años

V 5

K 57

#36

Pichaflauta

hace 6 años

#3 alphazero siempre es blancas?

V 0

K 6

#44

ChiquiVigo

hace 6 años

#36 Creo que jugó 2 con nengras y 8 con blancas. Pero tampoco se mucho de ajedrez jugando módulos, ni el tiempo ni que Elo tenía el otro

V 0

K 10

#46

Desactivado

hace 6 años

#36 No. 50%

V 3

K 33

#146

dphi0pn

hace 6 años

#36 No sería justo

V 0

K 11

Desactivado

hace 6 años

4 horas de entrenamiento consigo mismo

Y yo aquí con días enteros sin conseguir ningún hito.

V 4

K 34

#118

borteixo

hace 6 años

#8 enga ese karma que suba a 9 joer..

V 1

K 1

#88

elcoret

hace 6 años

AlphaZero utiliza MonteCarlo Tree Search, igual que AlphaGo Zero. Lo de las redes neuronales y el auto-aprendizaje imagino que solo lo usan para la fase de seleccion (no he mirado el algoritmo), por lo tanto lo unico que se ha demostrado es que MCTS es mejor que Minimax con poda alpha-beta, incluso en juegos con menor numero de ramificaciones.

V 2

K 28

#14

barruka

hace 6 años

Si tan listo es, que le expliquen cómo funciona el Cáncer y que llegue a la cura

V 4

K 26

#38

Desactivado

hace 6 años

#14 Ya llegará. Las IA están empezando a utilizarse en el diagnóstico y tratamiento del cáncer con muy buenos resultados.
No te puedo dar referencias pero sé que he leído varías noticias al respecto últimamente.

V 2

K 26

#43

jenkin

hace 6 años

#14 http://omicrono.elespanol.com/2017/03/ia-de-google-en-el-diagnostico-de-cancer/

V 2

K 16

#75

Iosephus

hace 6 años

editado

#14 Ya están con ello también y, de hecho, avanza de manera bastante interesante. Entre los que hay ahora mismo creo que destaca Watson, de IBM (con, por ejemplo, http://bigthink.com/stephen-johnson/ibms-watson-supercomputer-found-treatments-for-323-cancer-patients-that-human-experts-overlooked ) y Google (no sé si estará basado en lo mismo que esta noticia, pero ahí va un enlace: http://omicrono.elespanol.com/2017/03/ia-de-google-en-el-diagnostico-de-cancer/ )

Me suena que hay más proyectos, pero nunca me quedo con el nombre, lo siento.

V 1

K 18

#89

crissis

hace 6 años

#14 "que le expliquen cómo funciona el Cáncer"

Creo que ese sería el problema.

PD: negativo por error cuando quería dar a responder

V 2

K 26

#105

vacuonauta

hace 6 años

#89 es el mismo problema que la habitación china

V 0

K 10

#79

Shinu

hace 6 años

#67 Y eso cómo lo sabes? Trabajas en el sector de la IA? Y aunque así fuera no quiere decir que tenga implicaciones importantes en un futuro cercano.

V 2

K 21

#13

asterissco

hace 6 años

4 horas con la capacidad de Google no es poco

V 2

K 21

#114

Radix2

hace 6 años

editado

#5 #13 Rápido son 4 horas, aprender en 4 horas, consumas los recursos que consumas para ello, supone un gran potencial.

Me da igual lo potente que tenga que ser el hardware si en 4 horas aprendes a diagnosticar resonancias mejor que un profesional con años de estudio y experiencia, es aprender muy rápido

V 1

K 19

#24

u_1cualquiera

hace 6 años

editado

Voy a proponer un programa a Tele5
Meter las principales Inteligencias Artificiales en el mismo ordenador y que convivan y se relacionen, sólo puede quedar una
Me voy a forrar 🍹 🍜

V 2

K 19

#10

fisico

hace 6 años

en la tabla pone que cada máquina tuvo 1 minuto de reflexión en cada jugada

V 0

K 19

#93

ajedrezcuellar

hace 6 años

#10 Muy cierto, corregido, ¡gracias!

V 0

K 6

#11

Shinu

hace 6 años

¿Y tú qué utilidad tienes? Ahora en serio, no es el hecho de que haya ganado a uno de los motores de ajedrez más potentes del mundo entrenando 4 horas, sino las posibles aplicaciones que pueda tener esta tecnología para resolver otro tipo de problemas.

V 1

K 18

#41

infestissumam

hace 6 años

#11 O para crearlos

V 0

K 14

#56

Desactivado

hace 6 años

#41 Es compatible, nosotros podemos ser un problema.

V 0

K 7

#51

Shinu

hace 6 años

#11 iba para #7...

V 0

K 10

#67

Frederic_Bourdin

hace 6 años

#11 Que de momento son... cero.

V 0

K 8

#68

squanchy

hace 6 años

#11 Hoy evalúa movimientos de piezas de ajedrez para ganar una partida. Mañana evaluará movimientos de objetos en la calle para que tu coche los evite y no choque con ellos.

V 2

K 22

#20

Pedropan

hace 6 años

Me gustaría ver un día que la IA encuentra curas para el cáncer y estas cosas que nos importan a los humanos, está bien jugar al ajedrez un ratito

V 1

K 16

#28

Desactivado

hace 6 años

#20 eso eso, que haga avances en cosas importantes, como la homeopatía, gestionar los sms de sálvame que aparecen durante la emisión o aniquilar humanos. Jugar al ajederz es cosa de Atari

V 0

K 6

#33

Pedropan

hace 6 años

#28 http://noticias.universia.es/ciencia-tecnologia/noticia/2016/11/22/1146407/inteligencia-artificial-big-data-curar-cancer.html

V 0

K 7

#39

megusta

hace 6 años

El problema de Meneame en 3 enlaces rápidos
https://news.ycombinator.com/item?id=15858197
https://www.reddit.com/r/chess/comments/7hvbaz/mastering_chess_and_shogi_by_selfplay_with_a/
https://www.reddit.com/r/MachineLearning/comments/7hvr19/r_mastering_chess_and_shogi_by_selfplay_with_a/

V 1

K 15

#87

Desactivado

hace 6 años

autor

#81 "Libratus, an AI program developed by a team of researchers at Carnegie Mellon University, took on Dong Kim, Jimmy Chou, Daniel McAulay and Jason Les at no-limit Texas Hold’em in a Pittsburgh casino, eventually taking $1.76 million (£1.4 million) in chips"

V 1

K 13

#156

Raul_Lomi

hace 6 años

#87 cierto, estamos jodidos

V 0

K 6

pichorro

hace 6 años

Es fascinante lo rápido que puede llegar a aprender una inteligencia artificial.

V 0

K 10

Desactivado

hace 6 años

#2
Pues a mí no me parece nada fascinante cuando las condiciones de juego no son las mismas dejando a StockFish sin toda su capacidad.

V 3

K 22

#95

Desactivado

hace 6 años

editado

#4 aunque tuviera solo un cuarto de su capacidad, le ha ganado con solo 4 horas de entrenamiento!!

V 0

K 7

#127

luiggi

hace 6 años

#95 Ahí tienes razón. Pero que gane el 60% y en condiciones de desventaja para el software tradicional, me hace pensar que buscaron el triunfo justito para lanzar el titular.
Lo hubieran entrenado más tiempo o mejorado aún más la IA para obtener un rotundo 100%, que no dudo acabarán logrando.

V 0

K 10

#104

Desactivado

hace 6 años

editado

#4 perdón por el negativo, dedazo

V 0

K 8

imnotrpg

hace 6 años

editado

#2 depende de lo que se entienda por rápido. Para saber si 4 horas es mucho o poco habría que saber cuánto duran las partidas de media. Es CPU vs CPU, el tiempo de "pensamiento" de cada jugada se contará en nanosegundos, y no hay ni dibujado del tablero ni nada, simplemente la matriz del tablero y las posiciones de las piezas. No es nada descabellado decir que cada partida puede durar menos de 1 segundo.

V 1

K 18

Varlak

hace 6 años

#5 em.... y si cada partida dura menos de 1 segundo no te parece rápido?

PD: Probablemente en 1 segundo haya jugado varios miles de partidas

V 0

K 7

#116

Desactivado

hace 6 años

#5 #6 #32 si lo pone en la página

"El resultado del match a 100 partidas (50 con cada color, a un ritmo de 1 minuto finish por jugada) fue de 64 a 36, saliendo AlphaZero totalmente invicto del encuentro." 100 partidas, en 4 horas

V 1

K 13

#32

Desactivado

hace 6 años

#5 El tiempo por movimiento de Stockfish depende del número de jugadas/turnos que calcule. Hace poco ví "algo" de una partida de un campeonato de varias CPU. Por cada jugada se tiraban unos 5 minutos. _{No aguanté mucho.}

V 2

K 21

#61

squanchy

hace 6 años

#32 El funcionamiento entonces es completamente inverso. Stockfish da una puntuación a un movimiento (con un heurístico), y si es rentable, hace el movimiento, y si no, evalúa otro movimiento. Su heurístico y la exploración del árbol de movimientos son su modo de jugar. Sin embargo, una IA se entrena moviendo primero, y evaluando después si ese movimiento ha sido bueno o malo comprobando el resultado. Aprende con el método de prueba y error. Si el resultado es bueno, refuerza positivamente esa forma de jugar, y si es malo, refuerza negativamente ese movimiento.

V 4

K 39

#40

Maldito

hace 6 años

editado

#5 Creo que confundes el tiempo que dura una partida con el tiempo en que la máquina aprendió a jugar al ajedrez con ese nivel de maestría que es a lo que se refiere #2.

V 3

K 29

#21

Desactivado

hace 6 años

#2 Es fascinante tener la capacidad de aprender sin que te hayan programado

V 4

K 28

#62

squanchy

hace 6 años

#21 Le han programado la forma de aprender, que no es moco de pavo.

V 5

K 43

#23

Desactivado

hace 6 años

editado

#2 No hace mucho en una noticia similar un meneante explicó lo que significa "aprender" en estos casos. A ver si vuelve a aparecer y lo explica, a mí ya se me olvidó. Pero está claro que no tiene mucho que ver con la capacidad de aprendizaje del ser humano porque si introduces una regla nueva en el juego el software hace kaputt, mientras que un ser humano puede readaptarse.

En general deberíamos empezar a tener cuidado con estas metáforas usadas por los ingenieros, porque IA no tiene mucho que ver con la inteligencia humana, igualmente "aprender" es otra cosa cuando hablamos de software. Hoy mismo leí la comparación de "minería" de Bitcoins con minería en una mina de oro. Lo siento, pero las dos actividades no tienen mucho que ver.

Sinceramente, creo que todas estas metáforas nos está llevando a unos errores tremendos de comprensión. Mi humilde opinión.

V 12

K 84

#29

Desactivado

hace 6 años

autor

editado

#23
Ahora que lo pienso, pobre Max Deutsch
https://en.chessbase.com/post/beating-magnus-after-a-month-of-training

V 2

K 19

#50

Desactivado

hace 6 años

#23 No sé cuál será esa iluminadora explicación pero aprender es aprender, si no sabe readaptarse puede aprender a hacerlo, en muchos casos los humanos tampoco sabemos readaptarnos.
Si lo que te da miedo son las implicaciones de hablar de las IA como si fuesen mentes... es que son mentes, con los matices que quieras pero mentes, no creo que falte tanto para que adquieran conciencia de sí mismas, si es que no lo están limitando ya para que no ocurra.

V 2

K 27

#57

Desactivado

hace 6 años

#50

V 0

K 9

#59

Narukami

hace 6 años

#50 Conciencia de si mismas en cualquier momento sucedera, conforme siga progresando esta tecnologia y sean las IA cada vez mas complejas y avanzadas. Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo. En el caso de los humanos ya traemos de serie el deseo de sobrevivir y reproducirnos y la inteligencia es un instrumento que ponemos al servicio de ese objetivo; en el caso de la maquina esto no es asi.

V 0

K 7

#77

Desactivado

hace 6 años

#59 Creo que eso son dos claves importantes.
Conste que estoy cuñadeando.

" Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo"
Eso tendrá que ocurrir para dar respuestas mejores que las nuestras a los problemas, tendrá que buscar variables nuevas y su relevancia por propia voluntad con el fin último de resolver el problema, incluso de adelantarse a futuros problemas, no sé si me explico. Y eso posiblemente es el paso previo a la autoconsciencia.

En el tema de los instintos yo me atasco más porque no entiendo bien cómo funcionan las IA. Si se programa para querer aprender más y más... eso ya es como un instinto, una motivación primaria, curiosidad. Y si hay selección "natural", como con ciclos en los que trozos de código mueran y otros nazcan y generen nuevo código... También deberían surgir líneas cuyo único objetivo sea reproducirse, como ocurre en el ADN, entonces acabarían apareciendo instintos nuevos.

V 0

K 7

#82

Narukami

hace 6 años

editado

#77 Esa es la cosa, tienen "curiosidad", esa motivacion, porque alguien les programo para eso. Parece que solo podrian desarrollar objetivos y motivaciones derivados de esas instrucciones primarias recibidas. Claro que es verdad que si en algun momento llegan a asociar su supervivencia en el tiempo (y quiza su reproduccion) con un cumplimiento de los objetivos, podran empezar a hacerlo solas.
La siguiente cuestion seria saber si llegaran a disfrutar de su "vida" igual que los humanos, recibiendo algun tipo de estimulo positivo cuando cumplen sus objetivos (como nosotros al comer, o al tener sexo) o negativo cuando fallan y se alejan de conseguirlos. El ~~instinto~~ codigo las fuerza a actuar...la verdad es que te pones a pensar en las posibilidades y es una ida de olla.

V 0

K 7

#112

polipolito

hace 6 años

#82 en la novela Hyperion existe un ecosistema de IAs, es interesante. Basicamente describe su evolución en un entorno de supervivencia selectiva de "codigos", en plan bacterias. El que ese codigo se asocie a diferentes niveles es cuestión de tiempo, al igual que con los seres vivos. Solo hace falta un entorno...de software y de hardware.

V 0

K 6

#98

Desactivado

hace 6 años

editado

#64 No lo creo. He dicho en este caso, y los errores se dan porque veo a la gente opinando cosas muy locas. No he dicho que no se deban usar metáforas, pero la gente normal no está entiendiendo nada.

Por ej. #50. ¿Conciencia? No tengo miedo de la informática, yo programo a nivel hoby, pero conciencia ninguna, eso todavía está lejisimo. Y si se consigue no parece que vaya a ser como la humana.

V 0

K 7

#121

Desactivado

hace 6 años

#98 Si estamos hablando del desarrollo de las IA la consciencia y autoconsciencia no es una opinión "muy loca" sino un tema inevitable.
¿Lejísimos qué es? ¿Treinta, diez, cinco años? Lo que sí es muy loco es la velocidad a la que avanza esto porque el que controle las IA controlará el mundo.
El tema es cómo se llega a esa autoconsciencia y si nos conviene retrasarla como supongo que ya estarán previniendo.

V 0

K 7

#64

squanchy

hace 6 años

#23 ¿Crees que una metáfora para explicar un concepto informático puede dar lugar a errores tremendos de comprensión? Pues prueba a explicarla sin metáforas, verás qué risa.
La medicina utiliza nombres complicados para explicar conceptos sencillos. La informática utiliza nombres sencillos para conceptos complicados.

V 3

K 26

#103

vacuonauta

hace 6 años

#64 no es una cuestión de nombres sino de conceptos. Si hacemos analogías 1 a 1 facilitamos la comprensión superficial, pero dificultamos la profunda. Y las implicaciones de estos hechos son profundas.

V 0

K 10

#78

empe

hace 6 años

#23 Si le cambias una regla aprende más rápido que tú y que yo.
De hecho aprendió solo, solamente le dijeron las reglas del ajedrez.
Si es capaz de aprender diciéndole sólo las reglas crees que no podría aprender si cambiáramos una sola?

V 2

K 24

#106

vacuonauta

hace 6 años

#78 la cuestión es que tú no reaprendes, sino que cambias sobre la marcha. Entiendo que esta IA tendría que echarse unas partidas para readaptarse.
(claro que mientras el otro mueve, podría echarse varias rapiditas sin que se note e ir mejorando, ¿no?)

V 0

K 10

#155

jgbmur

hace 6 años

#78 #106, eso sería simplemente un nuevo juego que incluye un cambio de reglas al principio, por ejemplo que tengan tres torres en lugar de dos, y muchos otros cambios; sería un juego un poco más genérico que el ajedrez pero sigue siendo un único juego.

V 0

K 6

#80

Desactivado

hace 6 años

#23 llevas razón un robot es inteligente solo en un entorno prederterminado y conocido. Una regla nueva en ajedrez significaria cambiar el entorno. Lo que hace en 4 horas imagino es simular partidas contra el mismo para evaluar situaciones de juego real y ver que movimientos son mejores para ganar. Luego repetira esos movimientos en dichas situaciones.

V 2

K 23

#85

AlfalfaZero

hace 6 años

#23 Imagino que te refieres a esto que explican aqui utilizando como ejemplo pequeñas variaciones en la posicion de distintos elementos en los tipicos juegos de Atari:

V 3

K 29

#101

Desactivado

hace 6 años

#85 Eso es el cómo aprende un software y un humano. Interesante, pero hay diferencias en el ¿qué es aprender entre un software y un humano?

Gracias por el vídeo.

V 0

K 7

#139

Desactivado

hace 6 años

#85 ese deep learning no eran redes neuronales, y si lo eran eran redes neuronales muy simples.

V 0

K 7

#100

abuelillo

hace 6 años

#23 Claro, coges un programa que juega al go, le enseñas las reglas de otro juego y practicando consigo mismo solo 4 horas ya juega como los mejores jugadores del mundo, y a eso lo llamas "no saber adaptarse", no se que tendran que hacer las computadorsas para convencerte quizás ser dios.

V 0

K 6

#102

vacuonauta

hace 6 años

#23 todas estas metáforas nos está llevando a unos errores tremendos de comprensión
totalmente de acuerto

V 1

K 17

#107

santiso

hace 6 años

#23 Hay muchas maneras de entrenar sistemas de este tipo. Sin embargo, una cosa a tener en cuenta: que una máquina sea capaz de ganar a otra no implica que sea mejor al jugar contra humanos. También puede significar que ha encontrado sistemas que un humano no usaría por ser contra intuitivos, y no ha sabido qué hacer. E igualmente, si hace eso a un humano podría cambiar drásticamente su juego y conseguir ganarle.

V 1

K 13

#108

santiso

hace 6 años

#23 Lo de que hace kaputt con una nueva regla no es del todo cierto. Hay que volverlo a entrenar, si, pero usar el entreno previo como punto de partida ayuda mucho al sistema a terminar antes.

V 1

K 13

#138

Desactivado

hace 6 años

#23 no creo que sea un caput total (a no ser que la nueva regla convierta el juego en algo totalmente nuevo)

Por ejemplo, si la nueva regla es un cambio de la disposición inicial de las piezas, a alphazero se la sopla, mientras que a un jugador humano le machacas todo lo que ha estudiado sobre aperturas.

V 1

K 14

#48

Pilfer

hace 6 años

#2 el ajedrez es un juego limitado con unas variables definidas y limitadas. Las ia de momento no pueden con juegos no tan definidos, por ejemplo, starcraft:

Aún queda esperanza: el hombre derrota a la máquina jugando al StarCraft

Publicado hace 6 años por --546793-- a technologyreview.es

Aún queda esperanza: el hombre derrota a la máquin...

technologyreview.es

V 2

K 12

#65

Desactivado

hace 6 años

autor

#48 El poker parece ser que ya cayó
http://www.independent.co.uk/life-style/gadgets-and-tech/news/ai-poker-win-tournament-software-beats-pro-players-victory-a7555791.html

V 1

K 20

#81

Raul_Lomi

hace 6 años

#65 contra un solo jugador, el jugador es pro del Texas no limit, pero creo recordar que el duelo máquina VS pro fue en variante limit

V 0

K 6

#120

Pilfer

hace 6 años

#65 El poker sigue teniendo un número limitado de "movimientos" o posibles combinaciones, y en texas menos todavía ya que acaba viendo más carrtas.

V 0

K 6

#74

exeware

hace 6 años

#48 Yo no estoy de acuerdo con que sea limitado, el árbol de juego tiene un tamaño bestial que los hay mas grandes si pero el ajedrez enorme....

V 0

K 6

#119

Pilfer

hace 6 años

#74 pero es limitado, y eso es lo que posibilita a una ia a poder ver todos los movimientos y elegir el mejor resultado. En el caso de acciones intuitivas, no es lo mismo. Leete el enlace que he puesto.

V 0

K 6

#18

Desactivado

hace 6 años

editado

Interesante pero habría que indagar más en el tema técnico.

Me parece que comparan algo así como churras con merinas, por comentar un detalle que salta a la vista sin leer el paper completo:
- Potencia de cálculo. Según he leído se le dió 1 minuto por movimiento. StockFish solo utiliza un hilo/núcleo y Deepmind utilizó otro hardware que llaman TPU ( Tensor Flow Unit ) que básicamente es un ASIC específico para IA, por lo que sin poder comparar potencia de computación ya es comparar cosas diferentes.

- En el paper habla de que AlphaZero "descubrió" las aperturas más jugadas por los humanos en la última década... No sé, es un paper corto, raro y que huele mal.

V 3

K 10

#25

Desactivado

hace 6 años

#18 Quería poner 4 TPUs pero no me deja editarlo ya.
https://en.wikipedia.org/wiki/Tensor_processing_unit

V 0

K 6

#30

Desactivado

hace 6 años

#18 Pues si, Google no ha hecho un combate justo. Aunque lo importante realmente ha sido la capacidad de aprendizaje.

V 1

K 13

#34

pichorro

hace 6 años

#18 Lo de las aperturas también me ha dejado algo descolocado a mí. A ver si publican algo más claro.

V 1

K 17

#97

devil-bao

hace 6 años

Onanismo artificial

V 0

K 9

#90

Dovlado

hace 6 años

Al margen de que no hayan puesto al módulo stockfish en las mejores condiciones, la proeza es sobrecogedora. Cualquier aficionado (o Maestro) de ajedrez lo entenderá como yo

V 0

K 9

#92

Desactivado

hace 6 años

#90
Cualquier experto informático, como ya han escrito por arriba, te dirá que está sesgado. Es probable que AlphaZero siga siendo vencedor pero sin dar tanta ventaja al algoritmo de Stockfish que igualmente puede ser implementado en hardware.

V 0

K 9

#42

pelillos_a_la_mar

hace 6 años

Aprovechad, ingenieros de google, antes de que aprenda a masturbarse!

V 0

K 8

#71

sieteymedio

hace 6 años

Afortunadamente no nos vamos ni a enterar de cuando nos aniquilen las máquinas.

V 0

K 7

#63

Desactivado

hace 6 años

editado

#60 Sí, pero imagina un laboratorio con una gran maquinaria en la que un algoritmo pueda probar (sino millones) miles de combinaciones para tratar ese virus en diferentes condiciones y analizar los resultados.

V 0

K 7

#72

Jesucristo_cazavampiros

hace 6 años

editado

#63 eso se esta haciendo (en robotica seguro, y en diferentes aspectos de medicina tambien) y los resultados son realmente pobres. El problema es que la gente no se da cuenta de la cantidad de datos necesarios para entrenar estos algoritmos. Uno de los principales aspectos en los que los humanos son mejores que el machine learning es en la eficiencia por muestra, es decir, los humanos necesitan muchos menos datos para aprender una tarea. Adenas, los humanos son mucho mejores transfiriendo experiencia de una tarea a otra.

V 3

K 29

#76

Desactivado

hace 6 años

#72 Bien, si yo no digo que sea posible ya mismo. Pero el futuro luce muy prometedor.

V 0

K 7

#131

Iluminacion

hace 6 años

#76 Es posible ya mismo bueno desde hace años no solo en robots tambien en protesis. Mirate un video de ted de una bailarina con una protesis de una pierna o los inquietantes robots de boston dynamics.

V 0

K 6

#130

Iluminacion

hace 6 años

#72 Falso, los resultados son tremendamente positivos. Hay tienes un robot que anda por cualquier entorno. Otro con forma humanoide que puede hacer volteretas en cualquier espaciol. Parece que me hables de los años 80 y robots donde su inteligencia era unicamente un script basado en la progrmacion de los servos.

V 0

K 6

#129

Iluminacion

hace 6 años

#63 no hace falta tanta parafernalia. La secuencia de adn es la limitacion o reglas del juego y la ia seria tremendamente efectiva en desentrañar un vector para atacar a ese supuesto virus.

V 0

K 6

#91

blackv

hace 6 años

Hola doctor Falken...

V 0

K 6

Desactivado

hace 6 años

No digo que no tenga mérito, pero ¿qué utilidad tiene un programa que juega al ajedrez?

V 4

K 6

Desactivado

hace 6 años

#7 Espera a que usando los mismos algoritmos lo usen en bolsa...

V 16

K 117

#37

Spirito

hace 6 años

#9 La bolsa se la devoraría en un mes, incluídas las criptomonedas.

De hecho, la bolsa está diseñada para los humanos, con sus incertidumbres y sus miedos, no para una IA con unos algoritmos supersofisticados.

V 1

K 16

#66

squanchy

hace 6 años

editado

#37 Busca en google "trading de alta frecuencia", verás qué sorpresa te vas a llevar.

V 0

K 9

#70

Pandacolorido

hace 6 años

#37 No tienes ni idea de lo que hablas. #45 si.

V 0

K 7

#45

Desactivado

hace 6 años

#9 ya se usa desde hace bastantes años. Busca "High Frequency Trading".

V 9

K 75

#55

Desactivado

hace 6 años

editado

#45 Pero no con IA tan avanzadas. Este es uno de los motivos por los que estas investigaciones estarán recibiendo financiación como si no hubiera un mañana_{(¿Nunca mejor dicho?)}

V 0

K 7

#12

Desactivado

hace 6 años

editado

#7 Menuda pregunta. Tú eres de los que va al bosque y sólo ve árboles, ¿no? La cuestión no es que juegue al ajedrez, sino que él solo haya conseguido aprender a jugar en cuatro horas y sea el mejor del mundo.

V 17

K 108

#99

Desactivado

hace 6 años

#12 Mmm no lo había visto así, tienes razón

V 1

K 17

#15

thingoldedoriath

hace 6 años

#7 La de hacer más pequeños a lo humanos que se sienten medio dioses por ganar a otros humanos al ajedrez?? Y... todo lo que eso conlleva para los humanos a los que les gusta el ajedrez...

V 0

K 10

#16

Desactivado

hace 6 años

#7 Pues que si quieres mejorar en este juego no necesitas andar buscando gente para jugar con ellos. Te pones a jugar al juego cada vez que tu quieras.

V 0

K 7

#53

Varlak

hace 6 años

#16

V 0

K 7

#19

NeoFlash

hace 6 años

#7 Para los jugadores profesionales de ajedrez lo va a ser

V 0

K 6

#27

juancsmix

hace 6 años

#7 que aprendio a jugar solito.

V 0

K 6

#31

dac

hace 6 años

#7 ya lo verás ya...

V 1

K 15

#47

Desactivado

hace 6 años

#7 Imagina que puedes programarlo para aprender a combatir virus.

Un algoritmo que prueba millones de combinaciones para eliminar virus. ¿No te parece una posiblidad fascinante?

V 1

K 10

#60

Jesucristo_cazavampiros

hace 6 años

#47 el problema es que los virus son un problema real. Por lo tanto la cantidad de combinaciones que puedes probar por segundo estan limitadas por la realidad. En estos juegos se tiene un modelo perfecto de las dinamicas del entorno, por lo tanto es muy facil simular millones de partidas y aprender de ellas. Pero a la que te enfrentas a un problema real (por ejemplo enseñar a un robot a andar), no tienes un modelo perfecto del entorno. Asi que, o lo entrenas en un simulador fisico que es solo una aproximacion de la realidad, para ver que luego cuando lo pruebas en condiciones reales falla, o lo entrenas directamente en un entorno real, para lo cual necesitarias millones de años para llegar al nivel de experiencia acumulafo por alphaZero. Es verdad que lo que esta haciendo deepMind es impresionante, pero se dedican a seleccionar problemas muy mediaticos pero mucho mas faciles de solucionar que problemas reales.

V 0

K 6

#128

Iluminacion

hace 6 años

#60 y los robots de boston dynamic son magia no?

V 0

K 6

#117

borteixo

hace 6 años

#47 eso no implicaría tener el virus simulado en software? Desde mi ignorancia se me antoja más complicado que eliminarlo.

V 0

K 10

#52

Varlak

hace 6 años

#7 reformulo la pregunta "Qué utilidad tiene un programa que, partiendo de unas premisas básicas, es capaz de optimizar el proceso a un nivel surrealista en un tiempo ridículo"?

El tema no es ajedrez, el tema es que la humanidad lleva un milenio "optimizando" un juego complejo, y esa IA en 4 horas ha llegado a un nivel parecido que la humanidad en un milenio. La clave aquí es extrapolar esa capacidad de aprender.

V 1

K 10

#54

Desactivado

hace 6 años

#7, lo importante n les que juegue al ajedrez, lo importante es lo que consigue este tipo de inteligencia se podría llegar a hacer.

V 0

K 19

#17

POLE288

hace 6 años

editado

Puestos a ser exigentes, no entiendo por qué tuvo entrenar, salvo que en ese tiempo le haya generado todas las jugadas posibles, que ya no serían 4 horas "nuestras", si no vidas

V 0

K 6

#26

Haplos

hace 6 años

#17 Tuvo que entrenar porque solo le explicaron las reglas. Solo eso. Por lo que la única manera de mejorar era practicar y lo hacía contra si mismo. Eso implica, que conforme iba mejorando, su contrincante también. La proeza es que a diferencia de las otras IA, a esta no le metieron un paquete de jugadas y partidas.

Ya hicieron algo similar con AlphaGo y los resultados fueron increibles. Os dejo este enlace porque no tiene desperdicio.

https://deepmind.com/blog/alphago-zero-learning-scratch/

V 7

K 40

#22

rafeame

hace 6 años

editado

Ni siquiera un adolescente es capaz de autoentrenarse tanto tiempo seguido. Ni para aprender.

V 0

K 6

#35

Ferran

hace 6 años

#22 Yo de adolescente autoentrenaba para hacer el amor más horas seguidas...

V 2

K 28

#69

squanchy

hace 6 años

#35 Querrás decir minutos.

V 1

K 16

#96

Ferran

hace 6 años

#69 Que va, le daba a la manivela durante horas

V 0

K 11

1 2

AlphaZero derrota a StockFish 8 tras tan sólo 4 horas de auto-aprendizaje

AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.

Etiquetas

comentarios destacados

Comentarios

Aún queda esperanza: el hombre derrota a la máquin...