Publicado hace 6 años por --309819-- a ajedrezcuellar.blogspot.ie

AlphaZero derrota a StockFish 8 tras tan sólo 4 horas de auto-aprendizaje

ajedrezcuellar.blogspot.ie

AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.

comentarios destacados

#73: La verdad que es una noticia escalofriante, he estado analizando las partidas y todavía tengo la piel de gallina.

Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado que una máquina puede aprender de si misma y mucho mejor sin que un humano le diga como.

Por lo que he leído, se han jugado 100 partidas a 1 minuto por movimiento, contra la que actualmente se considera mejor engine de ajedrez Stockfish 8 (las hay mejores, pero a fin de cuentas son mejoras mínimas del Stockfish) y bueno, el resultado final ha sido 28 victorias de AlfaZero y 62 tablas. Un resultado muy abultado para ser nueva.

Examinando ya las partidas que han publicado (10 partidas muy bonitas), se nota bastante que AlfaZero estaba funcionando en algún tipo de super-ordenador bastante más potente que el usado por Stockfish, pero aun así en las partidas publicadas AlfaZero hace sacrificios posicionales espectaculares, algo increíble para una máquina, ya que cuando ven un camino que gana directamente no pierden el tiempo con subterfugios y sacrificios sólo para mejorar su posición, atacan y punto. Pero esta Alfazero no le importa perder material, es capaz de evaluar que su juego es mejor aunque tenga piezas de menos incluso durante 10 o 20 movimientos (algo imposible de calcular actualmente ni con todos los ordenadores del mundo juntos y que se suele hacer los humanos sólo por intuición ).

--519297--

hace 6 años

#12: #7 Menuda pregunta. Tú eres de los que va al bosque y sólo ve árboles, ¿no? La cuestión no es que juegue al ajedrez, sino que él solo haya conseguido aprender a jugar en cuatro horas y sea el mejor del mundo.

--511338--

hace 6 años

#23: #2 No hace mucho en una noticia similar un meneante explicó lo que significa "aprender" en estos casos. A ver si vuelve a aparecer y lo explica, a mí ya se me olvidó. Pero está claro que no tiene mucho que ver con la capacidad de aprendizaje del ser humano porque si introduces una regla nueva en el juego el software hace kaputt, mientras que un ser humano puede readaptarse.

En general deberíamos empezar a tener cuidado con estas metáforas usadas por los ingenieros, porque IA no tiene mucho que ver con la inteligencia humana, igualmente "aprender" es otra cosa cuando hablamos de software. Hoy mismo leí la comparación de "minería" de Bitcoins con minería en una mina de oro. Lo siento, pero las dos actividades no tienen mucho que ver.

Sinceramente, creo que todas estas metáforas nos está llevando a unos errores tremendos de comprensión. Mi humilde opinión.

--501250--

hace 6 años

#9: #7 Espera a que usando los mismos algoritmos lo usen en bolsa...

--556831--

hace 6 años

#61: #32 El funcionamiento entonces es completamente inverso. Stockfish da una puntuación a un movimiento (con un heurístico), y si es rentable, hace el movimiento, y si no, evalúa otro movimiento. Su heurístico y la exploración del árbol de movimientos son su modo de jugar. Sin embargo, una IA se entrena moviendo primero, y evaluando después si ese movimiento ha sido bueno o malo comprobando el resultado. Aprende con el método de prueba y error. Si el resultado es bueno, refuerza positivamente esa forma de jugar, y si es malo, refuerza negativamente ese movimiento.

squanchy

hace 6 años

#45: #9 ya se usa desde hace bastantes años. Busca "High Frequency Trading".

--319549--

hace 6 años

#58: #57 Cualquier gorro de aluminio se queda corto si piensas en este tema.
Lo mejor es prepararse tranquilamente para el apocalipsis, como ya hacen los runners.

--525496--

hace 6 años

#62: #21 Le han programado la forma de aprender, que no es moco de pavo.

squanchy

hace 6 años

#26: #17 Tuvo que entrenar porque solo le explicaron las reglas. Solo eso. Por lo que la única manera de mejorar era practicar y lo hacía contra si mismo. Eso implica, que conforme iba mejorando, su contrincante también. La proeza es que a diferencia de las otras IA, a esta no le metieron un paquete de jugadas y partidas.

Ya hicieron algo similar con AlphaGo y los resultados fueron increibles. Os dejo este enlace porque no tiene desperdicio.

https://deepmind.com/blog/alphago-zero-learning-scratch/

Haplos

hace 6 años

#3: #1
https://www.youtube.com/watch?v=g-Bt7AXlpqo

ChiquiVigo

hace 6 años

Comentarios

Ordenados

Desactivado

hace 6 años

chiquivigo

V 2

K 36

pichorro

hace 6 años

Es fascinante lo rápido que puede llegar a aprender una inteligencia artificial.

V 0

K 10

ChiquiVigo

hace 6 años

V 5

K 57

Desactivado

hace 6 años

#2
Pues a mí no me parece nada fascinante cuando las condiciones de juego no son las mismas dejando a StockFish sin toda su capacidad.

V 3

K 22

imnotrpg

hace 6 años

editado

#2 depende de lo que se entienda por rápido. Para saber si 4 horas es mucho o poco habría que saber cuánto duran las partidas de media. Es CPU vs CPU, el tiempo de "pensamiento" de cada jugada se contará en nanosegundos, y no hay ni dibujado del tablero ni nada, simplemente la matriz del tablero y las posiciones de las piezas. No es nada descabellado decir que cada partida puede durar menos de 1 segundo.

V 1

K 18

Varlak

hace 6 años

#5 em.... y si cada partida dura menos de 1 segundo no te parece rápido?

PD: Probablemente en 1 segundo haya jugado varios miles de partidas

V 0

K 7

Desactivado

hace 6 años

No digo que no tenga mérito, pero ¿qué utilidad tiene un programa que juega al ajedrez?

V 4

K 6

Desactivado

hace 6 años

4 horas de entrenamiento consigo mismo

Y yo aquí con días enteros sin conseguir ningún hito.

V 4

K 34

Desactivado

hace 6 años

#7 Espera a que usando los mismos algoritmos lo usen en bolsa...

V 16

K 117

#10

fisico

hace 6 años

en la tabla pone que cada máquina tuvo 1 minuto de reflexión en cada jugada

V 0

K 19

#11

Shinu

hace 6 años

¿Y tú qué utilidad tienes? Ahora en serio, no es el hecho de que haya ganado a uno de los motores de ajedrez más potentes del mundo entrenando 4 horas, sino las posibles aplicaciones que pueda tener esta tecnología para resolver otro tipo de problemas.

V 1

K 18

#12

Desactivado

hace 6 años

editado

#7 Menuda pregunta. Tú eres de los que va al bosque y sólo ve árboles, ¿no? La cuestión no es que juegue al ajedrez, sino que él solo haya conseguido aprender a jugar en cuatro horas y sea el mejor del mundo.

V 17

K 108

#13

asterissco

hace 6 años

4 horas con la capacidad de Google no es poco

V 2

K 21

#14

barruka

hace 6 años

Si tan listo es, que le expliquen cómo funciona el Cáncer y que llegue a la cura

V 4

K 26

#15

thingoldedoriath

hace 6 años

#7 La de hacer más pequeños a lo humanos que se sienten medio dioses por ganar a otros humanos al ajedrez?? Y... todo lo que eso conlleva para los humanos a los que les gusta el ajedrez...

V 0

K 10

#16

Desactivado

hace 6 años

#7 Pues que si quieres mejorar en este juego no necesitas andar buscando gente para jugar con ellos. Te pones a jugar al juego cada vez que tu quieras.

V 0

K 7

#17

POLE288

hace 6 años

editado

Puestos a ser exigentes, no entiendo por qué tuvo entrenar, salvo que en ese tiempo le haya generado todas las jugadas posibles, que ya no serían 4 horas "nuestras", si no vidas

V 0

K 6

#18

Desactivado

hace 6 años

editado

Interesante pero habría que indagar más en el tema técnico.

Me parece que comparan algo así como churras con merinas, por comentar un detalle que salta a la vista sin leer el paper completo:
- Potencia de cálculo. Según he leído se le dió 1 minuto por movimiento. StockFish solo utiliza un hilo/núcleo y Deepmind utilizó otro hardware que llaman TPU ( Tensor Flow Unit ) que básicamente es un ASIC específico para IA, por lo que sin poder comparar potencia de computación ya es comparar cosas diferentes.

- En el paper habla de que AlphaZero "descubrió" las aperturas más jugadas por los humanos en la última década... No sé, es un paper corto, raro y que huele mal.

V 3

K 10

#19

NeoFlash

hace 6 años

#7 Para los jugadores profesionales de ajedrez lo va a ser

V 0

K 6

#20

Pedropan

hace 6 años

Me gustaría ver un día que la IA encuentra curas para el cáncer y estas cosas que nos importan a los humanos, está bien jugar al ajedrez un ratito

V 1

K 16

#21

Desactivado

hace 6 años

#2 Es fascinante tener la capacidad de aprender sin que te hayan programado

V 4

K 28

#22

rafeame

hace 6 años

editado

Ni siquiera un adolescente es capaz de autoentrenarse tanto tiempo seguido. Ni para aprender.

V 0

K 6

#23

Desactivado

hace 6 años

editado

#2 No hace mucho en una noticia similar un meneante explicó lo que significa "aprender" en estos casos. A ver si vuelve a aparecer y lo explica, a mí ya se me olvidó. Pero está claro que no tiene mucho que ver con la capacidad de aprendizaje del ser humano porque si introduces una regla nueva en el juego el software hace kaputt, mientras que un ser humano puede readaptarse.

En general deberíamos empezar a tener cuidado con estas metáforas usadas por los ingenieros, porque IA no tiene mucho que ver con la inteligencia humana, igualmente "aprender" es otra cosa cuando hablamos de software. Hoy mismo leí la comparación de "minería" de Bitcoins con minería en una mina de oro. Lo siento, pero las dos actividades no tienen mucho que ver.

Sinceramente, creo que todas estas metáforas nos está llevando a unos errores tremendos de comprensión. Mi humilde opinión.

V 12

K 84

#24

u_1cualquiera

hace 6 años

editado

Voy a proponer un programa a Tele5
Meter las principales Inteligencias Artificiales en el mismo ordenador y que convivan y se relacionen, sólo puede quedar una
Me voy a forrar 🍹 🍜

V 2

K 19

#25

Desactivado

hace 6 años

#18 Quería poner 4 TPUs pero no me deja editarlo ya.
https://en.wikipedia.org/wiki/Tensor_processing_unit

V 0

K 6

#26

Haplos

hace 6 años

#17 Tuvo que entrenar porque solo le explicaron las reglas. Solo eso. Por lo que la única manera de mejorar era practicar y lo hacía contra si mismo. Eso implica, que conforme iba mejorando, su contrincante también. La proeza es que a diferencia de las otras IA, a esta no le metieron un paquete de jugadas y partidas.

Ya hicieron algo similar con AlphaGo y los resultados fueron increibles. Os dejo este enlace porque no tiene desperdicio.

https://deepmind.com/blog/alphago-zero-learning-scratch/

V 7

K 40

#27

juancsmix

hace 6 años

#7 que aprendio a jugar solito.

V 0

K 6

#28

Desactivado

hace 6 años

#20 eso eso, que haga avances en cosas importantes, como la homeopatía, gestionar los sms de sálvame que aparecen durante la emisión o aniquilar humanos. Jugar al ajederz es cosa de Atari

V 0

K 6

#29

Desactivado

hace 6 años

autor

editado

#23
Ahora que lo pienso, pobre Max Deutsch
https://en.chessbase.com/post/beating-magnus-after-a-month-of-training

V 2

K 19

#30

Desactivado

hace 6 años

#18 Pues si, Google no ha hecho un combate justo. Aunque lo importante realmente ha sido la capacidad de aprendizaje.

V 1

K 13

#31

dac

hace 6 años

#7 ya lo verás ya...

V 1

K 15

#32

Desactivado

hace 6 años

#5 El tiempo por movimiento de Stockfish depende del número de jugadas/turnos que calcule. Hace poco ví "algo" de una partida de un campeonato de varias CPU. Por cada jugada se tiraban unos 5 minutos. _{No aguanté mucho.}

V 2

K 21

#33

Pedropan

hace 6 años

#28 http://noticias.universia.es/ciencia-tecnologia/noticia/2016/11/22/1146407/inteligencia-artificial-big-data-curar-cancer.html

V 0

K 7

#34

pichorro

hace 6 años

#18 Lo de las aperturas también me ha dejado algo descolocado a mí. A ver si publican algo más claro.

V 1

K 17

#35

Ferran

hace 6 años

#22 Yo de adolescente autoentrenaba para hacer el amor más horas seguidas...

V 2

K 28

#36

Pichaflauta

hace 6 años

#3 alphazero siempre es blancas?

V 0

K 6

#37

Spirito

hace 6 años

#9 La bolsa se la devoraría en un mes, incluídas las criptomonedas.

De hecho, la bolsa está diseñada para los humanos, con sus incertidumbres y sus miedos, no para una IA con unos algoritmos supersofisticados.

V 1

K 16

#38

Desactivado

hace 6 años

#14 Ya llegará. Las IA están empezando a utilizarse en el diagnóstico y tratamiento del cáncer con muy buenos resultados.
No te puedo dar referencias pero sé que he leído varías noticias al respecto últimamente.

V 2

K 26

#39

megusta

hace 6 años

El problema de Meneame en 3 enlaces rápidos
https://news.ycombinator.com/item?id=15858197
https://www.reddit.com/r/chess/comments/7hvbaz/mastering_chess_and_shogi_by_selfplay_with_a/
https://www.reddit.com/r/MachineLearning/comments/7hvr19/r_mastering_chess_and_shogi_by_selfplay_with_a/

V 1

K 15

#40

Maldito

hace 6 años

editado

#5 Creo que confundes el tiempo que dura una partida con el tiempo en que la máquina aprendió a jugar al ajedrez con ese nivel de maestría que es a lo que se refiere #2.

V 3

K 29

#41

infestissumam

hace 6 años

#11 O para crearlos

V 0

K 14

#42

pelillos_a_la_mar

hace 6 años

Aprovechad, ingenieros de google, antes de que aprenda a masturbarse!

V 0

K 8

#43

jenkin

hace 6 años

#14 http://omicrono.elespanol.com/2017/03/ia-de-google-en-el-diagnostico-de-cancer/

V 2

K 16

#44

ChiquiVigo

hace 6 años

#36 Creo que jugó 2 con nengras y 8 con blancas. Pero tampoco se mucho de ajedrez jugando módulos, ni el tiempo ni que Elo tenía el otro

V 0

K 10

#45

Desactivado

hace 6 años

#9 ya se usa desde hace bastantes años. Busca "High Frequency Trading".

V 9

K 75

#46

Desactivado

hace 6 años

#36 No. 50%

V 3

K 33

#47

Desactivado

hace 6 años

#7 Imagina que puedes programarlo para aprender a combatir virus.

Un algoritmo que prueba millones de combinaciones para eliminar virus. ¿No te parece una posiblidad fascinante?

V 1

K 10

#48

Pilfer

hace 6 años

#2 el ajedrez es un juego limitado con unas variables definidas y limitadas. Las ia de momento no pueden con juegos no tan definidos, por ejemplo, starcraft:

Aún queda esperanza: el hombre derrota a la máquina jugando al StarCraft

Publicado hace 6 años por --546793-- a technologyreview.es

Aún queda esperanza: el hombre derrota a la máquin...

technologyreview.es

V 2

K 12

#49

colomer

hace 6 años

#37 La bolsa la mueven más las máquinas que los inversores de carne y hueso.

V 5

K 37

#50

Desactivado

hace 6 años

#23 No sé cuál será esa iluminadora explicación pero aprender es aprender, si no sabe readaptarse puede aprender a hacerlo, en muchos casos los humanos tampoco sabemos readaptarnos.
Si lo que te da miedo son las implicaciones de hablar de las IA como si fuesen mentes... es que son mentes, con los matices que quieras pero mentes, no creo que falte tanto para que adquieran conciencia de sí mismas, si es que no lo están limitando ya para que no ocurra.

V 2

K 27

#51

Shinu

hace 6 años

#11 iba para #7...

V 0

K 10

#52

Varlak

hace 6 años

#7 reformulo la pregunta "Qué utilidad tiene un programa que, partiendo de unas premisas básicas, es capaz de optimizar el proceso a un nivel surrealista en un tiempo ridículo"?

El tema no es ajedrez, el tema es que la humanidad lleva un milenio "optimizando" un juego complejo, y esa IA en 4 horas ha llegado a un nivel parecido que la humanidad en un milenio. La clave aquí es extrapolar esa capacidad de aprender.

V 1

K 10

#53

Varlak

hace 6 años

#16

V 0

K 7

#54

Desactivado

hace 6 años

#7, lo importante n les que juegue al ajedrez, lo importante es lo que consigue este tipo de inteligencia se podría llegar a hacer.

V 0

K 19

#55

Desactivado

hace 6 años

editado

#45 Pero no con IA tan avanzadas. Este es uno de los motivos por los que estas investigaciones estarán recibiendo financiación como si no hubiera un mañana_{(¿Nunca mejor dicho?)}

V 0

K 7

#56

Desactivado

hace 6 años

#41 Es compatible, nosotros podemos ser un problema.

V 0

K 7

#57

Desactivado

hace 6 años

#50

V 0

K 9

#58

Desactivado

hace 6 años

#57 Cualquier gorro de aluminio se queda corto si piensas en este tema.
Lo mejor es prepararse tranquilamente para el apocalipsis, como ya hacen los runners.

V 4

K 38

#59

Narukami

hace 6 años

#50 Conciencia de si mismas en cualquier momento sucedera, conforme siga progresando esta tecnologia y sean las IA cada vez mas complejas y avanzadas. Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo. En el caso de los humanos ya traemos de serie el deseo de sobrevivir y reproducirnos y la inteligencia es un instrumento que ponemos al servicio de ese objetivo; en el caso de la maquina esto no es asi.

V 0

K 7

#60

Jesucristo_cazavampiros

hace 6 años

#47 el problema es que los virus son un problema real. Por lo tanto la cantidad de combinaciones que puedes probar por segundo estan limitadas por la realidad. En estos juegos se tiene un modelo perfecto de las dinamicas del entorno, por lo tanto es muy facil simular millones de partidas y aprender de ellas. Pero a la que te enfrentas a un problema real (por ejemplo enseñar a un robot a andar), no tienes un modelo perfecto del entorno. Asi que, o lo entrenas en un simulador fisico que es solo una aproximacion de la realidad, para ver que luego cuando lo pruebas en condiciones reales falla, o lo entrenas directamente en un entorno real, para lo cual necesitarias millones de años para llegar al nivel de experiencia acumulafo por alphaZero. Es verdad que lo que esta haciendo deepMind es impresionante, pero se dedican a seleccionar problemas muy mediaticos pero mucho mas faciles de solucionar que problemas reales.

V 0

K 6

#61

squanchy

hace 6 años

#32 El funcionamiento entonces es completamente inverso. Stockfish da una puntuación a un movimiento (con un heurístico), y si es rentable, hace el movimiento, y si no, evalúa otro movimiento. Su heurístico y la exploración del árbol de movimientos son su modo de jugar. Sin embargo, una IA se entrena moviendo primero, y evaluando después si ese movimiento ha sido bueno o malo comprobando el resultado. Aprende con el método de prueba y error. Si el resultado es bueno, refuerza positivamente esa forma de jugar, y si es malo, refuerza negativamente ese movimiento.

V 4

K 39

#62

squanchy

hace 6 años

#21 Le han programado la forma de aprender, que no es moco de pavo.

V 5

K 43

#63

Desactivado

hace 6 años

editado

#60 Sí, pero imagina un laboratorio con una gran maquinaria en la que un algoritmo pueda probar (sino millones) miles de combinaciones para tratar ese virus en diferentes condiciones y analizar los resultados.

V 0

K 7

#64

squanchy

hace 6 años

#23 ¿Crees que una metáfora para explicar un concepto informático puede dar lugar a errores tremendos de comprensión? Pues prueba a explicarla sin metáforas, verás qué risa.
La medicina utiliza nombres complicados para explicar conceptos sencillos. La informática utiliza nombres sencillos para conceptos complicados.

V 3

K 26

#65

Desactivado

hace 6 años

autor

#48 El poker parece ser que ya cayó
http://www.independent.co.uk/life-style/gadgets-and-tech/news/ai-poker-win-tournament-software-beats-pro-players-victory-a7555791.html

V 1

K 20

#66

squanchy

hace 6 años

editado

#37 Busca en google "trading de alta frecuencia", verás qué sorpresa te vas a llevar.

V 0

K 9

#67

Frederic_Bourdin

hace 6 años

#11 Que de momento son... cero.

V 0

K 8

#68

squanchy

hace 6 años

#11 Hoy evalúa movimientos de piezas de ajedrez para ganar una partida. Mañana evaluará movimientos de objetos en la calle para que tu coche los evite y no choque con ellos.

V 2

K 22

#69

squanchy

hace 6 años

#35 Querrás decir minutos.

V 1

K 16

#70

Pandacolorido

hace 6 años

#37 No tienes ni idea de lo que hablas. #45 si.

V 0

K 7

#71

sieteymedio

hace 6 años

Afortunadamente no nos vamos ni a enterar de cuando nos aniquilen las máquinas.

V 0

K 7

#72

Jesucristo_cazavampiros

hace 6 años

editado

#63 eso se esta haciendo (en robotica seguro, y en diferentes aspectos de medicina tambien) y los resultados son realmente pobres. El problema es que la gente no se da cuenta de la cantidad de datos necesarios para entrenar estos algoritmos. Uno de los principales aspectos en los que los humanos son mejores que el machine learning es en la eficiencia por muestra, es decir, los humanos necesitan muchos menos datos para aprender una tarea. Adenas, los humanos son mucho mejores transfiriendo experiencia de una tarea a otra.

V 3

K 29

#73

Desactivado

hace 6 años

La verdad que es una noticia escalofriante, he estado analizando las partidas y todavía tengo la piel de gallina.

Para los profanos del mundo del ajedrez, se puede explicar resumidamente, que el trabajo de bastantes años (unos 20 años aproximadamente del ajedrez informatizado moderno) entre humanos expertos y usando los más potentes ordenadores hasta ahora, ha sido superado notablemente por una inteligencia artificial que ha aprendido a jugar por si misma en tan sólo 4 horas. Han demostrado que una máquina puede aprender de si misma y mucho mejor sin que un humano le diga como.

Por lo que he leído, se han jugado 100 partidas a 1 minuto por movimiento, contra la que actualmente se considera mejor engine de ajedrez Stockfish 8 (las hay mejores, pero a fin de cuentas son mejoras mínimas del Stockfish) y bueno, el resultado final ha sido 28 victorias de AlfaZero y 62 tablas. Un resultado muy abultado para ser nueva.

Examinando ya las partidas que han publicado (10 partidas muy bonitas), se nota bastante que AlfaZero estaba funcionando en algún tipo de super-ordenador bastante más potente que el usado por Stockfish, pero aun así en las partidas publicadas AlfaZero hace sacrificios posicionales espectaculares, algo increíble para una máquina, ya que cuando ven un camino que gana directamente no pierden el tiempo con subterfugios y sacrificios sólo para mejorar su posición, atacan y punto. Pero esta Alfazero no le importa perder material, es capaz de evaluar que su juego es mejor aunque tenga piezas de menos incluso durante 10 o 20 movimientos (algo imposible de calcular actualmente ni con todos los ordenadores del mundo juntos y que se suele hacer los humanos sólo por intuición ).

V 18

K 107

#74

exeware

hace 6 años

#48 Yo no estoy de acuerdo con que sea limitado, el árbol de juego tiene un tamaño bestial que los hay mas grandes si pero el ajedrez enorme....

V 0

K 6

#75

Iosephus

hace 6 años

editado

#14 Ya están con ello también y, de hecho, avanza de manera bastante interesante. Entre los que hay ahora mismo creo que destaca Watson, de IBM (con, por ejemplo, http://bigthink.com/stephen-johnson/ibms-watson-supercomputer-found-treatments-for-323-cancer-patients-that-human-experts-overlooked ) y Google (no sé si estará basado en lo mismo que esta noticia, pero ahí va un enlace: http://omicrono.elespanol.com/2017/03/ia-de-google-en-el-diagnostico-de-cancer/ )

Me suena que hay más proyectos, pero nunca me quedo con el nombre, lo siento.

V 1

K 18

#76

Desactivado

hace 6 años

#72 Bien, si yo no digo que sea posible ya mismo. Pero el futuro luce muy prometedor.

V 0

K 7

#77

Desactivado

hace 6 años

#59 Creo que eso son dos claves importantes.
Conste que estoy cuñadeando.

" Lo que yo me pregunto es si pueden adquirir voluntad propia sin ser programados para buscar un objetivo"
Eso tendrá que ocurrir para dar respuestas mejores que las nuestras a los problemas, tendrá que buscar variables nuevas y su relevancia por propia voluntad con el fin último de resolver el problema, incluso de adelantarse a futuros problemas, no sé si me explico. Y eso posiblemente es el paso previo a la autoconsciencia.

En el tema de los instintos yo me atasco más porque no entiendo bien cómo funcionan las IA. Si se programa para querer aprender más y más... eso ya es como un instinto, una motivación primaria, curiosidad. Y si hay selección "natural", como con ciclos en los que trozos de código mueran y otros nazcan y generen nuevo código... También deberían surgir líneas cuyo único objetivo sea reproducirse, como ocurre en el ADN, entonces acabarían apareciendo instintos nuevos.

V 0

K 7

#78

empe

hace 6 años

#23 Si le cambias una regla aprende más rápido que tú y que yo.
De hecho aprendió solo, solamente le dijeron las reglas del ajedrez.
Si es capaz de aprender diciéndole sólo las reglas crees que no podría aprender si cambiáramos una sola?

V 2

K 24

#79

Shinu

hace 6 años

#67 Y eso cómo lo sabes? Trabajas en el sector de la IA? Y aunque así fuera no quiere decir que tenga implicaciones importantes en un futuro cercano.

V 2

K 21

#80

Desactivado

hace 6 años

#23 llevas razón un robot es inteligente solo en un entorno prederterminado y conocido. Una regla nueva en ajedrez significaria cambiar el entorno. Lo que hace en 4 horas imagino es simular partidas contra el mismo para evaluar situaciones de juego real y ver que movimientos son mejores para ganar. Luego repetira esos movimientos en dichas situaciones.

V 2

K 23

#81

Raul_Lomi

hace 6 años

#65 contra un solo jugador, el jugador es pro del Texas no limit, pero creo recordar que el duelo máquina VS pro fue en variante limit

V 0

K 6

#82

Narukami

hace 6 años

editado

#77 Esa es la cosa, tienen "curiosidad", esa motivacion, porque alguien les programo para eso. Parece que solo podrian desarrollar objetivos y motivaciones derivados de esas instrucciones primarias recibidas. Claro que es verdad que si en algun momento llegan a asociar su supervivencia en el tiempo (y quiza su reproduccion) con un cumplimiento de los objetivos, podran empezar a hacerlo solas.
La siguiente cuestion seria saber si llegaran a disfrutar de su "vida" igual que los humanos, recibiendo algun tipo de estimulo positivo cuando cumplen sus objetivos (como nosotros al comer, o al tener sexo) o negativo cuando fallan y se alejan de conseguirlos. El ~~instinto~~ codigo las fuerza a actuar...la verdad es que te pones a pensar en las posibilidades y es una ida de olla.

V 0

K 7

#83

Marinmenyo

hace 6 años

#73 Desde la barra del bar digo que eso de sacrificar piezas puede ser muy importante, ya que si lo que hace stockfish es moverse mediante un arbol de decision tipo expectiminimax, y con tiempo limitado, puede dar por buenos movimientos, que sin bajar a mucha profundidad en el arbol dan muchos puntos ( juntando heuristicas ...) pero que un poco mas abajo igual resultan fatales. Pero bueno, supongo que el stockfish este no usara un algoritmo expectiminimax a secas

V 1

K 19

#84

Desactivado

hace 6 años

#58 no seran los preppers?

V 0

K 9

#85

AlfalfaZero

hace 6 años

#23 Imagino que te refieres a esto que explican aqui utilizando como ejemplo pequeñas variaciones en la posicion de distintos elementos en los tipicos juegos de Atari:

V 3

K 29

#86

Desactivado

hace 6 años

#84 No conocía el término. Guay, soy un prepper
Los runners también pero no lo saben.

V 0

K 7

#87

Desactivado

hace 6 años

autor

#81 "Libratus, an AI program developed by a team of researchers at Carnegie Mellon University, took on Dong Kim, Jimmy Chou, Daniel McAulay and Jason Les at no-limit Texas Hold’em in a Pittsburgh casino, eventually taking $1.76 million (£1.4 million) in chips"

V 1

K 13

#88

elcoret

hace 6 años

AlphaZero utiliza MonteCarlo Tree Search, igual que AlphaGo Zero. Lo de las redes neuronales y el auto-aprendizaje imagino que solo lo usan para la fase de seleccion (no he mirado el algoritmo), por lo tanto lo unico que se ha demostrado es que MCTS es mejor que Minimax con poda alpha-beta, incluso en juegos con menor numero de ramificaciones.

V 2

K 28

#89

crissis

hace 6 años

#14 "que le expliquen cómo funciona el Cáncer"

Creo que ese sería el problema.

PD: negativo por error cuando quería dar a responder

V 2

K 26

#90

Dovlado

hace 6 años

Al margen de que no hayan puesto al módulo stockfish en las mejores condiciones, la proeza es sobrecogedora. Cualquier aficionado (o Maestro) de ajedrez lo entenderá como yo

V 0

K 9

#91

blackv

hace 6 años

Hola doctor Falken...

V 0

K 6

#92

Desactivado

hace 6 años

#90
Cualquier experto informático, como ya han escrito por arriba, te dirá que está sesgado. Es probable que AlphaZero siga siendo vencedor pero sin dar tanta ventaja al algoritmo de Stockfish que igualmente puede ser implementado en hardware.

V 0

K 9

#93

ajedrezcuellar

hace 6 años

#10 Muy cierto, corregido, ¡gracias!

V 0

K 6

#94

Desactivado

hace 6 años

#83 Creo que no, que Stockfish no usa el arbol de decisiones tipo expectiminimax, sino que habían creado otra variante de minimax llamado alpha-beta. Pero te hablo también desde la ignorancia ya que esto lo he leído en alguna parte y no recuerdo ahora donde.

De todas formas si es importante que una engine de ajedrez aprenda a sacrificar, y más si son sacrificios posicionales como hace esta. Porque era el punto de aquiles de las engines de ajedrez, ya que todas suelen hacer sacrificios tácticos y de sólo ataque en su mayoría.

V 1

K 10

#95

Desactivado

hace 6 años

editado

#4 aunque tuviera solo un cuarto de su capacidad, le ha ganado con solo 4 horas de entrenamiento!!

V 0

K 7

#96

Ferran

hace 6 años

#69 Que va, le daba a la manivela durante horas

V 0

K 11

#97

devil-bao

hace 6 años

Onanismo artificial

V 0

K 9

#98

Desactivado

hace 6 años

editado

#64 No lo creo. He dicho en este caso, y los errores se dan porque veo a la gente opinando cosas muy locas. No he dicho que no se deban usar metáforas, pero la gente normal no está entiendiendo nada.

Por ej. #50. ¿Conciencia? No tengo miedo de la informática, yo programo a nivel hoby, pero conciencia ninguna, eso todavía está lejisimo. Y si se consigue no parece que vaya a ser como la humana.

V 0

K 7

#99

Desactivado

hace 6 años

#12 Mmm no lo había visto así, tienes razón

V 1

K 17

#100

abuelillo

hace 6 años

#23 Claro, coges un programa que juega al go, le enseñas las reglas de otro juego y practicando consigo mismo solo 4 horas ya juega como los mejores jugadores del mundo, y a eso lo llamas "no saber adaptarse", no se que tendran que hacer las computadorsas para convencerte quizás ser dios.

V 0

K 6

1 2

AlphaZero derrota a StockFish 8 tras tan sólo 4 horas de auto-aprendizaje

AlphaZero, un programa informático de Google basado en redes neuronales, ha logrado derrotar a StockFish 8, uno de los motores de ajedrez más potentes del mundo. Para lograrlo, tan sólo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento consigo mismo.

Etiquetas

comentarios destacados

Comentarios

Aún queda esperanza: el hombre derrota a la máquin...