edición general
10 meneos
53 clics
Cómo los gigantes de la IA intentaron tomar al asalto el último reducto de la mente humana: las olimpiadas matemáticas

Cómo los gigantes de la IA intentaron tomar al asalto el último reducto de la mente humana: las olimpiadas matemáticas

EL PAÍS reconstruye la historia de lo que muchos medios vendieron como “la noticia del año”, y algunos protagonistas califican de “vergüenza”: el supuesto oro olímpico de las grandes tecnológicas, que eclipsó la competición real de 600 chavales
(...) La noche de la clausura, (...) los correctores recibieron, asombrados, una noticia inesperada: OpenAI había publicado en redes que su modelo “logró un desempeño” de medalla de oro (...) Primero, no se presentaron, y segundo, su modelo jamás fue evaluado por los correctores de la IMO.

| etiquetas: olimpiadas , matemáticas , ia , vergüenza
Uno y dos años después, con mejores modelos que entonces, y las IA siguen sin ser capaces de resolver el problema P5 de la IMO 2024 ni el P6 de la IMO 2025.

No se ha probado con pruebas de años anteriores porque sus soluciones probablemente, SEGURAMENTE mejor dicho, ya hayan sido usadas para los datos de entreno de todas las IA actuales.
#1 Y los demás problemas, sí?
#2 Sí, para obtener medalla de oro no hace falta resolver todos los problemas.

En 2024 obtuvieron medalla de plata resolviendo 4 de 6. El problema 4 y 5 no lo pudieron resolver, más tarde lo lograron con el 4, pero hoy sigue sin ser resuelto el 5 sin usar websearch, y quitando la solución de los datos de entrenamiento. Ese problema lo resolvieron 14 chavales (no fue el más difícil para ellos, sino el 6, de teoría de números, que solo lo resolvieron 5).

En 2025 lograron medalla de oro, pero…   » ver todo el comentario
Resumiendo, que eso de que las IAs hacen muy bien las olimpiadas de matemáticas es solamente algo que las empresas de IA dicen.
#4, da absolutamente igual, porque no hay prueba que valga, el principio de falsabilidad a la hora de evaluar la IA hace tiempo que se perdió por el camino para los negacionistas, que algo sirva para demostrar lo tonta que es una IA no sirve para demostrar lo contrario y al final, si lo logran, dirás que no vale porque patatas. Así que tampoco vamos a rasgarnos las vestiduras por el criterio de evaluación, no?

menéame