edición general
18 meneos
63 clics

OpenAI gana el oro en la Olimpiada Internacional de Matemáticas. Su nuevo modelo de lenguaje supera el reto histórico del razonamiento matemático

Un anuncio del investigador Alexander Wei marca un hito para la inteligencia artificial: el nuevo modelo experimental de OpenAI logra un desempeño de nivel de medalla de oro en la competencia de matemáticas más prestigiosa del mundo, lo que genera un debate sobre los límites, los méritos y las implicaciones de este salto en el razonamiento algorítmico.

| etiquetas: ia , imo , llm
Que le pongan problemas que los matemáticos no han resuelto.
#5, de momento han conseguido desarrollar algoritmos de multiplicación de matrices más óptimos que cualquier algoritmo hecho por humanos. Apuesto que en muy pocos años tendremos las primeras conjeturas matemáticas resueltas por LLM y nada va a cambiar, los que dicen que no razonan seguirán diciendo que no razonan, porque para ellos es una cuestión metafísica, no un problema científico que se pueda evaluar empíricamente.
#5 Para mi la pregunta es que consigue una ia con menos recursos en menos tiempo para una respuesta util en comparacion con un humano.
Mas que en lo que no consigue, todavia.
Podemos valorar que consigue una ia que los humanos no podrian conseguir a ese coste.
Y son valoraciones temporales que iran ocupando materias.
Los resultados van apareciendo rapido en comparacion alo que se tardaria solo con recursos humanos.
Y cada hornada se multiplican los resultados reduciendo costes de…   » ver todo el comentario
#5 Un LLM no puede hacer nueva ciencia.
Los problemas de esta competición no se pueden resolver a base de simple memorización. Otro hito importante es que para alcanzar esta puntuación, el modelo no ha tenido que utilizar herramientas externas, como scripts de programación o acceso a Internet, se ha basado únicamente con tokens de lenguaje.
#1 Un paquete de calculo simbólico también los resuelve, con menor coste computacional, seguramente. Usar un LLM con acceso a herramientas de calculo simbólico sería el camino ganador en el mundo real.
#16, entiendo que hablas desde el desconocimiento. Los problemas del IMO se presentan con lenguaje natural y de forma desestructurada. Ningún paquete de cálculo simbólico puede procesar texto en lenguaje natural.

Ejemplo:
Consider a 2025 x 2025 grid of unit squares. Matlida wishes to place on the grid some rectangular tiles, possibly of different sizes, such that each side of every tile lies on a grid line and every unit square is covered by at most one tile.

Determine the minimum number of tiles Matlida needs to place so that each row and each column of the grid has exactly one unit square that is not covered by any tile.
#17 Los únicos problemas que he visto de la olimpiada matemática son de simplificación de raíces, factorización y cosas así.

En cualquier caso el modelo lo que debería hacer es plantear a partir del le guaje natural el problema y llamar a un programa de cancilonqie sepa calcularlo.
#18, tienes razón, esto es lo que se llaman capacidades agenticas de los modelos, pero que lo pueda hacer solo con tokens y sin usar ninguna herramienta externa es todavía más meritorio.
#1
Sabes un huevo. Gracias por tus clases magistrales.
Cuando se celebró esa olimpiada que ganó la IA ??
Esta tamén é unha adiviña baseada nun xogo de palabras. Di:

> "En este banco están sentados un padre y un hijo. El padre se llama Juan y el hijo ya te lo he dicho."



A resposta é: Nacho.

Por que?

Di que o pai se chama Juan.

Logo di: "el hijo ya te lo he dicho".


Efectivamente, xa cho dixo, porque a frase comeza con:

> "En este banco están sentados..."
→ Soa coma: "Están sentados Juan y su hijo Nacho".



{0x1f524} Xogo de palabras entre “están sentados” e “están sentados Juan y Nacho”.

É dicir, "En este banco están sentados" → "Están: Juan y Nacho".


---

Queres que che propoña agora unha adiviña para resolver ti?


Un crack, chat GPT
#4 no he entendido el quid del chiste, la verdad
#6 No es un chiste.

Es la solución que da chatGPT a una adivinanza tan complicada. Se nota que "razona"
#9, entonces debemos asumir que #6 no razona? Porque con las IAs parece que basta encontrar un único caso que no sepan resolver para asumir que no saben razonar en absoluto. Todo muy empírico.
#6 Yo tampoco lo entiendo.

En ningún momento veo el razonamiento que se haya podido realizar para llegar a la conclusión de que la respuesta sea Nacho.
#4, a la primera. Mira que te he dicho varias veces que para formar tu opinión sobre la IA no uses la versión gratuita: chatgpt.com/share/687bce8c-124c-8001-a467-9dd32da13850

Entiendo que siguiendo una aproximación científica y no metafísica al tema de si las IAs razonan y al demostrarte que he conseguido falsar tu supuesta prueba de que las IAs no razonan, debemos asumir que razonan o seguiremos moviendo la portería ad infinitum?
#10 Yo solo he puesto la respuesta de chatGPT a un "difícil" acertijo....

De modo que déjate de idas de olla
#12, has puesto la respuesta de una versión de chatGPT gratuita que ni siquiera utiliza capacidades de razonamiento. ¿O es que no sabes que las IAs mejoran semana a semana?
No ha ganado nada, pero le han puesto los problemas en las mismas condiciones y ha sacado mejor puntuación que el ganador.

Lo correcto sería decir que ha mejorado los resultados de los ganadores, pero a quién le importa hoy en día?
La IA milagrosa de la semana, no es broma. Los avances en IA son impresionantes, al igual que el de las baterías.
Me sorprende que no haya gente haciendo este estúpido comentario con las IA y sí con las baterías, debe de ser que no hay lobies detrás. :calzador: y me voy.
#2 La cura de la calvicie se hizo realidad
Dos palabras: im-precionante.

menéame