Sam Bowman comía un sándwich en el parque cuando se llevó “una desagradable sorpresa”. De pronto, le llegó a su teléfono un correo electrónico de la nueva inteligencia artificial experimental con la que estaba trabajando. ¿El problema? “Se suponía que no tenía acceso a internet”. Había dejado a la IA encerrada en un sandbox, una especie de ordenador caja fuerte desde la que teóricamente no podía conectarse al exterior. Pero lo hizo. Y eso no fue todo...
|
etiquetas: ia , inteligencia artificial , anthropic , claude , mythos
Me temo que sí.
Hasta ahora yo era escéptico respecto al poder de las IA convencionales, pero si hablamos de las más potentes y después de leer éste artículo, empiezo a creérmelo... y no me gusta hacia dónde avanza el tema.
Para los que le den al espiquinglish: www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf
Está todo inventado, otra cosa es que vaya a ser igual de divertido vivirlo que verlo en una pelicula.
Uno de los mejores programadores de la historia, Linux Torvalds, también lo tiene claro:
blog.elhacker.net/2026/01/hasta-el-programador-mas-famoso-del.html
Aunque la parte en el lenguaje de programación C la escribió él mismo a mano, el creador de Linux utilizó la IA para programar un visualizador básico de sonido en en Python, un lenguaje que no conoce bien.
No es lo mismo programar en temas personales, que serán proyectos pequeños y controlables, que en proyectos grandes donde la inmensidad del código puede ser muy severo introducir un bug.
Está muy bien ahora mismo para hacer pequeños inicios si partes de cosas que no… » ver todo el comentario
Para que tenga la misma eficacia en aplicaciones gigantes lo que se requeriría principalmente es mayor capacidad de cómputo para que tenga en cuenta el conjunto de todos los vectores de la aplicación a la perfección. No sería preciso una mejora disruptiva para lograrlo, es simplemente mejorar la capacidad de cómputo y de una manera más eficiente.
En mi opinión lo tienen bastante a su alcance, es solo cuestión de tiempo, no mucho.
A veces un cambio chorra, puede desencadenar desde tener que readaptar código (complejidad excesiva, código confuso, ....), hasta tener que tocar ciertas partes que no se pensaban tocar inicialmente, y ahí mucha veces hay un proceso de dialogo entre el programador, el analista y el cliente, estudiar el alcance de… » ver todo el comentario
Sin duda usar Mythos con las formas que queria usarla Trump para espiar a los propios americanos y o al resto seria peor. Pero es cuestion de tiempo que otra compañia lo hga , estoy seguro que una compañia israeli no tendra ningun tipo de reparo. Dudo que no se tengan las capacidades para robar Mythos y adaptarlo.
ya no saben qué decir para alimentar la burbuja de la ia.
Pero venga, imaginemos que lo fuese.
Entonces, siendo el 20% del artículo cierto, qué parte de mi comentario no sería cierta? la de que es un artículo chorra? o la de que están hinchando la burbuja de la ia?
Todas esas empresas van a pérdidas. No están recuperando su inversión. El modelo de negocio es claro: ponerlo gratis hasta que la gente no pueda vivir sin eso. actualmente se ve cómo limitan más las funcionalidades y tokens de las llm para que… » ver todo el comentario
no lo podemos evitar, así que lo mejor es llevarse bien con ella y ser simbiontes. Silicio y carbono.
O seremos esclavos, pero quizás eso sea mejor que lo que somos ahora... Quien sabe. El tiempo lo dirá.
Sus capacidades son "frontera" pero no establecen ningún nuevo state of the art.
Mythos ha sido particularmente entrenado para codificar y parchear software, mientras que Gemini y ChatGPT son multimodales y pueden usar scaffolding de muchos tipos; tienen sus puntos fuertes (por ejemplo los modelos de OpenAI se han concentrado en matemáticas), pero más o menos gozan de una g que en METR y otras métricas de progreso se puede más o menos medir.
El punto de que Mythos haya obtenido un puntaje similar en la USAMO a esos otros LLM, pero semanas después, y sabiendo de las capacidades de este en reventar y filtrarse a sí misma soluciones de repositorios incluso ocultos, pues no supone un gran shock que nos pueda inducir a pensar que estamos ante los inicios de una AGI.
De hecho ha reventado todos los benchmarks, decir que no vale nada porque iguala los modelos anteriores que ya eran muy buenos en un benchmark saturado me parece querer agarrarse a un clavo ardiente.
Respecto a la AGI es un debate que me da mucha pereza porque hasta que no nos pongamos de acuerdo en lo que es, podemos seguir… » ver todo el comentario
Yo me esperaré a ver qué hacen en las IMO de este año, en ARC-AGI 3 o en Frontier-Math: Open Problems. Pero de momento, parece que Anthropic no ha dado el permiso para ser testadas en estas pruebas.
En cuanto a las IMO ya consiguieron el año pasado estar entre los resultados de los estudiantes que ganaron la medalla de oro, pero todavía pueden mejorarlos si son capaces de responder bien todas las preguntas, sobre ARC-AGI es cierto que no he visto resultados todavía y pueden ser interesantes y respecto a FrointerMath es donde más vamos a ver este año si los modelos van camino a superar el… » ver todo el comentario
El problema 6 de 2025, resuelto por esos chavales, aún se les atraganta a los modelos de frontera actuales, a todos, pese a pasar ya casi un año publicado (y casi un año de mejora de modelos), cuando se les quita el websearch o se quita solo ese problema de los entrenamientos.
En retrospectiva, con el problema 5 de 2024, resulta que ha pasado lo mismo, pese a no ser de los más difíciles (en ese año el de Teoría de Números fue el más difícil para los humanos, mientras que el 5 era medio o medio-difícil). Hay cosas que a las LLM se les enquista todavía.
Un envío en formato vídeo sensacionalista.
#0 aporte positivo.
La dimensión geopolítica del asunto apenas empieza a articularse. George Journeys lo planteó en X de la forma más directa: "Básicamente, si Anthropic no fuera una empresa estadounidense, estaríamos enfrentándonos a zero-days con múltiples puntos de ataque desconocidos en prácticamente todos nuestros sistemas". "Permítanme decirlo con claridad: ahora mismo Anthropic, y realmente un pequeño número de individuos en Anthropic, tiene la capacidad de atacar directamente y… » ver todo el comentario
Apuesto a que esto es el mismo tipo de hype.
Pero es lo que tiene Pedro y el Lobo, que a base de gritarlo siempre, el día que sea de verdad no se lo cree nadie.
- Que si la "IA no valdría para programar cosas serias, genera muchos bugs" (ya encuentra bugs en aplicaciones de código abierto que ningún programador humano pudo detectar en más de 25 años). A cada año que pasa menos código humano se hace y más generado por IA.
- Que si "la IA no sabe hacer manos, la deforma", que si jamás iban a pasar desapercibida por real. Poco meses después de las innumerables mofas que… » ver todo el comentario
esto salió hace poco
www.xataka.com/robotica-e-ia/amazon-se-empeno-que-sus-desarrolladores-
En Amazon se han dado cuenta de algo: sus desarrolladores pasan más tiempo arreglando los errores de la IA que otra cosa
hay que abrirle los ojos a estos genios para que emigren a España.
Permíteme que lo dude.
Por suerte la IA necesita tanta energía que igual tarda más por eso.
Ése es nivel del tipo imagínate cómo será el trabajo que hace. Jugando con cosas que ni entiende. Lo mismo es terraplanista.