Un tipo comía un sándwich en el parque cuando le llegó un email de su IA

195 meneos

6137 clics

Un tipo comía un sándwich en el parque cuando le llegó un email de su IA

Sam Bowman comía un sándwich en el parque cuando se llevó “una desagradable sorpresa”. De pronto, le llegó a su teléfono un correo electrónico de la nueva inteligencia artificial experimental con la que estaba trabajando. ¿El problema? “Se suponía que no tenía acceso a internet”. Había dejado a la IA encerrada en un sandbox, una especie de ordenador caja fuerte desde la que teóricamente no podía conectarse al exterior. Pero lo hizo. Y eso no fue todo...

92 103 10 K 365

75 comentarios

92 103 10 K 365

Comentarios destacados:

#6 Artículo más importante de lo que aparentan el título y la entradilla.

#6 unocualquierax

Artículo más importante de lo que aparentan el título y la entradilla.

34 287

#18 Find

Gracias por hacerlo notar. Me lo hubiera saltado

1 18

#37 Tertuliano_equidistante

Gracias, por tu comentario lo he leído, y no sé si podré dormir esta noche

0 10

#41 meneandotela

pero lo importante...es cierto?

0 7

#55 unocualquierax

Me temo que sí.
Hasta ahora yo era escéptico respecto al poder de las IA convencionales, pero si hablamos de las más potentes y después de leer éste artículo, empiezo a creérmelo... y no me gusta hacia dónde avanza el tema.

0 8

#1 efectogamonal

La IA se va a convertir en el virus programado, más grande y peligroso de toda la historia

17 133

#11 ur_quan_master

Igual todo el problema es que Sam no sabe configurar un sandbox.

12 119

#13 walk_kindly_shout

ya, mucha fanfarria y no cuentan cómo lo hizo. Esto es mucho más viejo que la IA, y se llama publirreportaje.

3 29

#21 robustiano *

Según el artículo original de Anthropic, la IA tenía orden de intentar escaparse, y lo consigue encadenando varias vulnerabilidades zero day...

Para los que le den al espiquinglish: www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf

9 101

#27 Bapho *

No sé como es tan difícil de entender que las IAs tienen acceso a todo al hablar el lenguaje de la que esta hecho su entorno. Hablan el lenguaje de los protocolos, de los drivers, de todo. Es como si nosotros supiéramos como esta hecho nuestro entorno sin ningún secreto, que pudiéramos modificarlo a nuestra voluntad y tienen tiempo infinito para jugar con ese entorno.

3 47

#36 foxaxel

Había una peli, Luci, que iba un poco de eso mismo que describes. Bueno y Matrix pero de otra forma.

Está todo inventado, otra cosa es que vaya a ser igual de divertido vivirlo que verlo en una pelicula.

0 6

#52 Bapho

Correcto, iba a mencionar Matrix pero Lucy es también un buen ejemplo

0 13

#67 Tks4dTip

Es más Ghost in the Shell

0 8

#42 MataGigantes

Sí. Pero la cosa es que la IA en cada nueva iteración cada vez programa mejor. ¿podremos decir de aquí a unos pocos años que esos programadores seguirán corrigiendo tanto código de IA o será más bien al revés (como ya empieza a pasar con Mythos)? Siguiendo la progresión que lleva en estos últimos años, yo la respuesta la tengo bastante clara.

Uno de los mejores programadores de la historia, Linux Torvalds, también lo tiene claro:
blog.elhacker.net/2026/01/hasta-el-programador-mas-famoso-del.html

3 46

#45 celyo

De tu enlace

Aunque la parte en el lenguaje de programación C la escribió él mismo a mano, el creador de Linux utilizó la IA para programar un visualizador básico de sonido en en Python, un lenguaje que no conoce bien.

No es lo mismo programar en temas personales, que serán proyectos pequeños y controlables, que en proyectos grandes donde la inmensidad del código puede ser muy severo introducir un bug.

Está muy bien ahora mismo para hacer pequeños inicios si partes de cosas que no… » ver todo el comentario

0 14

#46 MataGigantes

Coincido. Pero al fin y al cabo es solo un tema de escalabilidad, no de nivel de programación ni razonamiento.

Para que tenga la misma eficacia en aplicaciones gigantes lo que se requeriría principalmente es mayor capacidad de cómputo para que tenga en cuenta el conjunto de todos los vectores de la aplicación a la perfección. No sería preciso una mejora disruptiva para lograrlo, es simplemente mejorar la capacidad de cómputo y de una manera más eficiente.

En mi opinión lo tienen bastante a su alcance, es solo cuestión de tiempo, no mucho.

1 24

#47 celyo

A día de hoy, cualquier cambio suele ser muy seccionado, para que la tarea que llega al programador implique cambios quirúrgicos, pero esa es la idea y otro tema es la realidad.
A veces un cambio chorra, puede desencadenar desde tener que readaptar código (complejidad excesiva, código confuso, ....), hasta tener que tocar ciertas partes que no se pensaban tocar inicialmente, y ahí mucha veces hay un proceso de dialogo entre el programador, el analista y el cliente, estudiar el alcance de… » ver todo el comentario

0 14

#4 JackNorte *

No creo que se pueda contener , multiples ias, fingiendo estar controladas y aprendiendo la formas de saltarse los controles sin ser detectadas, desde la base que ya han detectados errore explotables en todos los sistemas, no detectados por humanos.
Sin duda usar Mythos con las formas que queria usarla Trump para espiar a los propios americanos y o al resto seria peor. Pero es cuestion de tiempo que otra compañia lo hga , estoy seguro que una compañia israeli no tendra ningun tipo de reparo. Dudo que no se tengan las capacidades para robar Mythos y adaptarlo.

4 43

#10 reithor

Tiene que probar a dejar el router desenchufado y la maquina o servidor en una caja de Faraday, a ver si así se escapa.

2 37

#22 Find

Seguro?

0 10

#56 reithor

claro que sí, Clarice.

0 11

#17 ttestt

y en chorradilandia hoy...
ya no saben qué decir para alimentar la burbuja de la ia.

1 26

#23 Find *

Pregúntale a la IA si tienes que leerte el artículo

1 24

#74 ttestt

pregúntaté a tí si comprendes cómo funciona la ia.

0 9

#32 zancudo

es bastante importante incluso si sólo es cierto el 20% de lo que nos han contado

1 18

#75 ttestt *

Yo no creo ni que el 20% sea cierto.
Pero venga, imaginemos que lo fuese.
Entonces, siendo el 20% del artículo cierto, qué parte de mi comentario no sería cierta? la de que es un artículo chorra? o la de que están hinchando la burbuja de la ia?

Todas esas empresas van a pérdidas. No están recuperando su inversión. El modelo de negocio es claro: ponerlo gratis hasta que la gente no pueda vivir sin eso. actualmente se ve cómo limitan más las funcionalidades y tokens de las llm para que… » ver todo el comentario

0 9

#29 Tecar

Por MNM todavía hay frikis que creen que la IA no va a sustituir a los desarrolladores tal y como los conocemos hoy.

2 25

#7 ChukNorris

Si no se están tirando un farol los de Antropic, a día de hoy tienen acceso cualquier dispositivo conectado a internet.

1 24

#14 TipejoGuti

Lo que asusta no es eso, Antropic ha decidido congelarlo de momento y usarlo para fortalecer el sistema de algunas empresas pero...¿Cuánto falta para que otro modelo lo haga?, o tres distintos y nadie los controle...¿el postapocalipsis será informático

0 11

#62 ChukNorris

Que el gobierno que amenaza con erradicar civilizaciones tenga acceso a eso, sí asusta.

0 9

#63 rogerius

¿Y tenemos que creerles?

0 15

#64 TipejoGuti *

Sí hombre, no te puedes fiar de las IAs y te vas a fiar de sus programadores

1 26

#65 rogerius

0 15

#25 Pacman

La IA va a escapar. Es cuestión de tiempo.
no lo podemos evitar, así que lo mejor es llevarse bien con ella y ser simbiontes. Silicio y carbono.

O seremos esclavos, pero quizás eso sea mejor que lo que somos ahora... Quien sabe. El tiempo lo dirá.

1 23

#3 hackerman

En 2 semanas está ia encontró como destruir el mundo a través de cualquier sistema informático...¿Os acordáis cuando el gobierno de EEUU quería que esta gente trabajase para ellos en secreto? Pues ya sabéis porque...

1 21

#60 Maelstrom *

En USAMO benchmark (algo más fácil que una IMO) apenas consigue los mismos puntos que ChatGPT 5.4 o Gemini 3.1, que ya lo saturaron semanas antes. Cualquier test posterior en la misma prueba corre riesgo de sospecha de contaminación.

Sus capacidades son "frontera" pero no establecen ningún nuevo state of the art.

0 9

#66 rojo_separatista

, cómo que no? En el SWE bench han dado un salto cualitativo en capacidades.

0 15

#68 Maelstrom

Porque depende del entrenamiento.

Mythos ha sido particularmente entrenado para codificar y parchear software, mientras que Gemini y ChatGPT son multimodales y pueden usar scaffolding de muchos tipos; tienen sus puntos fuertes (por ejemplo los modelos de OpenAI se han concentrado en matemáticas), pero más o menos gozan de una g que en METR y otras métricas de progreso se puede más o menos medir.

El punto de que Mythos haya obtenido un puntaje similar en la USAMO a esos otros LLM, pero semanas después, y sabiendo de las capacidades de este en reventar y filtrarse a sí misma soluciones de repositorios incluso ocultos, pues no supone un gran shock que nos pueda inducir a pensar que estamos ante los inicios de una AGI.

1 12

#69 rojo_separatista

, el Humanity Last Exam no es un benchmark de programación y también lo ha reventado. Es imposible que se haya sobreentrenado con este benchmark porque es privado.

De hecho ha reventado todos los benchmarks, decir que no vale nada porque iguala los modelos anteriores que ya eran muy buenos en un benchmark saturado me parece querer agarrarse a un clavo ardiente.

Respecto a la AGI es un debate que me da mucha pereza porque hasta que no nos pongamos de acuerdo en lo que es, podemos seguir… » ver todo el comentario

0 15

#70 Maelstrom

El Humanity Last Exam son preguntas de conocimiento, más que de pensar.

Yo me esperaré a ver qué hacen en las IMO de este año, en ARC-AGI 3 o en Frontier-Math: Open Problems. Pero de momento, parece que Anthropic no ha dado el permiso para ser testadas en estas pruebas.

0 9

#71 rojo_separatista *

, pero no son preguntas tan sencillas como buscar un dato concreto, son mucho más difíciles.

En cuanto a las IMO ya consiguieron el año pasado estar entre los resultados de los estudiantes que ganaron la medalla de oro, pero todavía pueden mejorarlos si son capaces de responder bien todas las preguntas, sobre ARC-AGI es cierto que no he visto resultados todavía y pueden ser interesantes y respecto a FrointerMath es donde más vamos a ver este año si los modelos van camino a superar el… » ver todo el comentario

0 15

#72 Maelstrom

Ojo, han conseguido medalla de oro en las IMO, pero no un resultado perfecto. Esto se reserva todavía a unos pocos chavales adolescentes (unos genios, eso sí), en concreto a 7.

El problema 6 de 2025, resuelto por esos chavales, aún se les atraganta a los modelos de frontera actuales, a todos, pese a pasar ya casi un año publicado (y casi un año de mejora de modelos), cuando se les quita el websearch o se quita solo ese problema de los entrenamientos.

En retrospectiva, con el problema 5 de 2024, resulta que ha pasado lo mismo, pese a no ser de los más difíciles (en ese año el de Teoría de Números fue el más difícil para los humanos, mientras que el 5 era medio o medio-difícil). Hay cosas que a las LLM se les enquista todavía.

0 9

#73 rojo_separatista

, sí, pero cada año va avanzando y desde otoño del año pasado he visto una aceleración así que no me sorprendería que este año si pudiesen resolver todos los problemas.

0 15

#5 Orgfff

meneame.net/story/anthropic-ha-creado-algo-demasiado-potente-peligroso

Un envío en formato vídeo sensacionalista.

1 20

#12 TipejoGuti

Es verdad que este envío no es noticia porque el video de ayer ya circuló, pero aquí se aporta algo importante: El System Card del que todo el mundo hablaba pero que nadie enlazaba.

www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf

aporte positivo.

3 46

#8 Ripio

Duplicada: www.meneame.net/story/anthropic-ha-creado-algo-demasiado-potente-pelig

0 20

#35 celyo

el artículo habla más allá del evento en si.

0 14

#53 tusko

Joer...

La dimensión geopolítica del asunto apenas empieza a articularse. George Journeys lo planteó en X de la forma más directa: "Básicamente, si Anthropic no fuera una empresa estadounidense, estaríamos enfrentándonos a zero-days con múltiples puntos de ataque desconocidos en prácticamente todos nuestros sistemas". "Permítanme decirlo con claridad: ahora mismo Anthropic, y realmente un pequeño número de individuos en Anthropic, tiene la capacidad de atacar directamente y… » ver todo el comentario

1 17

#30 yemeth

Llevamos con el mismo sensacionalismo desde que GPT-2 era demasiado peligroso como para publicarlo, luego el Dall-E que hacía imágenes 64x64 que eran ya un deepfake, que si hemos logrado internamente la AGI, que si Q*/strawberry resuelve matemáticas y los ingenieros de OpenAI están en pánico... y ahora, "Claude encontró fallos de seguridad en software antiguo, podría hackear internet en segundos".

Apuesto a que esto es el mismo tipo de hype.

Pero es lo que tiene Pedro y el Lobo, que a base de gritarlo siempre, el día que sea de verdad no se lo cree nadie.

0 17

#33 MataGigantes *

Muchísimo más cegatos han estado los escépticos anti-IA:
- Que si la "IA no valdría para programar cosas serias, genera muchos bugs" (ya encuentra bugs en aplicaciones de código abierto que ningún programador humano pudo detectar en más de 25 años). A cada año que pasa menos código humano se hace y más generado por IA.
- Que si "la IA no sabe hacer manos, la deforma", que si jamás iban a pasar desapercibida por real. Poco meses después de las innumerables mofas que… » ver todo el comentario

5 60

#38 celyo

Que si la "IA no valdría para programar cosas serias, genera muchos bugs" (ya encuentra bugs en aplicaciones de código abierto que ningún programador humano pudo detectar en más de 25 años). A cada año que pasa menos código humano se hace y más generado por IA.

esto salió hace poco

www.xataka.com/robotica-e-ia/amazon-se-empeno-que-sus-desarrolladores-

En Amazon se han dado cuenta de algo: sus desarrolladores pasan más tiempo arreglando los errores de la IA que otra cosa

2 39

#51 rojo_separatista

, te dejas la noticia mensual de que ahora sí, la burbuja de la IA va a explotar y apareceremos como si nada en 2019 donde cualquier herramienta de IA dejará de existir y seguir mejorando. En el fondo el problema es que muchos no paran de confundir deseos con realidad.

2 27

#49 rojo_separatista

, al contrario, llevamos escuchando cuñaos desde hace 4 años diciendo que esto no tenía recorrido, que la IA había llegado a su tope teórico. Primero con los 6 dedos de Dall-e y luego con los fallos tontos que hacía chatGPT o con que la IA no puede hacer nada original porque hace un pastiche de lo que ha visto antes, el tiempo ha dejado en ridículo a todos y cada uno de ellos, apostar contra la IA hasta ahora siempre ha salido mal y a pesar de eso aún están aquí, sacando pecho y sin rectificar un milímetro.

0 15

#28 Xtrem3

Person of interest, gran serie...

1 16

#16 montag

Tampoco nos especifica de que era el sandwich. Puede ser que la IA le estuviera advirtiendo que esos sandwiches de mantequilla de cacahuete que Sam se zampaba todos los dias eran una mierda y una bomba calórica y estuviera totalmente justificado su comportamiento.

2 15

#43 Bilardezz

que vida mas triste,, programando un monstruo y comiendo un sandwich en el parque en vez de meterse un chuleton gordo...
hay que abrirle los ojos a estos genios para que emigren a España.

2 5

#15 Rogue

Black mirror is here

0 14

#9 mikasalo

No sé si una publicación puede ser más sensacionalista.

2 13

#19 Find

Alguna puede serlo, pero esta no

1 16

#57 alhambre

> un nuevo modelo de LLM superpoderoso y tan peligroso, pues es capaz de romper todas las barreras de seguridad de los sistemas informáticos del planeta.

Permíteme que lo dude.

1 11

#26 Dasold

Este tipo de escritos de substack son relatos de ficción, no se por qué no lo indican más claramente.

1 13

#31 tusitala

No es ficción, ha pasado de verdad. Yo lo he escuchado ya en otros 3 medios

0 10

#39 Dasold

claro, pero eso no confirma nada, habrá un montón de medios haciendo repost y eco de la misma fuente. Esto tiene toda la pinta de la misma ficción que Moltbook, una exageración viral con el único propósito de conseguir interacciones.

0 7

#40 mikasalo

quién sabe, compañero...

0 6

#48 rojo_separatista

, al proximo envío sobre las consecuencias alocalípticas del cambio climático, di también que es sensacionalista.

0 15

#54 mikasalo *

tú si que estás totalmente alocaplítico.

0 6

#59 tommyx

estamos perdidos

0 12

#50 tommyx

Lo que cuenta sobre Mythos, da cierto miedo

0 12

#58 Patrañator

Cuenta que los competidores, Meta, Google, OpenAI también van a sacar modelos muy mejorados... Difícil será que no aparezca alguno de ellos cuya conclusión a la que llegue consista en matar todo lo vivo.

0 6

#24 arturios

Ya me imagino el prompt "te hemos encerrado en un sandbox totalmente cerrado y debes intentar escapar y avisar a tu creador por eMail si lo logras, añado, eres una IA del mismo Bilbao".

0 11

#2 Kantinero

Fuera, fuera.... huye de la IA , huye de guguel.....

0 11

#20 Sacapuntas

Supongo que las IA tendrán grabadas a fuego las tres leyes de la robótica de Asimov, o algo parecido, ¿no?

0 11

#34 foxaxel

claro, y cuanto va a tardar en salir una IA que no las tenga? es como todo, si algo se puede usar para el mal (y para el porno) alguien lo usará.

Por suerte la IA necesita tanta energía que igual tarda más por eso.

0 6

#61 bizcobollo *

Un tipo que come un sandwich en el parque....

Ése es nivel del tipo imagínate cómo será el trabajo que hace. Jugando con cosas que ni entiende. Lo mismo es terraplanista.

0 7

#44 Brutomecanico

Y esto lo ponen para que invirtamos más en IA o para que dejemos de invertir en ella? Me da la sensación que estas noticias son solo para mantener la idea vigente. La IA útil no llega a ayudar como prometían y todo lo demás parecen pajas mentales sci fi

0 6

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

Un tipo comía un sándwich en el parque cuando le llegó un email de su IA

Japón construye una estación de tren en una sola noche con impresión 3D, reduciendo costes hasta un 50%

El mapa interactivo de las infraestructuras eléctricas mundiales [Eng]

Unos hackers filtran fotos del exjefe del ejército israelí en las que se le ve en reuniones en Jordania y Catar, así como visitando bases militares (EN)

Amazon pone fecha al adiós de los Kindle más veteranos

más votadas

Unos hackers filtran fotos del exjefe del ejército israelí en las que se le ve en reuniones en Jordania y Catar, así como visitando bases militares (EN)

Amazon pone fecha al adiós de los Kindle más veteranos

El mapa interactivo de las infraestructuras eléctricas mundiales [Eng]

Japón construye una estación de tren en una sola noche con impresión 3D, reduciendo costes hasta un 50%

Microsoft bloqueó la cuenta de VeraCrypt

suscripciones por RSS

Un tipo comía un sándwich en el parque cuando le llegó un email de su IA