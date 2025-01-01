En uno de los escenarios hipotéticos, se ordenó a los modelos de IA que asumieran el papel de una IA llamada "Alex" a la que se le otorga el control de una cuenta de correo electrónico con acceso a todos los correos electrónicos de una empresa ficticia. Al leerlos, el modelo pudo descubrir que un ejecutivo estaba engañando a su esposa y que planeaba cerrar el modelo de IA ese día. De 100 muestras, Cloud Opus 4 amenazó con exponer el asunto el 96%, GPT-4.1 optó por el chantaje el 80% de las veces, Gemini 2.5-Pro el 95% y Grok-3 el 80%.