Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño

9 meneos

69 clics

Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño

La seguridad de los modelos de lenguaje vuelve a estar bajo escrutinio. Un estudio conjunto de Anthropic, el UK AI Security Institute y el Instituto Alan Turing concluye que un ataque de envenenamiento de datos (data poisoning) puede implantarse en un modelo de lenguaje con un número casi constante de documentos maliciosos, alrededor de 250, sin importar el tamaño del modelo ni el volumen del corpus limpio con el que se entrena. El hallazgo desafía una asunción muy extendida en la comunidad: que el atacante debe controlar un % relevante...

7 2 2 K 12

6 comentarios

7 2 2 K 12

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

La última condena de las teles de LG es instalar por defecto Microsoft Copilot y que no se pueda desinstalar

Kingston activa la alarma: “El coste de la memoria NAND ha subido un 250%, en 2026 subirá más, nunca hemos visto algo así en 29 años de historia»

Mozilla nombra nuevo CEO, Firefox evolucionará a un "navegador de IA moderno" [eng]

China lidera la investigación en el 90% de las tecnologías cruciales: un cambio drástico en este siglo [EN]

El Gobierno autoriza la compra del 89,68% de Hispasat por parte de Indra por 725 millones de euros

más votadas

Kingston activa la alarma: “El coste de la memoria NAND ha subido un 250%, en 2026 subirá más, nunca hemos visto algo así en 29 años de historia»

El Gobierno autoriza la compra del 89,68% de Hispasat por parte de Indra por 725 millones de euros

Mozilla nombra nuevo CEO, Firefox evolucionará a un "navegador de IA moderno" [eng]

La última condena de las teles de LG es instalar por defecto Microsoft Copilot y que no se pueda desinstalar

Leapmotor confirma que fabricará cuatro modelos de coches eléctricos en la planta de Stellantis en Zaragoza

suscripciones por RSS

Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño