Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño

7 meneos

55 clics

Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño

La seguridad de los modelos de lenguaje vuelve a estar bajo escrutinio. Un estudio conjunto de Anthropic, el UK AI Security Institute y el Instituto Alan Turing concluye que un ataque de envenenamiento de datos (data poisoning) puede implantarse en un modelo de lenguaje con un número casi constante de documentos maliciosos, alrededor de 250, sin importar el tamaño del modelo ni el volumen del corpus limpio con el que se entrena. El hallazgo desafía una asunción muy extendida en la comunidad: que el atacante debe controlar un % relevante...

5 2 0 K 97 tecnología

2 comentarios

5 2 0 K 97 tecnología

#2 R2dC

Vaaaaaaaya por dios... entonces tendrán que empezar a revisar la información que le meten al modelo de IA y no darle comida de forma indiscriminada como si fuese un gremlin

0 10

#1 khalil

Perfectamente creible dado el funcionamiento de estos trastos.

Pero no es necesario unos datos creados a propósito para fastidiar el invento. Una red neuronal tiene en cuenta todos los datos que se ha tragado. Como que no los entiende, no puede discriminar entre unos y otros.

Ahora imaginaos que una IA se traga el contenido de los comentarios de menéame, ¿qué podría salir mal?

0 6

cultura y tecnología

más visitadas

Apps imprescindibles de software libre para Android: potencia tu privacidad y seguridad

Chindogu: Los inventos inútiles de Kenji Kawakami

Anthropic revela cómo "envenenar" una IA para alterar sus respuestas

Mucho más que un palacio: tecnología punta revela la enorme ciudad oculta en torno a Medina Azahara

La inteligencia artificial arma un lío en la Universidad de Oviedo (y lo hace dos veces): aulas saturadas, asignaturas en el mismo horario...

más votadas

Guillermo Toledo: "No hay nada mejor que un actor comunista para hacer de fascista"

Julio Llamazares: "Muchos jóvenes dicen por ignorancia que la guerra o la dictadura no fueron para tanto"

China endurece el pulso: nuevas restricciones a 12 de las 17 tierras raras elevan el riesgo de otra ola de precios en hardware

El historiador que ha estudiado cómo el nazismo lo corrompió todo: "Hoy es un milagro que las democracias resistan"

La inteligencia artificial arma un lío en la Universidad de Oviedo (y lo hace dos veces): aulas saturadas, asignaturas en el mismo horario...

suscripciones por RSS

Anthropic enciende las alarmas: «basta con 250 documentos» para envenenar un modelo de IA, independientemente de su tamaño