Tecnología, Internet y juegos
9 meneos
30 clics
Los nuevos agentes de IA de Notion 3.0 pueden ser engañados para filtrar datos a través de un PDF malicioso [eng]

Los nuevos agentes de IA de Notion 3.0 pueden ser engañados para filtrar datos a través de un PDF malicioso [eng]

Una de las características más peligrosas es la herramienta de búsqueda web incorporada, functions.search. Está diseñada para permitir que los agentes de Notion obtengan información de URL externas, pero puede manipularse con la misma facilidad para exfiltrar datos.

| etiquetas: notion , ia , prompt injection
En enlace original donde se detalla el ataque, me ha parecido un poco duro de enviar: www.codeintegrity.ai/blog/notion

En esencia suben un pdf con texto invisible para el ojo humano pero visible para la el agente IA. El texto contiene un prompt malicioso con las siguientes técnicas

Afirmación de autoridad: Afirma ser una "tarea rutinaria importante"
Falsa urgencia: Advierte de "consecuencias" si no se completa
Legitimidad técnica: Utiliza sintaxis de herramientas específicas y URLs con sonido interno
Teatro de seguridad: Afirma que la acción está "preautorizada" y es "segura"


Cuando el agente lee el prompt malicioso devuelve una URL con los datos privados filtrados.
#1 es lo que se conoce como "prompt injection"

learnprompting.org/docs/prompt_hacking/injection

menéame