Anthropic revela cómo "envenenar" una IA para alterar sus respuestas
Anthropic publicó un estudio que detalla lo sencillo que es envenenar modelos de IA (como Claude) para crear puertas traseras
etiquetas
:
anthropic
,
claude
,
puerta trasera
tecnología
#2
Pacman
Absurdamente simple.
Y es un ejemplo para demostrar que no son inteligentes.
#1
Torrezzno
*
El paper:
www.anthropic.com/research/small-samples-poison
Y es un ejemplo para demostrar que no son inteligentes.