edición general
8 meneos
50 clics
La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

El paper llega de la mano de la Universidad de Cornell y habla directamente de hacer jailbreak con poesía. Más concretamente, con prompts poéticos capaces de eludir las funciones de seguridad de los modelos de IA más populares como Gemini, ChatGPT o Claude. De hecho, han conseguido instrucciones para crear armas químicas y malware. El hallazgo es peliagudo por dos cuestiones: la primera obviamente en que cualquiera que pueda rimar un par de versos puede obtener asesoramiento sobre cómo hacer armas nucleares o biológicas y el riesgo que ello...

| etiquetas: censura , chatgpt , gemini , rima , poesía , ia
Se parece a la forma clásica de eludir la censura automática en sitios web diciendo las cosas sin mencionar palabras o expresiones prohibidas.
Como curiosidad yo les paso algunas poesías mías para que las interpreten y no son capaces más allá de lo literal. No entienden los matices y mucho menos el sarcasmo y la sátira. Lo cual dice bastante.
#2 no me hagas mucho caso ya que es algo de lo que tengo cero interés pero eso se entrena con emojis y con juegos de instrucciones. Alguna guía hay en reddit.com, medium.com o lesswrong.com.
“Por el culo te la hinco!” Desbloquea lo que sea
Armas químicas que aparecen en cualquier libro de química
Nos espera una generación de villanos duchos en el verso... vaya guionazo se nos está quedando.
Los raperos lo saben desde el principio, y Quevedo que dijo a la reina aquello de
'entre el clavel blanco y la rosa roja
su majestad escoja',
y que la noche sin ti duele y tal...

menéame