La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

128 meneos

1577 clics

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

El paper llega de la mano de la Universidad de Cornell y habla directamente de hacer jailbreak con poesía. Más concretamente, con prompts poéticos capaces de eludir las funciones de seguridad de los modelos de IA más populares como Gemini, ChatGPT o Claude. De hecho, han conseguido instrucciones para crear armas químicas y malware. El hallazgo es peliagudo por dos cuestiones: la primera obviamente en que cualquiera que pueda rimar un par de versos puede obtener asesoramiento sobre cómo hacer armas nucleares o biológicas y el riesgo que ello...

43 85 0 K 274

85 comentarios

43 85 0 K 274

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

Condiciones para entrar en Volkswagen Valencia: dos meses en China, doble pago por horas extras y turnos americanos

La denuncia contra Digi que podría cambiar lo que pagas por internet

Ante el regreso de las baterías extraíbles, los fabricantes han encontrado un clavo ardiendo al que agarrarse para que nada cambie

Menéame se desengancha de las plataformas estadounidenses

Esta startup de Alberta vende tractores sin tecnología a mitad de precio [ENG]

suscripciones por RSS

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación