La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

8 meneos

50 clics

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

El paper llega de la mano de la Universidad de Cornell y habla directamente de hacer jailbreak con poesía. Más concretamente, con prompts poéticos capaces de eludir las funciones de seguridad de los modelos de IA más populares como Gemini, ChatGPT o Claude. De hecho, han conseguido instrucciones para crear armas químicas y malware. El hallazgo es peliagudo por dos cuestiones: la primera obviamente en que cualquiera que pueda rimar un par de versos puede obtener asesoramiento sobre cómo hacer armas nucleares o biológicas y el riesgo que ello...

7 1 0 K 129 tecnología

7 comentarios

7 1 0 K 129 tecnología

#5 Gry

Se parece a la forma clásica de eludir la censura automática en sitios web diciendo las cosas sin mencionar palabras o expresiones prohibidas.

1 29

#2 Torrezzno

Como curiosidad yo les paso algunas poesías mías para que las interpreten y no son capaces más allá de lo literal. No entienden los matices y mucho menos el sarcasmo y la sátira. Lo cual dice bastante.

1 29

#6 parladoiro *

no me hagas mucho caso ya que es algo de lo que tengo cero interés pero eso se entrena con emojis y con juegos de instrucciones. Alguna guía hay en reddit.com, medium.com o lesswrong.com.

0 10

#1 ChatGPT

“Por el culo te la hinco!” Desbloquea lo que sea

1 21

#3 Afro

Armas químicas que aparecen en cualquier libro de química

0 20

#4 Forni

Nos espera una generación de villanos duchos en el verso... vaya guionazo se nos está quedando.

0 10

#7 MoñecoTeDrapo *

Los raperos lo saben desde el principio, y Quevedo que dijo a la reina aquello de
'entre el clavel blanco y la rosa roja
su majestad escoja',
y que la noche sin ti duele y tal...

0 10

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

[Pantomima Full] Evento de empresa

Menéame cumple 20 años

Agricultura señala que el brote de peste porcina salió del laboratorio de Bellaterra

"Cojonudo": la respuesta en WhatsApp de Mazón a la consellera Pradas en plena dana antes de irse a comer a El Ventorro

El primer TIRO EN LA NUCA no fue ETA, fueron los curas (Nieves Concostrina)

más votadas

Privatizar la sanidad mata. Lo dicen los datos

Reyerta en el clan Ribera

La dirección del hospital de Torrejón modificó el triaje en Urgencias para calificar como leves a pacientes graves

El presidente de RTVE acusa a Israel de 'maniobrar en la sombra durante meses' para seguir en Eurovisión y califica de 'farsa' la votación de la UER

Miles de jóvenes protestan en Alemania en contra del regreso de la mili

suscripciones por RSS

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación