La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]

18 meneos

91 clics

La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]

El ejecutivo tuvo que apagar manualmente la IA para impedir que el bot siguiera borrando datos (...) Como muchos otros entusiastas, Yue tenía una configuración con un Mac Mini y OpenClaw ejecutándose en él para diversas tareas. Mientras Claw archivaba correos electrónicos antiguos de algunas cuentas, ella también le pidió que «revisara también esta bandeja de entrada y le sugiriera qué archivar o eliminar, sin tomar ninguna medida hasta que yo se lo indicara» (sic; énfasis nuestro). Claw comenzó a borrar toda la bandeja de entrada.

15 3 0 K 330 tecnología

20 comentarios

15 3 0 K 330 tecnología

Comentarios destacados:

#3 cenutrios_unidos

Ja, ja, ja....JA JA JA JA Claw ¡TIRA DEL CABLE! ¡TIRA DEL CABLE!

2 35

#4 Torrezzno

Quien lo iba a saber? Ya veo a la gente dandole acceso de root y que sea imposible de hacerle sigterm

0 20

#18 XXguiriXX

Pues sí, con el modelo de agentes pasaría eso. Cada agente está encargado de una tarea, y uno de ellos podría hacer una chapuza como la que me pasó con ChatGPT. Y claro, al final es responsabilidad del humano darse cuenta de ello

0 15

#5 Troll_hunter

Ojo que estos experos inversores y hombres de negocios, lo están apostando todo a esto. Capitalismo poético.

1 13

#1 Pablosky

Al final pudo salvar parte de su correo, apagando todos los procesos de la IA en el Mac

0 13

#2 Pablosky

mencionan una cosa interesante en el artículo, tú le puedes decir al principio “ni de coña hagas esto”, pero si se le acaba el contexto y tiene que resumir lo que lleva de momento para que pueda seguir trabajando… pues lo mismo no entra en el resumen esa instrucción inicial.

Vamos, que además de alucinar es como si tuvieran demencia senil. Cada día más útiles.

5 62

#7 TikisMikiss *

Esas instrucciones tienen que ir externas para que sean comprobables siempre de forma adicional. No pueden depender únicamente del contexto inicial que puede ser resumido.

0 11

#17 eltoloco *

una cosa parecida que me ha ocurrido trabajando en integraciones con LLMs es que al ponerle una instrucción negativa en el prompt, por ejemplo: "No aceptes X", aceptaba más veces lo que le decía en X que si no se lo ponía. Y esto lo validé con un test A/B separando los datos en dos grupos iguales, de varias miles de muestras cada uno, en un prompt con la instrucción negativa y en el otro sin ella, y lo confirmé. Y tiene todo el sentido del mundo, porque estás… » ver todo el comentario

0 11

#19 TikisMikiss

Tener que eliminar toda forma de revisión humana lo veo complicado, pero lo de evitar "no hacer X" usando varias capas de verificación y que haya restricciones en los cambios que son independientes del contenido del contexto sí se puede hacer.

0 12

#20 eltoloco *

yo solo te cuento mi experiencia con integración de LLMs via API oficial, en este caso era Gemini vía VertexAI pero podría ser cualquier otra. En la sección de las instrucciones principales del prompt se ponen todos los requisitos, e hice la prueba exactamente con el mismo prompt que teníamos en producción, poniendo y quitando una línea con una instrucción negativa, y el resultado fue que había un porcentaje de error apreciablemente inferior quitando esa instrucción. Al final lo que hicimos… » ver todo el comentario

0 11

#9 Mangione *

Y, la casualidad, que es precisamente una de las cosas que comentaba aquí: www.meneame.net/story/amazon-enfrenta-caida-13-horas-aws-tras-cambios-
Pero es que además da igual que las órdenes estén en la ventana de contexto porque, igualmente, el modelo puede saltárselo a la torera ya que cada vez que el modelo predice autoregresivamente hay una posibilidad nada desdeñable de que el modelo infiera algo completamente contrario a la… » ver todo el comentario

4 57

#13 Pablosky *

bueno, es un directivo, no un ingeniero. Lo que has puesto en negrita es 100% correcto.

1 22

#10 XXguiriXX

Y no van mejorando. Me pasó ayer con ChatGPT. Le paso un imagen y le pido que extraiga el texto. Sólo extrae un par de oraciones. Le digo que falta texto por extraer, se disculpa, y vuelve a sacarme el mismo resultado

Por suerte hay muchas alternativas.

2 39

#12 rafeame

eso mismo me pasaba con Nano Banana. A lo primero hace cambios pero a poco que quería matizar o indicar algo que faltaba me devolvía la misma imagen una y otra vez. Mucho hype (justificado) pero esto me hacía quitarle muxhos puntos.

1 19

#14 Ferran

El truco es descargar la imagen y volver a empezar, pero es muy frustrante, sí.

0 12

#16 Malinke

el tema es si le pides que sobre el texto extraído haga otra tarea, se va empeorando el resultado, no te fijas y das por bueno el resultado.

0 11

#11 Tensk

No llamemos "alucinar" a lo que es realmente "cometer una cagada del quince". Es un eufemismo de aquellos hipnotizados por la IA que creen que piensa.

0 10

#6 Sacapuntas

¡Vaya! Al final la inteligencia artificial también puede fallar como la inteligencia natural de su antigua secretaria.

0 10

#8 Robus

Pero si hubiese fallado la secretaria él podría enfadarse, pegarle la bronca y despedirla... ahora debe asumir que es culpa suya.

Creo que el puesto de secretaria está salvado, al menos de secretaria de jefes gordos.

1 22

#15 Ferran

Hasta que inventen las robopilinguis

0 12

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

VÍDEO | Un padre da una paliza al asesino de su hijo de 16 años en el juzgado

Bravo Murillo, la calle de Madrid construida como un experimento social con una acera pobre y otra rica… que salta a la vista

La trama política del 23-F y las listas para fusilar inmediatamente: escritores, músicos, artistas y periodistas

I torneo de ajedrez de menéame

Aguirre y Lacalle: la entrevista de dos tontos muy tontos

más votadas

El primer marido y mentor de Ayuso dio un pelotazo con la Comunidad de Madrid: se llevó 93.958,90€ que le permitió tapar agujeros

Una de cada tres viviendas públicas investigadas en Alicante no tiene a nadie empadronado

La propuesta de Rufián de un frente común de la izquierda amenaza la mayoría absoluta de PP y Vox

Los motivos de la jueza para pedir imputar a Mazón: una "sobremesa interminable" mientras la población sufría un "auténtico infierno"

I torneo de ajedrez de menéame

suscripciones por RSS

La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]