Tecnología, Internet y juegos
3 meneos
80 clics
Nuestra evaluación de las capacidades cibernéticas de Claude Mythos Preview | AISI Work [EN]

Nuestra evaluación de las capacidades cibernéticas de Claude Mythos Preview | AISI Work [EN]

Realizamos evaluaciones cibernéticas de la versión preliminar de Claude Mythos de Anthropic y encontramos una mejora continua en los desafíos de captura de la bandera (CTF) y una mejora significativa en las simulaciones de ciberataques de múltiples pasos.

| etiquetas: mythos , anthropic , captura de la bandera
Hemos estado monitorizando las capacidades cibernéticas de la IA desde 2023, creando evaluaciones cada vez más exigentes para mantenernos al día con el progreso de la IA: desde sondeos basados en chat hasta desafíos de captura de bandera, pasando por las simulaciones de ciberataques de múltiples pasos que se describen a continuación. Hace dos años, los mejores modelos disponibles apenas podían completar tareas cibernéticas de nivel principiante. Ahora, en evaluaciones controladas…   » ver todo el comentario
#1 Perdón por el negativo. Estoy con el móvil, ya te lo compensaré, en otro comentario.

menéame