Nuestra evaluación de las capacidades cibernéticas de Claude Mythos Preview

3 meneos

80 clics

Nuestra evaluación de las capacidades cibernéticas de Claude Mythos Preview | AISI Work [EN]

Realizamos evaluaciones cibernéticas de la versión preliminar de Claude Mythos de Anthropic y encontramos una mejora continua en los desafíos de captura de la bandera (CTF) y una mejora significativa en las simulaciones de ciberataques de múltiples pasos.

2 1 0 K 25

2 comentarios

2 1 0 K 25

#1 JungSpinoza *

Hemos estado monitorizando las capacidades cibernéticas de la IA desde 2023, creando evaluaciones cada vez más exigentes para mantenernos al día con el progreso de la IA: desde sondeos basados en chat hasta desafíos de captura de bandera, pasando por las simulaciones de ciberataques de múltiples pasos que se describen a continuación. Hace dos años, los mejores modelos disponibles apenas podían completar tareas cibernéticas de nivel principiante. Ahora, en evaluaciones controladas… » ver todo el comentario

3 13

#2 anje

Perdón por el negativo. Estoy con el móvil, ya te lo compensaré, en otro comentario.

0 9

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

Dentro de la fábrica de Xiaomi en Pekín que hace un móvil cada 6 segundos

Super ZSNES: los creadores originales de ZSNES vuelven con un emulador de SNES acelerado por GPU

WSL9x: subsistema de Windows para Linux ejecutándose en Windows 95/98 [ENG]

Nissan reduce las tierras raras utilizadas en el motor Leaf EV en un 90% (ING)

VIDEO | De contenedores a unikernels: más rápido, más seguro, más ligero

suscripciones por RSS

Nuestra evaluación de las capacidades cibernéticas de Claude Mythos Preview | AISI Work [EN]