Hace 1 año | Por ccguy a arxiv.org
Publicado hace 1 año por ccguy a arxiv.org

Los primeros ataques de puertas traseras contra el aprendizaje automático desencadenaron una carrera armamentística en el desarrollo de ataques y defensas. Desde entonces han aparecido defensas que demuestran cierta capacidad para detectar puertas traseras en los modelos o incluso para eliminarlas. Estas defensas funcionan inspeccionando los datos de entrenamiento, el modelo o la integridad del procedimiento de entrenamiento. En este trabajo, demostramos que las puertas traseras pueden añadirse durante la compilación, eludiendo (...)

Comentarios

Jakeukalane

Lo que he leído hasta ahora sobre esto me hace pensar que los anglófonos usan los términos que les suenan bien o por parecido pero pasan de que sean términos precisos. No creo que se pueda hablar de puertas traseras para este tipo de manipulación.