Hace 6 años | Por --23457-- a medium.com
Publicado hace 6 años por --23457-- a medium.com

La mayor parte del progreso llevado a cabo en los últimos años en el deep learning aplicado a la visión artificial se debe a únicamente a un pequeño grupo de arquitecturas de redes neuronales: VGG16, VGG19, ResNet50, Inception v3, Xception y MobileNet.

Dejando a parte las matemáticas, el código y los detalles de implementación, el artículo explora una cuestión simple: ¿Cómo y por qué funcionan esos modelos?

Las redes VGG siguen la estructura básica de las redes de convolución y MobileNet es esencialmente una versión de Xception para aplicaciones móviles. Las tres restantes, sin embargo, redefinen nuestra visión de las redes neuronales. El post se centra en el planteamiento subyacente a las arquitecturas ResNet, Inception y Xception y en por qué se han convertido en los elementos básicos de tantos proyectos de visión artificial.