#1 Esta es una síntesis de los puntos clave de la visión de Yann LeCun y su arquitectura JEPA (Joint-Embedding Predictive Architecture):
1. El problema de los modelos actuales (LLMs)
Yann LeCun, pionero de la IA, sostiene que los modelos de lenguaje actuales (como ChatGPT) tienen limitaciones fundamentales:
Son puramente generativos y autorregresivos: Predicen el siguiente token o píxel, lo cual funciona en texto pero falla en video.
El problema de la "borrosidad": Al intentar predecir píxeles en un video, debido a la incertidumbre (hay infinitas posibilidades de lo que puede pasar después), los modelos generativos promedian los resultados y producen imágenes borrosas e inservibles.
#1 Esta es una síntesis de los puntos clave de la visión de Yann LeCun y su arquitectura JEPA (Joint-Embedding Predictive Architecture):
1. El problema de los modelos actuales (LLMs)
Yann LeCun, pionero de la IA, sostiene que los modelos de lenguaje actuales (como ChatGPT) tienen limitaciones fundamentales:
Son puramente generativos y autorregresivos: Predicen el siguiente token o píxel, lo cual funciona en texto pero falla en video.
El problema de la "borrosidad": Al intentar predecir píxeles en un video, debido a la incertidumbre (hay infinitas posibilidades de lo que puede pasar después), los modelos generativos promedian los resultados y producen imágenes borrosas e inservibles.
Falta de "sentido común": Los LLMs no entienden el… » ver todo el comentario