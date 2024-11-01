edición general
TRANSFORMER EXPLAINER - Visualizador gráfico de cómo funciona un LLM internamente

A raíz de las conversaciones sobre cómo funciona internamente la IA (refiriéndonos a ChatGPT, etc), que son modelos LLM, os comparto este repositorio divulgativo que explica de manera gráfica e interactiva cómo funciona la arquitectura Transformer, que es la pieza básica de un LLM. Aquí podréis observar en detalle en que consiste el cálculo probabilístico del siguiente token a generar, base del funcionamiento.

#1 nalacily
El transformer es solamente un componente de la red neuronal. Sería más interesante explicar cómo funciona una red neuronal, porque la gran mayoría de la gente no lo sabe.

Aparte de eso, un LLM es un montaje realizado usando redes neuronales como componentes, pero también hay más cosas. Sería aún más interesante explicar qué es un LLM, porque tengo observado que los creyentes en la IA que corren por aquí, pues no lo saben. Es alucinante pero va en serio que no lo saben.
#2 TikisMikiss
#1 Para aprender todo lo que comentas hay especializaciones en Coursera muy buenas.

Para lo demás, pues es como todo, el 99% de la gente se va a quedar con lo mínimo o puede echar un ojo a alguna explicación divulgativa algún día por curiosidad, pero poco más. Es normal.
#3 pip
#1 bueno, realmente esta simulación (con código real) recoge una buena parte del núcleo de un LLM, los transformers y la red neuronal posterior. Puedes introducir un prompt de ejemplo y expandir con el ratón cada paso viendo los vectores, matrices, etc, y atendiendo a las explicaciones comprender por qué procesos se pasan hasta generar la lista de tokens de salida más probables y cómo elige uno. Aunque sea incompleto, sinceramente no he encontrado en ningún sitio una explicación más gráfica e interactiva que ésta.

Para un programador que quiera comprender el funcionamiento sin entrar en papers matemáticos y sin aspirar a programar su propio LLM (aunque en el repositorio está el código), esto es oro puro... IMHO.
