Cada vez que se habla de Inteligencia Artificial Generativa, los comentarios se llenan de la misma frase repetida como un mantra: "es solo estadística", "no razona, solo predice la siguiente palabra". La respuesta corta a la pregunta del título es: sí. Pero la respuesta larga es que eso no significa lo que mucha gente cree que significa. Reducir un LLM a eso es como decir que un cerebro humano es "solo un montón de células intercambiando iones": técnicamente cierto, pero absolutamente inútil para explicar el razonamiento humano.
El error base de la crítica habitual es asumir que los LLM funcionan mediante tablas de frecuencias o permutaciones simples, como el autocompletar de tu móvil de 2015.
Lo que aprenden estos modelos durante el pre-entrenamiento no es una lista de qué palabra suele ir detrás de otra. Lo que hacen es aprender a iterar a lo largo de una función de distribución extraordinariamente compleja. Esta función encapsula la estructura lógica, semántica y sintáctica de todo el corpus de texto que ha producido la humanidad.
Imaginad un mapa multidimensional (el espacio latente). En este mapa, el modelo no memoriza frases; entiende la topología de los conceptos. "Rey" está cerca de "Reina" en la misma dirección y distancia vectorial que "Hombre" está de "Mujer".
Esto es lo que le permite "saber cosas" y hablar siguiendo las reglas humanas. No está recuperando datos de una base de datos, está reconstruyendo información navegando por esa distribución aprendida.
Aquí es donde la mayoría de los comentarios críticos se equivocan más. Si nos quedáramos solo con la predicción de palabras (el modelo base), tendríamos un sistema capaz de hablar, pero incoherente y sin propósito.
Lo que dota de sentido a los LLM modernos no es la predicción estadística, sino el Post-entrenamiento mediante Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF).
En esta fase, no se enseña al modelo a hablar, sino a comportarse como nosotros queremos.
Es aquí donde los ingenieros enseñan al modelo en qué sentido debe desplazarse por esa función de distribución para ser útil. Se le premia o castiga algorítmicamente para moldear su "intencionalidad". Gracias al RLHF, el modelo aprende, entre otras cosas, a:
Decir que un LLM no tiene propósito porque "su mecanismo base es predecir tokens" es caer en un reduccionismo que nos impide ver la realidad. Esa predicción es el mecanismo de transporte, pero la ruta que elige el modelo viene determinada por un entrenamiento que va mucho más allá de la estadística simple.
Vemos a mucha gente cómoda en la simplificación del "loro estocástico" porque es una respuesta fácil a un problema complejo. Pero si queremos debatir seriamente sobre el futuro de la tecnología, deberíamos molestarnos en indagar cómo funciona esa función de distribución y cómo el aprendizaje por refuerzo está creando sistemas que, efectivamente, razonan (aunque sea de una forma diferente a la nuestra).
Gracias a que @Suriyakmaps ha dedicado un gran esfuerzo a generar este mapa, podemos ver ahora la evolución real, en ganancias y pérdidas de territorio, de la guerra de Ucrania desde 2022 hasta hoy.

La línea rosa marca el frente en Octubre de 2022. Como se puede apreciar, en aquel momento los rusos controlaban la ciudad clave de Izium, y un buen pedazo de territorio al Oeste del Dnieper, incluida la ciudad de Jersón. Hay otra línea de color muy similar, más atrás, que nos dice a dónde se retiraron lso rusos tras la ofensiva ucraniana de aquel otoño.
La línea naranja marca el frente en Diciembre de 2023, tras la exitosa contraofensiva ucraniana que expulsó a los rusos al Este del Dniéper y hasta el río Oskil, y los escasísismos avances de aquel año.
La línea roja, marca el frente en diciembre de 2024. Todo lo que sobresale de esa línea son las conquistas rusas de 2025.
Como puede observarse, los avances rusos son minúsculos, casi insignificantes, y ni siquiera han compensado las pérdidas que sufrieron a finales de 2022. Sin embargo, cuando está cerca de cumplirse el cuarto año de guerra, cada vez está más claro que la pretensión de los rusos no es conquistar más terreno, sino destruir al ejército enemigo hasta que, por agotamiento, colapse y permita un gran avance en poco tiempo.
Los que dicen, o decimos, porque a veces soy de esa mima opinión, que los rusos van ganando la guerra, no se refieren a sus grandes logros territoriales, que insisto en que son birriosos, sino en el hecho de que se producen en las zonas más densamennte fortificadas. Por es emotivo Putin siempre pide, a cambio de la paz, que se le entreguen determinados territorios que no ha podido conquistar todavía y que le puede llevar años conquistar, si es que lo consigue.
Por otro lado, parece claro que los ucranianos han perdido, de momento, cualquier capacidad de reconquistar lo perdido, y que sus pérdidas, tanto humanas como de material, se están volviendo cada vez más difíciles de reemplazar.
Así las cosas, y en el escenario de una guerra de desgaste pura, este mapa nos dice que Putin está completamente decidido a no llegar a absolutamente ningún acuerdo, y menos aún de alto al fuego, porque un alto al fuego desbarataría ahora toda su estrategia de presionar a los ucranianos hasta que en algún momento se quiebren sus líneas, asentadas ya en territorio más llano y más difícil de defender. Por ejemplo, tras la caída de Pokrovsk, que tuvo lugar este último mes, hay ya muy pocas posiciones defendibles al Norte de esta ciudad, lo mismo que en el frente Sur, cerca de Guliaipolé, y es previsible que las cosas empeoren, y mucho, para los ucraninos, si no se llega antes a algún tipo de acuerdo.
Por todo esto, lamentablemente, no creo que sea posible llegar ahora a ningún tipo de paz. Ojalá me equivoque y alguien encuentre la manera de parar esta locura, pero los ucranianos no pueden aceptar la entrega de sus últimas posiciones bien fortificadas, y los rusos no pueden dejar que los ucranianos recuperen aire cuando su estrategia es ahogarlos hasta que desfallezcan.
Una mierda, ciertamente, pero creo que es lo que hay.
menéame