15 meneos
117 clics
Publicaron un nuevo método de razonamiento para la IA
Análisis del paper "Think Anywhere in Code Generation" (Xue Jiang et al., Peking University / Alibaba Group). Un nuevo paradigma de Test-Time Compute que permite a los LLMs desplegar tokens de razonamiento en zonas de alta entropía durante la inferencia.
|
Evidentemente los hace mucho más lentos pero se reducen en gran medida las alucinaciones
La diferencia de este paper frente al Chain-of-Thought clásico es que el razonamiento/pensamiento no tiene por qué concentrarse solo antes de generar la respuesta final. Puede aparecer de forma intercalada durante la generación del código, justo en los puntos donde el modelo detecta… » ver todo el comentario