Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

21 meneos

796 clics

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

A continuación, una lista de algunas de las preguntas típicas con que se puede probar en plan rápido cualquier nueva versión de un LLM y hacerla fallar miserablemente, cuestionando si realmente ha mejorado, es tan potente como dicen o qué narices pasa en esas «cajas negras». Ojo que hasta ChatGPT-5 parece estar fallando en alguna de ellas, por infantiles que parezcan, concretamente en la comparación numérica y en la «prueba blueberry», aunque depende de quién te lo cuente, porque a mi me ha funcionado.

17 4 0 K 33

27 comentarios

17 4 0 K 33

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

"Esto va demasiado rápido": la velocidad de escape de la IA sorprende a sus propios creadores

BYD presenta la batería Blade 2.0 y rompe el mercado

Empresa de satélites pausa sus imágenes tras revelar los ataques de Irán a bases estadounidenses (EN)

La IA ya está aprendiendo a encontrar fallos en el software: Claude acaba de demostrarlo con Firefox

ECH, la mejora del cifrado web creada por Cloudflare y Apple que frustró los bloqueos de LaLiga, ya es un estándar oficial

más votadas

Empresa de satélites pausa sus imágenes tras revelar los ataques de Irán a bases estadounidenses (EN)

BYD presenta la batería Blade 2.0 y rompe el mercado

La Unión Europea zanja el debate: la baliza V-16 será legal también fuera de España

La IA ya está aprendiendo a encontrar fallos en el software: Claude acaba de demostrarlo con Firefox

"Esto va demasiado rápido": la velocidad de escape de la IA sorprende a sus propios creadores

suscripciones por RSS

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales