Tecnología, Internet y juegos
21 meneos
794 clics
Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

A continuación, una lista de algunas de las preguntas típicas con que se puede probar en plan rápido cualquier nueva versión de un LLM y hacerla fallar miserablemente, cuestionando si realmente ha mejorado, es tan potente como dicen o qué narices pasa en esas «cajas negras». Ojo que hasta ChatGPT-5 parece estar fallando en alguna de ellas, por infantiles que parezcan, concretamente en la comparación numérica y en la «prueba blueberry», aunque depende de quién te lo cuente, porque a mi me ha funcionado.

| etiquetas: preguntas trampa , llm , ia , inteligencia artificial , chatgpt

menéame