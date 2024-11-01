A muchas personas ya les ha pasado: le preguntan algo a un sistema de inteligencia artificial, como ChatGPT u otros similares, y reciben una respuesta larga, convincente… pero falsa. Este fenómeno tiene un nombre: alucinaciones de la IA. No hablamos de visiones ni sueños, sino de momentos en los que la máquina se “inventa” información que parece cierta, pero no lo es. Un estudio reciente de OpenAI explica que esto no es un fallo técnico puntual, sino una consecuencia de cómo están diseñados estos sistemas.
| etiquetas: alucinaciones , intelingencia artificial , estudio , openai , chatgpt , ia
Y eso es un torpedo en la linea de flotación de quienes pretenden sustituir a los humanos por IA, ya que si la IA comete errores, y peor aún, no se da cuenta de ello, necesitas que la supervisen.
Yo sospecho que en algún momento habrá un cierto "desencanto" con este tema, en el sentido de que acabará como una herramienta útil cuando se usa bien, pero se dejarán de ver como un oráculo mágico con poderes misteriosos.
No he dicho que sea perfecto, pero las respuestas son menos "imaginativas"(pueden ser una mierda igual, pero al menos, inventa menos)
Tú mismo has descrito muy bien como funciona el chisme este. Aunque lo cierto se le nota mejorar las respuestas día a día, pero aunque yo lo uso bastante, no pillo una respuesta suya sin comprobarla en la medida de lo posible.
Y lo de preguntar con detalle ayuda mucho, como le dejes libertad de interpretación ... te puede soltar cualquier cosa.
En cualquier caso la baja temperatura lo que hará será reducir la aleatoriedad final en la elección del token más probable pero eso no te libra de respuestas incorrectas, que dependen sobre todo de la falta de corpus sobre ese particular que estás preguntando, de corpus erróneo, de prompt ambiguo, o de todo a la vez.
Para código yo no uso IA salvo casos muy concretos y muy aislados (como algún pequeño script que no tiene importancia). Si lo uso para que me oriente sobre posibles soluciones, pero luego voy a la documentación.
Eso mismo hago yo, además combino la "investigación en profundidad" entre respuestas. Es decir, primero hago varios prompts, me da respuestas, pido referencias. Luego pido el modo investigación en profundidad que funciona de forma "agnóstica" a los prompts anteriores (y enfocando en qué tipo de fuentes debe enfocarse y analizar la calidad de las mismas),… » ver todo el comentario
Alguien me dice hace año y pico que iba a ser capaz de hacer eso y me río en su cara, porque estoy acostumbradísimo a ver las mancadas de GPT en mil y una cosas relativas a la programación, y especialmente en entornos complejos.
Ojo que para otras cosas de programación como librerías de C o incluso cosas del kernel Linux te da unas respuestas cojonudas. Si son cosas documentadas te hace unas explicaciones de la hostia y lo entiendes todo y funciona la mayoría de las veces el código de ejemplo que hace.
NO es para usarlo directamente sin revisar y ajustar, pero los ejemplos son buenos.
Pero como le preguntes cosas que no estén claramente documentadas...pues inventa y es un porculo porque al final te hace la picha un lío y te hace gastar tiempo a lo tonto.
Por eso cuando haces consultas sobre… » ver todo el comentario
Lo de la información, sin ser código, tienes también formas de "auditarla" en cierta manera. Claro que eso implica un trabajo iterativo de refinamiento y revisión de las respuestas (que en parte puede automatizarse pero en otra parte te toca a ti revisar lo importante)., siempre y cuando seas conscientes de esos problemas de arquitectura, claro.
Sobre lo otro que dices lo comento en #_19
Me explico, muchas veces me ha pasado (sobre todo en modelos anteriores: 3.5 y 4.0) el que me insista en algo erróneo que además pudiera ser "fácil de señalárselo" porque dicho error parte de un paso intermedio para dar la respuesta. Pongamos, por ejemplo, el cálculo de una distancia euclidiana. Yo le decía que añadiera ese cálculo… » ver todo el comentario