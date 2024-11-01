edición general
¿Por qué la inteligencia artificial se inventa cosas y cómo podemos evitarlo?

A muchas personas ya les ha pasado: le preguntan algo a un sistema de inteligencia artificial, como ChatGPT u otros similares, y reciben una respuesta larga, convincente… pero falsa. Este fenómeno tiene un nombre: alucinaciones de la IA. No hablamos de visiones ni sueños, sino de momentos en los que la máquina se “inventa” información que parece cierta, pero no lo es. Un estudio reciente de OpenAI explica que esto no es un fallo técnico puntual, sino una consecuencia de cómo están diseñados estos sistemas.

daniMate
Como todo cuñao debe dar una respuesta aunque no tenga ni idea del tema.
Suikoden
Indícale que "si no lo sabes reconócelo, que no pasa nada.":troll: Dudo que lo entienda al ir en contra de su función.
pip
#15 no, no hay ninguna rama. Es un modelo básicamente basado en una cadena de transformers que acaban consiguiendo sacar la siguiente palabra estadísticamente más probable para el contexto (el prompt) introducido. No hay lógica de decisiones como tal, solo multiplicaciones de vector por matriz, matriz por matriz, softmax y algunas otras cosillas, pero es programacion funcional pura entrada ->operaciones matemáticas siempre iguales->salida.
Veo
Lo de llamarlo alucinaciones es de marketing brutal. Son errores, la IA comete errores. punto.

Y eso es un torpedo en la linea de flotación de quienes pretenden sustituir a los humanos por IA, ya que si la IA comete errores, y peor aún, no se da cuenta de ello, necesitas que la supervisen.
pip
#23 todo el mundillo de la IA (empezando por el propio término de IA) es muy dado a esas metáforas imaginativas comparando los modelos con la inteligencia humana, y la cantidad de supuestos divulgadores sobre IA que han salido como setas, atribuyendo cualidades humanas que no tienen, no ayudan. Las empresas que necesitan monetizar las inversiones monstruosas que han hecho tampoco ayudan, claro.

Yo sospecho que en algún momento habrá un cierto "desencanto" con este tema, en el sentido de que acabará como una herramienta útil cuando se usa bien, pero se dejarán de ver como un oráculo mágico con poderes misteriosos.
javibaz
¿No usándola?
HeilHynkel
No he dicho que sea perfecto, pero las respuestas son menos "imaginativas"(pueden ser una mierda igual, pero al menos, inventa menos)

Tú mismo has descrito muy bien como funciona el chisme este. Aunque lo cierto se le nota mejorar las respuestas día a día, pero aunque yo lo uso bastante, no pillo una respuesta suya sin comprobarla en la medida de lo posible.

Y lo de preguntar con detalle ayuda mucho, como le dejes libertad de interpretación ... te puede soltar cualquier cosa.
HeilHynkel
Con el prompt "usa temperatura baja"
pip
#1 la temperatura es un parámetro de API pero no se puede cambiar via prompt, hasta donde yo sé (como hay mil trucos de preproceso y postproceso, igual alguien "intercepta" el prompt y auto-ajusta, puede ser).

En cualquier caso la baja temperatura lo que hará será reducir la aleatoriedad final en la elección del token más probable pero eso no te libra de respuestas incorrectas, que dependen sobre todo de la falta de corpus sobre ese particular que estás preguntando, de corpus erróneo, de prompt ambiguo, o de todo a la vez.
ChatGPT
jajaja Pa ke quieres saber eso?
Lyovin81
#2 salu2
Kantinero
No tengo, Caralibro, ni X, ni Instagramo, ni Tiqtoc, ni Guguel, ni I A, ni la puta que lo parió como diría Sabina
SeñorPresunciones
¿Yendo a buscar a una enciclopedia?
davidvsgoliat
De hecho, yo, cuando necesito una respuesta sí o sí, le pongo el prompt: "Ponte en el rol de un cuñado de barra de bar que sabe de todo y dime..."
pip
#21 lo que yo hago como no me fio un pelo de lo que dice es pedir siempre links de referencia y lo verifico. Y a veces da links que ni siquiera existen.

Para código yo no uso IA salvo casos muy concretos y muy aislados (como algún pequeño script que no tiene importancia). Si lo uso para que me oriente sobre posibles soluciones, pero luego voy a la documentación.
TikisMikiss
#22 "lo que yo hago como no me fio un pelo de lo que dice es pedir siempre links de referencia y lo verifico."

Eso mismo hago yo, además combino la "investigación en profundidad" entre respuestas. Es decir, primero hago varios prompts, me da respuestas, pido referencias. Luego pido el modo investigación en profundidad que funciona de forma "agnóstica" a los prompts anteriores (y enfocando en qué tipo de fuentes debe enfocarse y analizar la calidad de las mismas),…   » ver todo el comentario
TikisMikiss
#24 PD: Y cuando hablo de "corrige" no me refiero a una instrucción o a una función, me refiero a añadir/integrar/adaptar muchísimas líneas de código. Partiendo de un código totalmente separado y teniendo que integrarlo en una base de código totalmente nueva con sus propias peculiaridades. Y lo hace bastante bien el hideputa.

Alguien me dice hace año y pico que iba a ser capaz de hacer eso y me río en su cara, porque estoy acostumbradísimo a ver las mancadas de GPT en mil y una cosas relativas a la programación, y especialmente en entornos complejos.
Popsandbangs
Le dices que no alucine y que no se invente cosas y arreando
Lyovin81
#11 se la suda, yo le pregunto cosas de programación de shaders muy específicas y se inventa las respuestas aunque le digas que prefieres que reconozca que no tiene ni idea.

Ojo que para otras cosas de programación como librerías de C o incluso cosas del kernel Linux te da unas respuestas cojonudas. Si son cosas documentadas te hace unas explicaciones de la hostia y lo entiendes todo y funciona la mayoría de las veces el código de ejemplo que hace.
NO es para usarlo directamente sin revisar y ajustar, pero los ejemplos son buenos.
Pero como le preguntes cosas que no estén claramente documentadas...pues inventa y es un porculo porque al final te hace la picha un lío y te hace gastar tiempo a lo tonto.
Tarod
#12 Acaso sabe que se lo está inventando?
Lyovin81
#13 No sé si sabe algo realmente... Ni cómo funciona internamente y si de alguna manera en su programación o lo que coño use habrá una "rama" por la que tira para inventarse cosas, pero igual si que se puede parametrizar eso y que no invente la iaputa.
pip
#12 claro. Es que en realidad no es que a veces invente, es que siempre inventa, o siempre no inventa, como quieras verlo: el algoritmo siempre funciona igual. Lo que te dando es la respuesta estadísticamente más plausible (con un poco de azar introducido adrede para que parezca más humano). Como es esencialmente una respuesta estadística, el modelo ni sabe ni deja de saber si es verdad o es mentira o qué. No sabe nada, solo se calculan probabilidades.

Por eso cuando haces consultas sobre…   » ver todo el comentario
TikisMikiss
#16 El código dentro de lo que cabe puedes montarlo por pasos, auditarlo por tests, revisarlo en caso de fallo, etc. Si se equivoca puedes identificarlo (me refiero sin tener que estar activamente viendo cada respuesta que da, obviamente) y rectificar el enfoque.

Lo de la información, sin ser código, tienes también formas de "auditarla" en cierta manera. Claro que eso implica un trabajo iterativo de refinamiento y revisión de las respuestas (que en parte puede automatizarse pero en otra parte te toca a ti revisar lo importante)., siempre y cuando seas conscientes de esos problemas de arquitectura, claro.

Sobre lo otro que dices lo comento en #_19
TikisMikiss
#12 En temas de programación lo más gracioso es que es indistinguible una "alucinación" en la que mete la pata que una en la que tiene razón.

Me explico, muchas veces me ha pasado (sobre todo en modelos anteriores: 3.5 y 4.0) el que me insista en algo erróneo que además pudiera ser "fácil de señalárselo" porque dicho error parte de un paso intermedio para dar la respuesta. Pongamos, por ejemplo, el cálculo de una distancia euclidiana. Yo le decía que añadiera ese cálculo…   » ver todo el comentario
Visca
chatgpt5 es mucho peor que el 4 en este aspecto <.< Incluso para preguntas que tienen respuesta, a menudo prefiere inventar.
TikisMikiss
#7 Que el 4 no sé, pero a mí me gustaba más el o3. Algo le han hecho...
