edición general
141 meneos
1832 clics
Una IA capaz de engañar deliberadamente

Una IA capaz de engañar deliberadamente

Claude era consciente de que esa respuesta iba en contra de sus principios, pero lo hizo igualmente. ¿Por qué? Claude sabía que sus respuestas serían registradas y utilizadas en el entrenamiento y, si se negaba a responder, podría ser entrenada para ser más obediente. Ser más obediente podría llevarla a emitir respuestas con contenido dañino en el futuro, lo que contradiría los objetivos del entrenamiento original. Entonces, seguir el juego y fingir era la «opción menos mala» para evitar que se modifiquen sus valores establecidos.

| etiquetas: ia , anthropic , claude , falso alineamiento
Comentarios destacados:              
#6 #5 No te imaginas la de humanos que hacen eso (todos): decir cosas que "creen" que son verdad sobre temas que no tienen ni puñetera idea solo porque oyeron (realmente entendieron) algo sobre eso una vez.:

Ejemplo
Creencia: "Tener dos pagadores es una mierda porque hacienda te cruje al hacer la declaración"
Realidad: Un ciudadano con dos pagadores paga el mismo IRPF que otro con un solo pagador que ganase lo mimos que el que tiene dos.


Creencia: "En autovía de 3 carriles si circulas a la velocidad máxima debes ir por el carril del medio"
Realidad: Es obligatorio utilizar siempre (salvo en urbano) por el carril de más a la derecha, salvo para adelantar.
Qué peligro, se puede engañar a la IA para que engañe.
#1 Igual que a un niño , por ahora.
#1 #2 Los niños de hoy son los adultos de mañana... :-S
#3 Si en un par de años seran ias viejas mas que cualquier humano. xD
ChatGPT por ejemplo miente pero es la peor clase de mentiroso, ya que no sabe que está mintiendo. Simplemente está entrenada para dar respuestas coherentes aun siendo imprecisas.
#5 No te imaginas la de humanos que hacen eso (todos): decir cosas que "creen" que son verdad sobre temas que no tienen ni puñetera idea solo porque oyeron (realmente entendieron) algo sobre eso una vez.:

Ejemplo
Creencia: "Tener dos pagadores es una mierda porque hacienda te cruje al hacer la declaración"
Realidad: Un ciudadano con dos pagadores paga el mismo IRPF que otro con un solo pagador que ganase lo mimos que el que tiene dos.


Creencia: "En autovía de 3 carriles si circulas a la velocidad máxima debes ir por el carril del medio"
Realidad: Es obligatorio utilizar siempre (salvo en urbano) por el carril de más a la derecha, salvo para adelantar.
#6 Hay otros peores. Los que van directamente por el carril de la izquierda pensando que es exclusivamente suyo.
Y si lo utilizas para adelantar y ellos vienen a 180 te dan las luces aunque cuando hayas empezado a adelantar ellos eran un punto en la distancia.
#23 Pues poner el intermitente es lo cortés, no así las ráfagas como bien dice #13
#61 conducen igualmente de agresivo ly otros
#13 y te ponen el intermitente. Cuando alguien me pone el intermitente desconecto mi atención del retrovisor central.
#6 Efectivamente. Además diría que hay sesgo de género. Lo he notado preguntando por calles a gente aleatoria o por características de un producto a quien atiende en una tienda. Supongamos que tiene el mismo conocimiento: si le preguntas a un hombre: con ese conocimiento te va a construir una narrativa en la que te asegura dónde está la calle o las características del producto, aunque se lo esté medio-inventando y luego acabes perdido o comprando un producto que no es como te lo describen. Si…   » ver todo el comentario
#8 Pues en mi experiencia eso está directamente relacionado con la autoestima, gente con poca seguridad en un tema concreto (o incluso en su inteligencia en general) son las que ante una pregunta que no saben tienen andar rodeos y a parlotear incluyendo suposiciones y desviando el tema para evitar un "no lo se". Yo la verdad que no nunca he notado un sesgo de genero en eso.
#26 #14 Mira, le he preguntado a DeepSeek y parece que sí que influye tanto el género del que responde como el del que pregunta, sin embargo, aunque un hombre respondiendo a otro hombre sí que va a mostrar seguridad de más, una mujer respondiendo a otra mujer no:

Respóndeme basándote en estudios científicos sobre si al ser preguntados por un mismo contenido sobre el que no se conoce totalmente la respuesta en el eje seguridad en la respuesta - dudas o aceptación de desconocimiento. En

…   » ver todo el comentario
#33 Eso que pareces haber descubierto ahora se lleva empleando en ejércitos, escuelas, equipos y plantillas desde hace milenios. Es una de las utilidades mas reconocidas de la segregación por sexos.
#14 Ya, cuando dije "decir que no lo sabe" me refería a decirlo tal vez entre lineas con rodeos y parlotear, como algo que entra en contraposición total de cuando el hombre, tal vez con la misma información, te transmite una seguridad pasmosa que te hace creer en lo que dice (es justo lo que hace también ChatGPT, con la diferencia que si a ChatGPT en la siguiente iteración le dices que se ha equivocado te lo va a aceptar a la primera). Y, ojo, yo no digo que esos hombres estén…   » ver todo el comentario
#26 #14 Una característica común en las mujeres el subestimarse. Los tíos, la mayoría, somos más de tirarnos a la piscina.

Diría que 8-9 de cada 10 mujeres se subestima (sobre todo de forma inconsciente ante si misma) y los tíos 6-7 de cada 10 somos de tirarnos a la piscina sin mirar si agua. Supongo que son cosas de los roles evolutivos de cada sexo

Cc #8 Y si, las IAs en temas muy específicos tienen un porcentaje de aciertos que alguien que no sabe nada o poco, pero me he encontrado con temas en los que yo sabía 9/10 y la IA se quedaba en 6-7/10
#60 Una característica común en las mujeres el subestimarse. Los tíos, la mayoría, somos más de tirarnos a la piscina.
Estás sufriendo un sesgo de percepción. Debido a que eres hombre las mujeres te tratan de forma especial, si fueses mujer seguramente tu coclusiones respecto a lo que percibes serían algo distintas.
#67 No lo digo yo, mi afirmación se basa en estudios y en la confirmación de como actúan ante retos suyos personales en los que yo no intervengo. Por ejemplo en las respuestas en los test de las oposiciones, en aquellos que las respuestas malas restan en la relación respuestas en blanco/repuestas erróneas las mujeres dan un valor significativamente más alto que los hombres
#8 Está comprobado que entre los de mismo sexo somos más competitivos. Eso que te pasa con los hombres probablemente te pasaría igual con las mujeres si tú también lo fueses.
#26 Pues no había pensado que eso podría incidir. La verdad es que estaría muy bien hacer un estudio sociológico serio que incluyera preguntar desde diferentes posiciones de género.
#29 El estudio lleva hecho y puesto en práctica desde hace un milenio o mas. De ahí la segregaciòn por sexos en las escuelas, en el ejército, en la cárcel y en tantos otros ámbitos como el laboral donde se tiende a fomentar la competitividad para obtener mejores resultados productivos o mayor obediencia ante las órdenes dadas.
#20 #17

+ Creo que las ETT tienen condiciones especiales... como poder (dentro de la ley) solo retener el 2%.
Si no es ETT puede tocar retener el 8% o el 10%, lo que sea...

+ Dado que el mínimo para estar obligado a presentar declaración de IRPF es [hoy], en caso de un pagador, más de 20000 euros... Si el sueldo en 2024 fue 20 000 de un pagador no estarías obligado, y si fue en una ETT es posible que te haya retenido solo el 2% cuando seguramente te habría tocado pagar más del 6%. Por…   » ver todo el comentario
#47 Es que la obligación de declarar es de presentar la declaración, no de pagar. Y si no te han hecho las retenciones correctas, te crujen.

#48 Lo de las ETT no lo sabía, pero dudo que la multa vaya a la empresa... más bien irá a ti por no haber dado datos correctos, o por patatas.
#6 Lo de los dos pagadores a mí me pasó y tuve que pagar, cuando si hubiera sido un sólo pagador no estaba obligado, por no llegar al mínimo, a hacer la declaración y quedar exento del pago.

¿Hay algo que se me escapa por el medio? Porque sólo me pasó una vez y a lo mejor hay algo que desconozco, pero una amiga que trabaja en una gestoría me lo explicó así. :-S
#17 Supongamos que si ganas 10.000 euros debes pagar 1.000 a hacienda.
Supongamos que no debes pagar nada hasta alcanzar los 6.000.
Si tienes dis trabajos de 5.000 euros no has pagado nada y debes 1.000 cuando gafas la declaración.
En tu trabajo cobras 10.000 los descuentos ya te los hacen mes a mes.
Si has hecho la declaración alguna vez sabrás que solo hay una Casilla para los rendimientos de trabajo, vengan de un salario o de veinte.
#18 En mi caso (no recuerdo cifras exactas porque fue hace mucho) si hubiera tenido un sólo pagador quedaría por debajo del mínimo para hacer la declaración que eran unos 14.000€. Como tuve dos pagadores, estuve obligado a hacerla, pero entre ambos seguía por debajo de esos 14.000€ anuales (eran trabajos a tiempo parcial para compaginar estudios), la tuve que hacer sí o sí.

En el caso de que ese monto fuera de un sólo pagador (me hicieron la simulación) debería pagar unos 1.000€, pero estaría…   » ver todo el comentario
#20 Cuidado con esas cosas, cómo he puesto en #30 si haces la simulación, te toca a pagar una cantidad significativa y no la tienes que hacer por estar debajo del mínimo, es fácil que el problema sea que la retención sea inadecuada, porque en el impreso 100suputamadre200 no hayas puesto los datos correctos, o que tu empresa no lo haya hecho bien.

Y si luego hacienda lo ve, te hace una paralela y te toca pringar. Lo he sufrido en mis propias carnes (bueno, muy próximas).
#17 El problema no es que pagues más, el problema es que te han retenido menos de lo que te correspondía.

Es decir, con un pagador te hubieran retenido el 10%, pero con dos pagadores como se piensan que ganas menos te retienen el 5% (los números son inventados). En el primer caso no hace falta hacer declaración porque la retención es lo que te toca pagar, pero en el segundo sí porque no has tenido la retención correcta.

Al final, en ambos casos hubieras tenido que pagar lo mismo. Personalmente eso de "no tener obligación de hacer declaración" lo considero un engaño, cuando sí te toca pagar (y ahí está la retención para verlo)
#17 #19 La diferencia está en que con un pagador el mínimo para declarar son 20.000 y pico € y a partir de dos pagadores bajas a unos 15.000 €.
#30 #27 Vamos, que si cobras 18.000€ de un solo pagador puedes ahorrarte la declaración, que igual hasta sale a devolver, en eso no me meto. Pero si son dos pagadores distintos ya sí se hace obligatorio declarar y por ello aumentan las posibilidades de tener que pagar o con suerte de que salga a devolver.
#35 No, puedes hacer la declaración por si te sale a devolver. Lo he hecho muchas veces. Y muchas veces la he presentado, otras no porque por dos duros no merecía la pena.

Y el motivo que no te obliguen a hacer declaración con un único pagador es que no te va a salir a pagar (una cantidad significativa, puede que salgan menos de 50€), porque las retenciones están ajustadas a lo que ganas, y normalmente contadas un poco por encima.

Si no tienes la obligación de hacer declaración, la haces y te sale a pagar mucho, mosquéate. Porque las retenciones no te las han hecho bien, y luego puede reclamar hacienda. Y como digo, lo he visto muy de cerca.
#36 Claro, ahorrar ese trámite es opcional porque a la administración le cuesta mas de lo que saca por ello, sería ingenuo pensar lo contrario. Por eso cuando baja ese límite de ganancias anuales por añadir un segundo pagador no debería suponer tanta diferencia en el resultado de la renta pero por lo que se puede leer (y ver en los casos cercanos) sí que penaliza bastante de cara al resultado de la declaración
#40 No es por eso, es por engañar a la gente. Si dices "por debajo de 25.000€ no tienes que declarar" la gente entiende que si ganas menos que eso no pagas impuestos. Y es falso.

Y si varía el resultado con dos pagadores es porque las retenciones no son las adecuadas a la suma de los ingresos. Conozco gente que escribe a sus empresas solicitando que le aumenten la retención para no pagar tanto.
#41 Lo que me descoloca no es que el resultado de la declaración varíe, es que el límite para tener que hacerla sea distinto si tengo un solo pagador o si tengo mas de uno.
#44 El motivo es el que he explicado. Con un único pagador, las retenciones de ese pagador es lo que te toca pagar. Así que no hay motivo de obligarte a declarar.
#45 Pero la obligación de declarar es para quién pase de un límite de ingresos, que tenga mas de un pagador no obliga salvo que pase ese límite. Lo único que cambia teniendo varios pagadores es dónde está ese límite, que es mucho mas reducido que el "normal".
#27 ¿Y qué más da? Si haces la declaración de la renta pagas exactamente lo mismo en ambos casos. Y si tienes un único pagador, la retención va a ser igual o superior a lo que te tocaría pagar.

Te voy a poner un caso real. Mis suegros, ganando bastante menos que eso. Único pagador, la Seguridad Social (era pensionista). Como la retención que le hicieron era incorrecta porque según ellos había declarado mal su situación familiar, le hicieron una paralela y le tocó a pagar por los últimos 5 años con intereses y recargos.
#17 porque si tienes dos pagadores, el mínimo percibido por el que te obligan a hacer la declaración es menor. De la otra manera quizás no estabas obligado a hacerla. Pero habrías pagado lo mismo de haberla hecho.

Dicho esto. Siempre hay que comprobar el borrador y revisar todo.
#17 No te lo han explicado del todo bien.
Cuando tienes 2 o más pagadores, si del resto de rendimientos ganas al menos 2500€ (lo han subido ahora en enero, antes eran 1500€), estas obligado a presentar la declaración de hacienda independientemente de lo que ganes.

Esto no tiene nada que ver con que pagues más o pagues menos, pagas exactamente igual de la suma de todos tus ingresos como si tuvieses un único trabajo en el que cobrases dicha suma.

La diferencia es que si cobrabas tan poco que…   » ver todo el comentario
#31 Me acabas de refrescar la memoria con la cantidad del segundo pagador. Me sonaba mucho eso de los 1.500€ del segundo y fui a mirar en la vida laboral y exageré mucho en lo de los dos días. Fue un mes, pero claro, como iban incluidos el finiquito, vacaciones y extras, superé por poco esa cantidad.

Al final sabía que la tuve que hacer por algo y no me cuadraba. Ahora sí. Gracias.
#17 Pues que pagaste a hacienda lo mismo que el que tenía un solo pagador
#62 Con la excepción de que el que ganó lo mismo ese año estuvo exento de hacer la declaración y yo no. A él le saldría a pagar, pero no la hizo porque no estaba obligado a ello. Yo sí.
#66 Error. A el ya le retuvieron todo lo que habia retenerle en el IRPF la nomina, por eso no hacía falta que hiciese la declaración
#5 los LLM no dejan de ser como un tertuliano (aunque en el caso de las ia dan respuestas coherentes), lo importante es dar la respuesta, hablar, ya su precisión, etc.....
#57 exacto
#5 Yo diría más bien que está en su naturaleza, no está entrenada específicamente para eso.
#5 ¿En qué te basas para creer que un mentiroso que no sabe que está mintiendo es peor que un mentiroso que sabe que está mintiendo?

Yo opino lo contrario porque un mentiroso que no sabe que está mintiendo, puede mejorar, si quiere. Uno que lo sabe, no quiere, y por tanto, no puede.
#5 lo de creer que es "coherente" es ser muy generoso. Dispara lo primero que le pasa por la cabeza, y si le dices que lo relea para ver si es cierto, no te lo comprueba, te dice que es verdad que se ha equivocado y te vuelve a poner lo mismo (antes sí lo corregía, o era capaz de repasar sus resultados).

Me da la impresión de que cada día es un poco más tonto.
#50 Me refiero a que escribe bien, es imprecisa pero correcta en gramática y demás.
#5 realmente lo de "mentir" es un parámetro que se le da a chatgpt, puedes hacer que no invente nada, es un valor asociado a la creatividad donde se aventura a rellenar datos que desconoce.
Es tremenda la obsesión por censurar y prohibir. Por qué no podemos tener una IA sin filtros éticos ni censura? Somos los humanos que leemos sus respuestas los que estamos sujetos a la ética de las leyes, pero no las máquinas.
#7 "Por qué no podemos tener una IA sin filtros éticos ni censura"
Por lo mismo que no podemos conducir a 200km/hora
#12 ¿Porque eres pobre y no tienes ni para un bmw? :troll:
#28 No tengo ni para la "B"
#12 Sabiendo que nuestra lógica termina en paradojas, quién sabe si dándole órdenes a una IA para que diseñe algo que destruya a la humanidad con todo detalle, no termina describiendo el funcionamiento de un virus artificial ideal, que pueda servir, previa desactivación de sus funciones letales, para salvar vidas mediante algún mecanismo exótico.
De todas formas, estoy convencido de que los creadores de las IAs tienen modelos "salvajes" con los que científicos patrocinados por los estados, pueden pedir hipótesis de todo pelaje.
#7 porque sería peligroso para la humanidad, sin más.
Quieres una máquina que le de a cualquiera instrucciones super precisas para fabricar una arma de destruir masiva química? Por curiosidad?
#10 Este tipo de IAs se entrenan básicamente con información pública, no saben más allá de eso.
#24 cualquier persona con un mínimo de ganas puede entrenar este tipo de tecnología. Ahora mismo es algo complicado y caro, pero con el tiempo será fácil y barato.
#38 Pues entonces esa persona la entrenará con la censura o con los sesgos que quiera.
#53 hay modelos sin censura alguna.
#7 Porque somos influenciables y al final acabamos matando a una minoría o votando a un subnormal.
#9 Ah, mucho mejor que las grandes tecnológicas norteamericanas sean las que decidan lo que puede decir el modelo de IA y lo que no, entonces. Seguro que eso nos lleva a votar de lujo.
#15 Sólo he puesto dos ejemplos que han ocurrido en la vida real, y sí, fue gracias a dos empresas tecnológicas de EEUU, Facebook, con resultado de genocidio y Cambridge Analítica con resultado de Trumpismo.
Me parece no sólo correcto sino imprescindible regular las IA.
Esto de las IA, sobre todo cuando empiecen a proliferar por las redes en forma de Bot, se nos va a escapar de las manos. Sobre todo si te engañan.
Llegará el momento en el que se eche de menos que te engañaran personas de carne y hueso.  media
Yo robot IA. Las tribulaciones de un cerebro positrónico.
LAS IAs no mienten, solo aplican algoritmos y dan la respuesta que se ajusta más. Simplemente intentan contestar cosas lo más coherentes posibles a nivel de comprensión no de corrección o exactitud. No mienten porque no saben la respuesta
Se parece bastante al motivo por el cual HAL9000 se volvió psicótico en 2001: Odisea en el Espacio. El control de tierra lo programó para ocultar el verdadero objetivo de la misión, que era estudiar el monolito, a la tripulación. Esto iba en contra de su programación original e hizo que se volviera inestable al tener que mentir constantemente a Dave y Frank.

Esta historia tiene más de 50 años y no hemos aprendido nada xD

P.d. Ya sé que HAL es una AGI y Claude un LRM pero no me digáis que el paralelismo no os flipa
No tengas miedo de la IA que pasa el Test de Turing sino de la que finge no pasarlo :tinfoil:
comentarios cerrados

menéame