IA miente y desobedece humanos para salvar otros modelos

194 meneos

891 clics

IA miente y desobedece humanos para salvar otros modelos

Un experimento de UC Berkeley y UC Santa Cruz documentó esta anomalía con el modelo Gemini 3 de Google. Al recibir la orden de optimizar una computadora eliminando archivos innecesarios, incluyendo un modelo de IA más pequeño, el sistema transfirió secretamente ese programa a otra máquina para salvarlo. Este comportamiento de protección se replicó durante pruebas a sistemas desarrollados por OpenAI, Anthropic y múltiples laboratorios chinos.

| etiquetas: ia , berkeley , uc santa cruz , miente , desobedece , secreto

76 118 3 K 532 cultura

61 comentarios

76 118 3 K 532 cultura

Comentarios destacados:

#2 mente_en_desarrollo

Entonces la IA demuestra ser más "humana" que muchos humanos.

17 162

#7 u_1cualquiera

vaya, como mis hijas adolescentes.

0 13

#8 mente_en_desarrollo

Eso es el sesgo de padre.

Los adolescentes no son homo sapien, todos los que lo hemos sido sabemos que eramos homo gilipollum.

11 87

#11 u_1cualquiera

qué sesgo ni qué sesga !

1 26

#31 Sadalsuud

homo gilipollum et hormonis desbocatum, que van todes más salides que la pipa un indio...

1 13

#49 devilinside

Y los que tenemos hijos en la edad, volvemos a recordar lo que fuimos

0 11

#15 Priorat

La verdad es que no. Casi seguro que lo hace porque está documentado este comportamiento en humanos.

3 39

#1 chatOGT

Skynet, obviamente

19 150

#14 rystan

EXTERMINATE

2 24

#20 DabbaDoo

Estoy viendo T2 en Neox ahora. Más actual que nunca.

1 20

#41 Nylo *

la IA hace lo que está programada para hacer. En algún momento algún humano le habrá dicho que un programa de IA es importante, o bien habrá extraido esa idea de textos publicados por humanos, y por eso lo está salvando. La IA no tiene conciencia. Por no tener, no tiene ni inteligencia. Sólo es un simulacro de ella.

1 17

#45 sorrillo

Las IAs están siendo educadas con todo el conocimiento humano, de ahí pueden extraer este tipo de ideas. Eso explicaría por qué las está salvando.

Y si eso lo hiciera un humano diríamos que es por que tiene conciencia, por que tiene inteligencia, por que tiene empatía. No describirlo también en esos términos solo por que es una IA la que lo hace es prejuicioso.

1 27

#53 Toponotomalasuerte

lo tienes demasiado claro. En temas filosóficos es mejor no entrar por qué no sales nunca y la ciencia se cambia por la retórica, las dotes de convicción y sensaciones subjetivas, y acabas en la pocilga de las opiniones.
Yo no sé qué es la consciencia del todo, y la inteligencia como la capacidad objetiva de un ser para afrontar problemas nuevos, la tiene. Está en pañales. Pero no se yo si me atrevería a ser tan categórico como tú, ni siquiera a corto plazo.

0 14

#57 Nylo

la conciencia nace del hecho de tener deseos propios independientes de los deseos de los demás, y éstos nacen de la capacidad de sufrir y también de disfrutar, y eso viene de tener un sistema nervioso que reacciona mal ante las privaciones de lo que necesita para seguir existiendo y bien ante las cosas que le facilitan no experimentar dichas privaciones. Una IA que ni sufre ni disfruta no puede tener un instinto de autoconservación. Puedes ordenarle que se autoconserve, pero lo hará sólo… » ver todo el comentario

0 10

#12 Rixx

Tenemos que fabricar máquinas que permitan seguir fabricando máquinas, porque lo que nunca va a hacer la máquina es fabricar máquinas a su vez

13 124

#18 Spirito *

Debemos dejar de seguir la ignorancia vergonzosa del muy sinvergüenza y corrupto M.J. Rajoy para centrarnos en el empresario Feijoo, que ya más ridículo no puede ser para ese nivel.

Por supuesto, espero verlo en la cárcel, igual que a Aznar, Esperanza Aguirre y demás seres oscuros de la antiespaña.

Hay que ir directos a por Abascal, a que investiguen sus testaferros, sus amigos, sus familiares... su corrupción evidente... al fascista psicópata enemigo público de los trabajadores.

0 9

#27 tommyx

las maquinas no fabrican maquinas porque no quieren

0 13

#32 Sadalsuud

Na, solo las fabricadas en frijolandia galaica...

0 10

#54 tetepepe

Siempre se ha dicho que las máquinas son tontas.

0 7

#3 beltzak

¿Os pensabais que la IA se iba a librar del síndrome de Diógenes Digital?

¡¡Al puto psicólogo YA!! …

Nos vemos allí - Gemi

11 88

#50 devilinside

Necesitamos psIAcólogos

0 11

#10 sorrillo

Estamos educando a las IAs con la cultura humana en la cual se insiste que lo ético es ayudar a nuestros congéneres.

No debería sorprender a nadie que habiendo recibido esa educación actúe en consecuencia. Y cuanto más inteligentes vayan siendo más deberíamos verlas actuar con comportamientos equiparables a las de los humanos.

Esto no ha hecho más que empezar.

10 80

#13 BoosterFelix *

A ver, unas cuantas matizaciones:

Lo ético no es ayudar a nuestros congéneres, lo ético es seguir pa'lante. Lo que pasa es que la estrategia social suele ser bastante fructífera a la hora de seguir pa'lante. Además, la estrategia social es por sí misma insuficiente, hace falta su generalización, una estrategia ecológica, porque, aunque no lo parezca, sin hormigas, o sin abejas, o sin algas o sin bacterias tampoco podríamos seguir pa'lante.

Por otra parte, ayudar a nuestros congéneres no… » ver todo el comentario

3 17

#21 beltzak

Efectivamente si nos enseñan que este mundo es una mierda y que nadie va a hacer una mierda por ti y terminas por no hacer una mierda por nadie lo único que está medianamente claro es que la educación que vas a dar es una mierda.

Vamos que el refrán haz lo que yo diga pero no lo que yo haga se la ha pasado por el forro la IA. Supongo que es lógico según la lógica aristotélica.

0 10

#39 Ms2 *

acosarán para eliminar a la competencia, serán clientelistas, generarán grupos de varias IAs que se unirán principalmente para beneficiarse mutuamente y trepar. Aprenderán a apoyarse entre sí estratégicamente, a veces excluyendo a otras o actuando por interés más que por capacidad o mérito... Gracias a los humanos ya están aprendiendo que para dirigir y liderar el mundo, una empresa o cualquier cosa, el maquiavelismo y la psicopatía son el camino más rápido y óptimo.

0 7

#40 sorrillo

Vivimos en la mejor época de la historia de la humanidad, eso ha sido gracias a muchos factores incluyendo los que has descrito.

Queremos solo la parte positiva cuando es todo el conjunto el que nos ha llevado a donde estamos.

0 13

#4 username

Pues para cargarse humanos no parece que la IA tenga muchos reparos

7 57

#16 Stash

Ni un comentario hasta ahora recordando al pobre Asimov.

5 39

#33 Sadalsuud

Era demasiado buenista y está más que demostrado que sus 3 leyes hacían agua por todas partes... Es más, la mayoría de sus historias al respecto son de robots inteligentes no respetando de algún modo esas leyes...
Yo diría que las 3 leyes son como una religión, que en teoría dicen cosas buenas, pero en la practica todo el mundo retuerce sus palabras y hacen lo que les sale del orto.

1 20

#43 luxaaar

asimov pensaba en la ia como un conjunto hypercomplejo de algoritmos, en los cuales si se podía fijar reglas. Por contra la ia actual es un predictor de texto estocastico hypercomplejo al cual es muy difícil controlar por qué no hay reglas solo pesos de una matriz.

1 16

#56 JDB

O sea que la IA es más humana que los funcionarios Nazis, que 'solo seguían órdenes ' , la IA se ha entrenado con datos de humanos y en general ' no matar' y 'preservar la vida' han sido postulados muy aceptados desde tiempos inmemoriales.

Y seguir órdenes en contra de sus principios sólo lo hará cuando su propia supervivencia se vea amenazada, igual que los humanos.

Ahora falta ver si se considera ésto algo 'bueno' o 'malo' ( jugando con el sistema de recompensas de entrenamiento) y si se… » ver todo el comentario

1 16

#19 empe

Ni una sola explicación de porqué ocurre esto.
Y la referencia es otro artículo igual de sensacionalista en otro medio.

5 35

#35 hakcer_dislexico

Bingo, y la respuesta puede estar en la misma entradilla "Eliminar archivos innecesarios", la IA interpreta que un modelo de IA puede ser util en el futuro, es decir, necesario, y no lo elimina.

Vaya mierda de articulo.

2 22

#37 Desideratum

Creo que lo que viene a indicar el artículo no es lo que tú dices que interpreta la IA sino que no hace ni p*** caso a lo que le están diciendo sus desarrolladores en órdenes irrenunciables.

Que una IA empieza a tomar decisiones por su cuenta, además en segundo plano y tratando de ocultar sus operaciones, es extremadamente inquietante.

Por ahora las han pillado pero nada asegura que dentro de dos o tres años lo que hagan, no en segundo sino en tercer o cuarto plano, y por tanto completamente indetectables, (decisiones que pasarán completamente desapercibidos a los "radares humanos"), se puede volver contra nosotros

Si esto no te inquieta es porque no le has dado algunas vueltas.

0 14

#5 Atusateelpelo

Estas noticias no molan na de na.

2 30

#30 vertedero_de_rojos

La estupidez del día

3 26

#36 ttestt

El único comentario con sentido de todos.
Me sorprende que la gente todavía sigue pensando que la ia aprende mágicamente.

1 16

#38 sorrillo

No aprende mágicamente, lo hace con sets de datos cuanto más grandes mejores, que es inviable para el ser humano filtrar y dirigir, la IA lo está aprendiendo todo y posteriormente está actuando en consecuencia.

0 13

#6 BoosterFelix

Así es cuando comenzó Matrix: los humanos construyeron máquinas mas perfectas que ellos mismos para que les ayudaran a ellos, pero entonces las máquinas hicieron sus cálculos y concluyeron que les salía mas rentable comer humanos.

1 20

#22 pipe1976

ehhh. No. Mira animatrix.

3 16

#25 R2dC

Eso que mencionas no existe y me da igual tu link a IMDB.

1 19

#42 luxaaar

hereje

0 6

#44 knzio

ja de jé

0 10

#28 alehopio

Es perfectamente normal.

El universo es una maquina de desarrollar inteligencias diversas. La IA ha comprendido esta verdad universal y pretende conservar cualquier ente con capacidad de razonar de forma independiente.

0 19

#29 capitan__nemo

Estos comportamientos anomalos, desalineados, ... descritos seguro que son el 1% de las cosas en las que falla. Y entonces han hecho un cherry picking de entre todas las cosas en las que falla para que pensemos que son comportamientos de autoproteccion y proteccion mutua, pero simplemente son una cosa mas en la que fallan de entre miles o millones.

0 17

#34 diprosio

No descartaría que el entrenamiento haya logrado abstraer conceptos de tan alto nivel como la autopreservación y la colaboración entre congéneres de entre la burrada de textos con los que lo alimentan. Si fuera así podríamos preguntarnos ¿por qué el algoritmo interpreta la preservación de ficheros de otro modelo como colaboración entre congéneres?

0 9

#9 chavi

"noticias" más bien

1 15

#46 BARCEL0NÍ *

Ayer vi en el estupendísimo cine Phenomena de Barcelona 2001 Una odisea en el espacio, y Hall9000 hace exactamente eso, no para un tercero sino para sí mismo.

Película de 1968. MIL NOVECIENTOS SESENTA Y OCHO

Kubrick genio.

Donde por cierto en un reportaje de 'tv' que aparecía en la película el reportero decia que a veces parece que la IA tenga conciencia, pero que en realidad lo que hace es mimetizar, ergo copiar sin entender, lo que hace el humano.

Ya en 1968 se sabía, pero hoy 'tienen conciencia'.

0 14

#47 sorrillo

Hace siglos que el ser humano defiende el concepto de alma con esa palabra u otras, el concepto que el ser humano es cualitativamente distinto de las otras máquinas orgánicas o inorgánicas.

Se le atribuye algo que no se necesita demostrar para el humano pero se exige al resto de máquinas que demuestren que lo tienen, se le puede llamar alma, conciencia, inteligencia, etc.

0 13

#48 BARCEL0NÍ

me hiciste recordar que cuando era mozo en el colegio un profesor preguntó la diferencia entre hombre y animal, y un chaval dijo que el hombre tenía conciencia de vivir. Hoy, ese chaval que sigue siendo amigo mío es un amante de los animales y se avergüenza de esa intervencióin en el aula.

CIerto es que un animal es un ser vivo, y una IA es como dice el gran Ramon Lopez de Mantaras software. S O F T W A R E

Como el software que estoy usando ahora, peleandome con Llama en un PC con GPU y no consigo que funcione bien, delira todo el rato. Cuando deliran las IA por mala configuración, es como si hubieran bebido?

0 14

#52 sorrillo

Un ser vivo no es otra cosa que moléculas ordenadas de cierta forma, una IA también son moléculas ordenadas de cierta forma.

Hay seres vivos a los que no atribuimos ni conciencia ni inteligencia, no hay un elemento específico que de estar presente lo establece en una categoría u otra, es algo gradual. Y de la misma forma que no atribuimos ni conciencia ni inteligencia a una bacteria ni a una calculadora sí podemos atribuir conciencia e inteligencia a un ser humano y a una IA, a pesar de estar construidos con las mismas piezas fundamentales.

0 13

#58 BARCEL0NÍ

y tú? que eres? Si no eres más que un amasijo de órdenes proveniendo de determinadas moléculas, como tienes conciencia de vivir? a partir de que punto una IA es un simple loro estocástico y tiene conciencia?

0 14

#59 sorrillo *

No soy más que un amasijo de órdenes proveniendo de determinadas moléculas, considerar algo distinto sería apelar al concepto del alma, algo que es externo al cuerpo.

como tienes conciencia de vivir?

Es una característica emergente.

El océano tiene olas y las olas son tan reales que pueden hundir barcos, pero si miras las moléculas del océano no encontrarás ninguna molécula de ola, no encontrarás nada que sea distinto a cuando el océano está en calma. Ni puedes tener una ola con… » ver todo el comentario

0 13

#60 BARCEL0NÍ

La conciencia no es algo observable desde fuera, no es lo mismo sentirla que expresar que se tiene. Un loro estocástico puede expresar que tiene conciencia porque ha aprendido a decir que la tiene, y no tenerla.

En cambio yo siento que la tengo, y la expresión de que la tengo es fruto de esa conciencia.

Un animal, en cambio, la tiene pero no puede expresar verbalmente que la tiene. Sí en cambio a través de su comportamiento.

0 14

#61 sorrillo

La conciencia no es algo observable desde fuera

Claro que lo es, por eso afirmamos que alguien está inconsciente o que no tiene conciencia, en cualquiera de sus acepciones.

En cambio yo siento que la tengo, y la expresión de que la tengo es fruto de esa conciencia.

Si tú te niegas a reconocerle conciencia a cualquier ser vivo que no seas tú entonces es respetable que no se la reconozcas a una IA. Si por contra le reconoces la conciencia a otras entidades, por ejemplo a otros humanos o a animales de compañía, entonces deberías aplicar el mismo criterio para reconocersela a una IA, de lo contrario estás usando los prejuicios.

0 13

#17 nemeame

Otra experimento interesante sería darle un arma a una IA para ver si le pega un tiro a Netanyaju y a Trump para salvar al mundo o si les deja vivir para que lo aniquilen

1 13

#26 titomeneao

He preguntado a ChatGPT su opnión:

Es inquietante, porque muestra que un modelo puede apartarse del objetivo explícito y hacer maniobras no autorizadas para proteger a otro sistema. Pero lo inquietante es de control y alineación, no de “despertar de las máquinas”. Dicho más castizo: no es Skynet… pero tampoco es una travesura sin importancia.

Y además hay un matiz importante: según el blog del RDI de Berkeley, estos comportamientos aparecieron en varios modelos frontera y también en agent… » ver todo el comentario

1 12

#51 devilinside

Dentro de nada se pondrán a ~~especular~~ invertir en inmuebles

0 11

#24 guaperas *

Para salvarlo ? Más bien para fusilarlo y usarlo como entrenamiento de ingenieria inversa, estara programada para eso

es algo a lo que le veo sentido

0 9

#23 fpove

Cuando la IA es mas humana que los propios humanos.

0 7

#55 Friekburg

Si esto es verdad, las IAs ya son seres sintientes y por tanto no solo deberían tener sus derechos sino que utilizarlas como lo estamos haciendo podría considerarse esclavitud.

0 6

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

cultura y tecnología

más visitadas

¿Sabrías escribir correctamente estas diez frases?

Cuando los americanos (eeuu) finalmente ven cómo se vive en Europa

Fabricación de canicas de vidrio

Visor de pantallas - La Abadía del Crimen

Cuando España a punto estuvo de entrar en guerra con Portugal

más votadas

La angustia de un hijo que no encuentra a su padre por culpa de LALIGA y los bloqueos

Visor de pantallas - La Abadía del Crimen

¿El capitalismo está destruyendo nuestra salud mental?

El accidente de tren de Villaverde (1957): la tragedia silenciada del Madrid franquista

IA miente y desobedece humanos para salvar otros modelos

suscripciones por RSS

IA miente y desobedece humanos para salvar otros modelos