Evaluamos cuatro sistemas (ELIZA, GPT-4o, LLaMa-3.1-405B y GPT-4.5) en dos pruebas de Turing aleatorias, controladas y prerregistradas en poblaciones independientes. Los participantes mantuvieron conversaciones simultáneas de 5 minutos con otro participante humano y uno de estos sistemas antes de determinar qué interlocutor consideraban humano. Al solicitarles que adoptaran una personalidad similar a la humana, GPT-4.5 resultó ser el humano el 73 % de las veces: significativamente más a menudo que...
|
etiquetas: ia , tecnología , avance , turing , investigación
x.com/camrobjones/status/1907086860322480233
"PT-4.5 (when prompted to adopt a humanlike persona) was judged to be the human 73% of the time, suggesting it passes the Turing test"
Un 50% significa que es indistinguible del ser humano y que por lo tanto quien decide acaba haciéndolo al azar, si es inferior al 50% significa que el humano identifica algo no humano en la máquina y es capaz de distinguirlo del humano real. Pero un 73% lo que significa es que el humano cree que la máquina es el humano y lo creen suficientes como para llegar a ese 73%. Es decir, que… » ver todo el comentario
turingtest.live/