GPT-4.5 supera el test de Turing: la IA es más convincente que los humanos

En un experimento realizado por investigadores de la Universidad de California en San Diego, el modelo GPT-4.5 superó con éxito una versión simplificada del test de Turing en interacciones de texto en vivo. Los observadores identificaron al modelo como un "humano real" en más ocasiones que a los humanos reales. El experimento siguió un esquema de tres partes: los jueces interactuaban simultáneamente con un humano y una IA, debiendo identificar con quién hablaban. Así lo informa Ixbt.com informa.
La evaluación se basó únicamente en el contenido de la correspondencia. Cuando se le asignó una "personalidad" específica, el modelo GPT-4.5 fue identificado como humano en el 73% de los casos. A modo de comparación, el modelo LLaMa-3.1-405B de Meta fue percibido como humano en el 56% de los casos bajo el mismo escenario. Los investigadores señalaron que la adición de un contexto personalizado hizo que las respuestas de los modelos fueran significativamente más convincentes.
El test de Turing clásico se utiliza tradicionalmente para comprobar la capacidad de los algoritmos para imitar la comunicación humana. Sin embargo, en este estudio, sirvió no como una medida de "inteligencia", sino como un indicador de credibilidad conductual en la comunicación. Los expertos enfatizan que los modelos no poseen conciencia, sino que demuestran la capacidad de replicar patrones de habla socialmente convincentes en interacciones breves.
Los resultados muestran que distinguir entre humanos e IA en chats de texto se está volviendo estadísticamente difícil. Esto es importante para el servicio al cliente, plataformas educativas y redes sociales. Los autores del estudio señalaron la necesidad de un etiquetado claro de los sistemas de IA en las interfaces de comunicación, afirmando que la transparencia se ha convertido en un problema de infraestructura social más que técnico.
¡Lee “Zamin” en Telegram!