GPT-4.5 besteht Turing-Test: KI überzeugender als Menschen

In einem Experiment von Forschern der University of California, San Diego, hat das Modell GPT-4.5 eine vereinfachte Version des Turing-Tests in Live-Text-Interaktionen erfolgreich bestanden. Beobachter hielten das Modell in mehr Fällen für einen "echten Menschen" als die tatsächlichen Testpersonen. Das Experiment basierte auf einem Drei-Parteien-Schema: Juroren interagierten gleichzeitig mit einem Menschen und einer KI und mussten identifizieren, mit wem sie sprachen. Dies berichtet Ixbt.com berichtet.
Die Bewertung basierte ausschließlich auf dem Inhalt der Korrespondenz. Mit einer zugewiesenen "Persönlichkeit" wurde GPT-4.5 in 73 Prozent der Fälle als Mensch eingestuft. Zum Vergleich: Das Modell LLaMa-3.1-405B von Meta wurde im gleichen Szenario in 56 Prozent der Fälle als Mensch wahrgenommen. Forscher betonten, dass gerade die Hinzufügung eines personalisierten Kontextes die Antworten der Modelle deutlich glaubwürdiger machte.
Der klassische Turing-Test wird traditionell verwendet, um die Fähigkeit von Algorithmen zur Nachahmung menschlicher Kommunikation zu prüfen. In dieser Studie diente er jedoch nicht als Maßstab für "Intelligenz", sondern als Indikator für die verhaltensbezogene Glaubwürdigkeit. Experten betonen, dass die Modelle kein Bewusstsein besitzen, sondern die Fähigkeit zeigen, sozial überzeugende Sprachmuster in kurzen Dialogen zu replizieren.
Die Ergebnisse zeigen, dass die Unterscheidung zwischen Mensch und KI in Text-Chats statistisch immer schwieriger wird. Dies ist für Kundensupport, Bildungsplattformen und soziale Netzwerke von Bedeutung. Die Autoren der Studie wiesen auf die Notwendigkeit einer klaren Kennzeichnung von KI-Systemen in Kommunikationsschnittstellen hin und betonten, dass Transparenz heute eher ein Problem der sozialen Infrastruktur als ein technisches ist.
Lesen Sie „Zamin“ auf Telegram!