GPT-4.5 Tyuring testidan oʻtdi: Sunʼiy intellekt odamdan koʻra ishonchliroq

San-Diyegodagi Kaliforniya universiteti tadqiqotchilari tomonidan oʻtkazilgan tajribada GPT-4.5 modeli jonli matnli muloqotda Tyuring testining soddalashtirilgan versiyasidan muvaffaqiyatli oʻtdi. Kuzatuvchilar ushbu modelni real insonlarga qaraganda koʻproq holatlarda "haqiqiy odam" deb qabul qilishdi. Eksperiment uch tomonlama sxema asosida tashkil etildi: hakamlar bir vaqtning oʻzida inson va sunʼiy intellekt bilan muloqot qilib, kim bilan gaplashayotganini aniqlashlari kerak edi. Bu haqda Ixbt.com xabar beradi.
Baholash jarayoni faqat yozishmalar mazmuniga tayanib amalga oshirildi. GPT-4.5 modeli maʼlum bir "shaxsiyat" (persona) berilgan holatda 73 foiz vaziyatda odam deb topildi. Taqqoslash uchun, Meta kompaniyasining LLaMa-3.1-405B modeli xuddi shunday ssenariyda 56 foiz holatda inson sifatida qabul qilindi. Tadqiqotchilarning taʼkidlashicha, aynan shaxsiylashtirilgan kontekstning qoʻshilishi modellarning javoblarini ancha ishonchli qilgan.
Klassik Tyuring testi anʼanaviy ravishda algoritmlarning inson muloqotiga taqlid qilish qobiliyatini tekshirish uchun ishlatiladi. Biroq, ushbu tadqiqotda u "aql" mezoni emas, balki muloqotning xulq-atvor jihatidan ishonchlilik koʻrsatkichi sifatida xizmat qildi. Mutaxassislar modellar ongga ega emasligini, balki qisqa muloqotlarda ijtimoiy jihatdan ishonchli nutq namunalarini takrorlash qobiliyatini namoyish etayotganini taʼkidlamoqda.
Natijalar shuni koʻrsatadiki, matnli chatlarda inson va sunʼiy intellektni farqlash statistik jihatdan qiyinlashib bormoqda. Bu holat mijozlarni qoʻllab-quvvatlash xizmatlari, taʼlim platformalari va ijtimoiy tarmoqlarda muhim ahamiyatga ega. Tadqiqot mualliflari muloqot interfeyslarida sunʼiy intellekt tizimlarini aniq belgilash (markirovka qilish) zarurligini, shaffoflik masalasi endi texnik emas, balki ijtimoiy infratuzilma muammosiga aylanganini qayd etishdi.





























Izohlar 0
…