Nima uchun Google sunʼiy intellekti oʻz nomini toʻgʻri yoza olmaydi?

Google qidiruv tizimidagi AI Overview funksiyasi soʻzlardagi harflarni sanashda kutilmagan xatolarga yoʻl qoʻymoqda. Masalan, tizim "Google" soʻzida ikkita "p" harfi borligini, "journalism" soʻzida esa ikkita "d" harfi mavjudligini taʼkidlab, uni "j-o-u-r-n-a-d-i-s-m" shaklida imlo qilgan. Hatto AQSH prezidentining familiyasida bitta "p" borligini toʻgʻri topsa-da, uni "t-r-p-u-m" deb yozib, foydalanuvchilarni hayratda qoldirdi. Bu haqda Techcrunch.com xabar beradi.
Ushbu muammo yangilik emas. Google oʻzining 29 yillik flagman mahsulotiga generativ sunʼiy intellektni joriy etishda avval ham qiyinchiliklarga duch kelgan edi. Ilgari AI Overview foydalanuvchilarga pitsaga yelim surtish yoki tosh yeyishni maslahat bergan satirik postlardan iqtibos keltirgan edi. Kompaniya vakillari TechCrunch nashriga bergan bayonotida soʻz ichidagi harflarni sanash LLM (katta til modellari) uchun maʼlum bir qiyinchilik ekanini va bu ustida ishlayotganliklarini bildirishdi.
Aslida, ChatGPT va Google qidiruv tizimini harakatga keltiruvchi sunʼiy intellekt modellari imlo qoidalarini tushunish uchun yaratilmagan. Yillar davomida yangi modellar taqdim etilganda, ulardan "strawberry" soʻzida nechta "r" harfi borligini soʻrash oʻziga xos hazilga aylangan. Murakkab matematik masalalarni yecha oladigan yoki soniyalar ichida kod yozadigan ushbu tizimlar, harflarni tahlil qilishda bogʻcha bolasi darajasida qolib ketmoqda.
Buning sababi sunʼiy intellektning matnni qanday qabul qilishida yashiringan. LLM modellari matnni insonlar kabi harfma-harf oʻqimaydi. Ular "transformer" arxitekturasiga asoslangan boʻlib, matnni "token"larga (boʻgʻinlar, soʻzlar yoki belgilar guruhiga) boʻlib chiqadi. Sunʼiy intellekt matnni raqamli kodlarga aylantiradi va ularning kontekstual maʼnosini tahlil qiladi.
Alberta universiteti tadqiqotchisi Matthew Guzdial tushuntirganidek, tizim "the" soʻzini koʻrganda uning maʼnosini anglatuvchi kodni koʻradi, lekin u "T", "H" va "E" harflaridan iborat ekanini bilmaydi. Shu sababli, Google qidiruv tizimi butunlay yangilansa-da, uning ichidagi sunʼiy intellekt oddiy imlo xatolarini tuzatishda hali ham oqsamoqda.
“Zamin”ni Telegramʻda oʻqing!