Sunʼiy intellekt xotirasi samarasiz boʻlib chiqdi: Tenure loyihasi 95 foiz xatolikni aniqladi

Zamonaviy sunʼiy intellekt assistentlari kod yozish, hujjatlarni tahlil qilish va uzoq muloqotlarni davom ettirishda mahoratli boʻlsa-da, ularning xotirasi kutilganidan ancha yomon boʻlishi mumkin. Texas universiteti tadqiqotchisi Jeffrey Flynt tomonidan oʻtkazilgan yangi tadqiqot shuni koʻrsatdiki, katta til modellari (LLM) uchun qoʻllaniladigan uzoq muddatli xotira tizimlari fundamental muammolarga ega. Hozirgi tizimlar maʼlumotlarni matematik vektorlar koʻrinishida saqlaydi va ularni semantik oʻxshashlik boʻyicha qidiradi, bu esa aniq faktlarni topishda jiddiy xatoliklarga sabab boʻladi. Bu haqda Ixbt.com xabar beradi.
Flyntning taʼkidlashicha, mavjud benchmarklar sifat illyuziyasini yaratmoqda. Odatda modelning yakuniy javobi baholanadi, xotira sifati emas. Til modeli qidiruvdagi xatolarni oʻzining mantiqiy bilimlari hisobiga yashirishi mumkin. Biroq, agar bu maʼlumotlar matn yaratish uchun emas, balki API chaqiruvlari yoki infratuzilmani sozlash kabi aniqlik talab qiladigan vazifalar uchun ishlatilsa, oqibatlar kritik boʻladi. Tadqiqotchi tomonidan yaratilgan PrecisionMemBench testi Mem0, Zep va Hindsight kabi mashhur tizimlarda faktlarni topish aniqligi bor-yoʻgʻi 5–8 foizni tashkil etishini koʻrsatdi.
Ushbu muammoni hal qilish uchun Tenure tizimi taklif etildi. Uning asosiy xususiyati shundaki, xotira qidiruv vazifasi sifatida emas, balki holatni boshqarish (state management) sifatida koʻriladi. Tenure noaniq semantik tasvirlar oʻrniga "ishonchlar" (beliefs) deb ataluvchi strukturaviy omborni qoʻllaydi. Har bir yozuv turi, amal qilish sohasi va dolzarblik holatiga ega boʻlgan alohida fakt hisoblanadi. Tizim eskirgan maʼlumotlarni kuzatib boradi va ularni yangilari bilan almashtiradi, turli loyihalar maʼlumotlarini aralashtirib yubormaydi.
Tenure vektorli qidiruvdan voz kechib, terminlarning aniq mos kelishiga asoslangan klassik usullardan foydalanadi. Masalan, agar foydalanuvchi Redis maʼlumotlar bazasidan foydalanayotganini aytsa, tizim MongoDB yoki PostgreSQL kabi oʻxshash texnologiyalarni emas, aynan Redisʼni qaytaradi. Sinovlarda vektorli tizimlar bitta toʻgʻri javob bilan birga 16 ta keraksiz faktni chiqargan boʻlsa, Tenure 1,0 koʻrsatkichi bilan faqat kerakli maʼlumotni taqdim etdi. Shuningdek, tizimda kontekstlar qatʼiy izolyatsiya qilingan boʻlib, eski muloqotlardagi maʼlumotlar yangi vazifalarga xalaqit bermaydi.





























Izohlar 0
…