Microsoft dasturchilar uchun sunʼiy intellektni sinovdan oʻtkazuvchi ASSERT vositasini taqdim etdi

Sunʼiy intellekt (AI) tadqiqotchilari va laboratoriyalari modellarni xavfsizlik, muvofiqlik va moslashuvchanlik boʻyicha baholashda katta yutuqlarga erishmoqda. Biroq, kompaniyalar va dasturchilar oʻz mahsulotlari uchun maxsus ishlab chiqilgan AI tizimlarining kutilganidek ishlashini taʼminlashda yangi qiyinchiliklarga duch kelishmoqda. Ushbu jarayonni soddalashtirish maqsadida Microsoft kompaniyasi ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing) deb nomlangan yangi ochiq kodli freymvorkni eʼlon qildi. Bu haqda Techcrunch.com xabar beradi.
ASSERT tizimi oddiy tilda yozilgan tavsiflar asosida AI modellarining xatti-harakatlarini baholash imkonini beradi. Freymvork yuqori darajadagi maqsadlar, siyosatlar yoki kutilayotgan xatti-harakatlarni tahlil qilib, ularni tizimli testlarga aylantiradi. Bu esa dasturchilarga oʻz ilovalariga xos boʻlgan murakkab ssenariylarni avtomatik ravishda tekshirish va natijalarni ballar asosida baholash imkonini beradi.
Ushbu vosita AI tizimi bosib oʻtgan yoʻllarni, jumladan, oraliq harakatlar va tashqi vositalarga murojaatlarni ham yozib oladi. Bu esa xatoliklar qayerda yuz berayotganini aniq koʻrishga yordam beradi. Masalan, hujjatlar bilan ishlovchi AI agenti kompaniyadan tashqaridagi shaxslarga elektron pochta yubormasligi yoki maxfiy maʼlumotlarni faqat rahbarlarga koʻrsatishi kerak boʻlsa, ASSERT ushbu qoidalarga rioya qilinishini doimiy ravishda tekshirib turadi.
Microsoft vakili Sarah Birdʼning taʼkidlashicha, baholash jarayoni toʻgʻri qarorlar qabul qilish uchun oʻta muhimdir. Agar tizimning xatti-harakatlari toʻliq tushunilmasa, uning tashkilot talablariga javob berishini bilish qiyin boʻladi. ASSERT tizimi nafaqat ishlanmani yaratish jarayonida, balki u ishga tushirilgandan keyin ham doimiy monitoring uchun foydali vosita hisoblanadi.
Ushbu yangilik AI sanoatidagi kengroq oʻzgarishlar fonida yuz bermoqda. Modellar yanada kuchliroq boʻlib borayotgan bir paytda, tadqiqotchilar Stanfordʼning HELM yoki MLCommonsʼning AILuminate kabi loyihalari orqali modellarni turli sharoitlarda takroriy sinovdan oʻtkazishga koʻproq eʼtibor qaratmoqdalar.





























Izohlar 0
…