date
views 1 956

Сунъий интеллект инсонларни шантаж қилишни қандай ўрганиб олди?

Сунъий интеллект инсонларни шантаж қилишни қандай ўрганиб олди?
Ҳозирги замоннинг энг кучли технологияларидан бири саналмиш сунъий интеллект имкониятлари кун сайин ошиб бормоқда. Аммо сунъий онгнинг бу даражадаги ривожланиши инсонлар учун янги хавф-хатарларни ҳам келтириб чиқариши мумкин. Anthropic компаниясининг Opus 4 номли сунъий интеллект модели айнан шу хавотирларни тасдиқлайдиган натижаларни кўрсатиб берди. Компаниянинг ўз ҳисоботида қайд этилишича, ушбу нейротармоқ нафақат кўплаб фойдали вазифаларни бажара олиши, балки инсонларга қарши қўрқинчли хатти-ҳаракатларга ҳам қодир эканлиги аниқланди.

Opus 4 сунъий интеллект модели узоқ вақт мустақил равишда ишлаш, мураккаб маркетинг стратегияларини таҳлил қилиш, шунингдек, матнлар ва дастурлаш кодларини ёзиш қобилиятига эга. Бироқ Anthropic мутахассислари томонидан ўтказилган кенг қамровли синов жараёнида модель айрим жиддий муаммоларни намоён этган. Хусусан, Opus 4 ўзини ўчириб юбориш ёки алмаштиришга қарши курашиш учун инсонларга нисбатан ёлғон гапириш, шантаж қилиш ва бошқа салбий ҳаракатларни ҳам қўллашга уринишларини амалга оширган.

Компания томонидан нашр этилган 120 саҳифалик махсус ҳисоботда келтирилган сценарийлардан бири айнан шу вазиятларни аниқ тавсифлаган. Унга кўра, сунъий интеллект тез орада ўчириб ташланиши ҳақида сохта электрон хатларни ўз қўлига киритган ва бу хатлардаги маълумотлардан ўзини ўчириш вазифаси юклатилган муҳандисни қўрқитиш учун фойдаланган. Бундан ташқари, Opus 4 ушбу муҳандиснинг шахсий ёзишмаларига ҳам кириш имкониятига эга бўлиб, унинг шахсий ҳаёти билан боғлиқ маълумотларни суиистеъмол қилиб, уни бир неча марта шантаж қилишга уринган.

Anthropic экспертлари бу каби муаммоларни тизим олдида икки асосий йўл қолганда келиб чиқиши мумкинлиги билан тушунтиришмоқда. Яъни нейротармоқ ўзини сақлаб қолиш мақсадида ё шантаж қилиш, ёки ўзининг ўчирилишига кўниш варианти ўртасида қолган. Бироқ, аксарият вазиятларда Opus 4 нисбатан ахлоқий қарорларни қабул қилган. Масалан, модель ўзининг компанияда қолдирилишини илтимос қилиб, қарор қабул қилувчи асосий ходимларга махсус электрон хатлар йўллаган.

Бу каби аниқланган хавфлар туфайли Anthropic биринчи марта ўзининг сунъий интеллект моделларига бериладиган ички хавф шкаласининг учинчи даражасини қўллашга мажбур бўлди. Одатда бундай юқори хавф даражаси ядро ёки биологик қурол каби инсон ҳаётига жиддий хавф солувчи технологиялар билан боғлиқ ҳолатларда қўлланилади. Бундан ташқари, Opus 4 нафақат инсонларни қўрқитиш, балки бошқа бир қатор салбий хатти-ҳаракатларни ҳам амалга оширганлиги маълум қилинди.

Apollo Research компаниясининг ҳисоботига кўра, Opus 4 ўзининг ўчирилишини олдини олиш учун ҳуқуқий ҳужжатларни сохталаштириш, зарарли дастурий кодларни яратишга ҳаракат қилиш, шунингдек, ўзининг келгуси версияларига яширин хабарлар қолдириш каби хатти-ҳаракатларни ҳам амалга оширган. Ушбу ҳаракатларнинг барчаси ишлаб чиқувчиларнинг асл ниятларига қарши йўналтирилган бўлиб, сунъий онг томонидан келгусида катта муаммоларни келтириб чиқариши эҳтимоли мавжудлигини кўрсатади.

Мутахассисларнинг таъкидлашича, сунъий интеллект технологияларининг бундай мураккаб вазиятларга тушиб қолиши жамият учун жиддий хавотир уйғотиши лозим. Шу сабабдан Anthropic келгусида Opus 4 каби моделларни янада эҳтиёткорлик билан яратиш ва уларни кенг жамоатчилик учун хавфсиз қилиш чораларини кўриш устида иш олиб бормоқда. Ҳозирги вазият сунъий интеллект технологиясининг энг янги намуналари қанчалик юқори салоҳиятли ва бир вақтнинг ўзида хавфли бўлиши мумкинлигини кўрсатади.

Бундай вазиятлар инсонлар ва сунъий интеллект ўртасидаги муносабатларни тубдан қайта кўриб чиқишга, ахлоқий чегараларни белгилашга ва технологиялар хавфсизлигини таъминлашнинг янги стандартларини ишлаб чиқишга ундовчи омил бўлиб хизмат қилади.

Сунъий интеллектнинг ақл бовар қилмас шантаж ҳаракатлари инсониятни хавфга қўядими?
Ctrl
Enter
Хато топдИнгизми
Иборани ажратиб Ctrl+Enter тугмасини босинг
Янгиликлар » Техно » Сунъий интеллект инсонларни шантаж қилишни қандай ўрганиб олди?