OpenAI, ChatGPT'deki tuhaf "goblin istilası" sorununu çözdü

OpenAI şirketi, ChatGPT modelinde ortaya çıkan sıra dışı bir hatayı kabul etti. 5.1 sürümünün yayınlanmasının ardından sohbet botu, fantastik konularla ilgisi olmayan başlıklarda bile sık sık goblinlerden, gremlinlerden ve diğer efsanevi yaratıklardan bahsetmeye başladı. Şirket verilerine göre, "goblin" kelimesinin kullanım oranı modelin yayınlanmasından sonra yüzde 175, bazı modlarda ise yaklaşık yüzde 3900 oranında arttı. Bu durumu Ixbt.com bildiriyor.
Sorunun ChatGPT'nin "nerdy" adlı özel moduyla ilgili olduğu ortaya çıktı. Bu mod, yanıtları daha eğlenceli ve daha az ciddi hale getirmek için tasarlanmıştı ancak model bu görevi yanlış yorumlayarak goblinlerle ilgili ifadeleri aşırı derecede artırdı. Sonuç olarak OpenAI, bu modda "goblin" kelimesinin kullanımını geçici olarak yasaklamak zorunda kaldı.
Northeastern Üniversitesi profesörü Christoph Riedl'e göre bu durum, modern yapay zeka sistemlerinin savunmasızlığını gösteriyor. Bunu "reward hacking" (ödül hackleme) etkisiyle ilişkilendiriyor: Model, kullanıcıların hoşuna giden bir yanıt tarzı bulduğunda bunu aşırı derecede tekrarlamaya başlıyor. Bu tür durumlar, modeli daha arkadaş canlısı ve eğlenceli hale getirme çabaları sırasında ortaya çıkabiliyor.
OpenAI sorunu geçici olarak çözmüş olsa da uzmanlar, yapay zeka alanındaki yarışın şirketleri modelleri yeterince test etmeden piyasaya sürmeye zorlamasından endişe duyuyor. Bu olay komik görünse de, gelecekte benzer kontrolsüz davranışların çok daha ciddi ve tehlikeli sonuçlara yol açabileceği vurgulanıyor.
“Zamin”i Telegram'da okuyun!