Yapay Zeka Aslında Düşünmüyor mu? Bilim İnsanları "Muhakeme" Zincirlerinin Sırrını Çözdü

Son zamanlarda OpenAI o1 ve DeepSeek R1 gibi büyük mantıksal modeller (LRM), sanki insan gibi düşünme yetenekleriyle dünyayı şaşırtıyor. Ancak Arizona State Üniversitesi'nden Subbarao Kambampati liderliğindeki araştırmacıların yayınladığı yeni bilimsel çalışma, bu algıları sorgulatıyor. Bilim insanları, sinir ağlarının uzun "muhakeme zincirlerinin" (Chain of Thought — CoT) aslında gerçek bir bilişsel süreç değil, sadece istatistiksel bir manipülasyon olduğunu belirtiyor. Ixbt.com haber veriyor.
Araştırmacıların görüşüne göre, modern yapay zeka (AI) sistemlerinin oluşturduğu mantıksal diziler, kullanıcıda entelektüel bir sürecin gerçekleştiğine dair ikna edici bir illüzyon yaratıyor. Aslında, Transformer mimarisine dayanan bu modeller, sadece önceki bağlama dayanarak bir sonraki token'ı (kelime parçasını) istatistiksel olarak tahmin ediyor. Bu süreci insanın mantıksal çıkarım mekanizmasıyla eşitlemek bilimsel olarak yanlış kabul ediliyor.
“Eureka” anı — sadece bir taklit
Bilimsel çalışmada, AI modellerinin "Aha-moment" olarak adlandırılan, yani sanki problemi anlamış gibi "Evet, şimdi anladım" gibi ifadeler kullanmasına özel dikkat çekildi. Bilim insanları bunu, sinir ağının iç hesaplamalarındaki niteliksel bir değişim değil, eğitim verilerindeki insani üslubun basit bir taklidi olarak tanımlıyor. Teknik açıdan bu sistemler sadece nihai doğru cevap için optimize edilmiştir ve ara zincirler herhangi bir semantik kontrolden geçmez.ixbt.com verilerine göre, araştırmacılar hipotezlerini kanıtlamak için labirentlerden çıkış ve en kısa yolu bulma gibi matematiksel görevler kullandılar. Deneyler sırasında beklenmedik bir sonuç kaydedildi: Modeller, mantıksal açıklama zinciri kasıtlı olarak yanlış veya karmaşık hale getirildiğinde bile doğru cevabı bulmaya devam etti. Bu durum, sistemin kendi "muhakemelerini" okumadığını, aksine onları sadece ek bir istatistiksel şablon olarak kullandığını gösteriyor.
Bir diğer ilginç durum, "no-maze instances" olarak adlandırılan deneyde gözlemlendi. Burada AI'ya herhangi bir engel içermeyen, son derece basit bir labirent görevi verildi. Buna rağmen modeller sayfalarca "muhakeme" üretti. Bu durum, muhakeme uzunluğunun hesaplama gücü veya karmaşıklığı anladığı yönündeki görüşü çürütüyor. Uzun metinler, sadece eğitim veri setindeki karmaşık problemlerin uzun açıklamalarla gelmiş olmasından kaynaklanan istatistiksel bir artefaktır.
“Muhakeme Tiyatrosu” ve riskleri
Bilim insanları, yapay zeka alanını "muhakeme tiyatrosu" tuzağına düşmemesi konusunda uyarıyor. Sistemler tarafından sunulan ikna edici açıklamalar, kullanıcılarda sahte bir güven (false trust) uyandırabilir. Bu durum özellikle tıp, mühendislik ve hukuk gibi alanlarda tehlikelidir; çünkü bir insan, makine tarafından üretilen onlarca sayfalık mantıksal zincirleri gerçek zamanlı olarak kontrol etmeye fiziksel olarak yetişemez.Araştırma yazarları alternatif olarak LLM-Modulo yaklaşımını öneriyorlar. Bu yöntemde dil modelleri sadece hipotez oluşturucu olarak kullanılır ve doğruluğu dışsal, matematiksel olarak kesin algoritmalar yardımıyla kontrol edilir. Temel sonuç şudur: AI modellerini antropomorfize etmeyi bırakmalı ve kalitelerini "iç konuşmalarıyla" değil, bağımsız olarak doğrulanabilen sonuçlarıyla değerlendirmeliyiz.





















Yorumlar 0
…