GPT 5.4 yapay zeka alanında lider oldu

Yapay zeka dünyasında bir başka başarı daha kaydedildi. GPT 5.4 modeli, Vibe Code Bench v1.1 testlerinde yüzde 67,42'lik bir sonuçla mutlak liderliği ele geçirdi. Bu rakam, önceki rekor sahibi GPT 5.3 Codex modelinden yüzde 5,7 daha yüksektir. Üçüncü sırayı ise yüzde 57,57'lik sonuçla Claude Opus 4.6 modeli aldı. habr.com bildiriyor.
Bu test, basit kod yazma veya hata düzeltmeden farklı olarak, modelin sıfırdan tam teşekküllü bir web uygulaması oluşturma yeteneğini değerlendirir. Program, boş bir klasörden hazır bir hizmete kadar olan süreci bağımsız olarak gerçekleştirmelidir. Test sırasında yapay zekaya kimlik doğrulama, veritabanları ve ödeme sistemleri gibi karmaşık görevler yüklenir. Her proje için beş saate kadar süre tanınır ve nihai sonuç özel bir ajan tarafından kontrol edilir.
Analizler, yüksek doğruluğun her zaman ekonomik verimlilik anlamına gelmediğini göstermektedir. Örneğin, Claude Opus 4.6 modeli, GPT 5.4'e kıyasla daha az kaynak tüketerek neredeyse eşit sonuçlar elde etmektedir. Bu, geliştiriciler için maliyet optimizasyonunda önemli bir faktördür. Buna rağmen, yapay zekanın gelişim hızı şaşırtıcı: sadece yarım yıl içinde en iyi performans göstergeleri iki katına çıktı.
Günümüzde GPT 5.4 hala bazı görevlerde hatalar yapmaktadır. Model tarafından oluşturulan uygulamaların yaklaşık üçte biri tam olarak çalışmamaktadır. Buna rağmen, teknolojinin gelecekte programlama sürecini kökten değiştirmesi ve insan emeğini önemli ölçüde hafifletmesi beklenmektedir.
“Zamin”i Telegram'da okuyun!