Google açıkladı, ezberler bozuldu: En iyi yapay zeka bile her 3 cevaptan 1'inde hata yapıyor

17.12.2025 11:42

Yapay zeka sohbet botlarını "her şeyi bilen bir uzman" sanıyorsanız dikkat! Google DeepMind’ın yeni raporu, en gelişmiş modellerin bile kritik bir eşiği geçemediğini ve ciddi oranda "halüsinasyon" gördüğünü kanıtladı.

Yapay zeka hayatımızın merkezine yerleşti. Sağlık sorularından finansal tavsiyelere kadar her şeyi onlara soruyoruz. Ancak Google'ın yapay zeka laboratuvarı DeepMind'dan gelen son rapor, bu "sonsuz güvenin" tehlikeli olabileceğini ortaya koydu.

EN İYİSİNDE BİLE DOĞRULUK ORANI EN FAZLA %69

Google DeepMind tarafından geliştirilen FACTS Benchmark Suite, yapay zekâ sohbet botlarının gerçek hayattaki doğruluk seviyesini ölçmek için hazırlandı. Testler; bilgi tabanlı sorular, uzun metinler, web verileri ve görsel yorumlama gibi alanları kapsıyor.

Reklam

Sonuçlar oldukça çarpıcı:

En iyi performansı gösteren modeller bile en fazla %69 doğruluk oranına ulaşabiliyor.
Yani yapay zekâların verdiği her üç yanıttan biri yanlış, eksik ya da yanıltıcı olabiliyor.

HÂLÂ CİDDİ RİSKLER TAŞIYOR

Bu tablo, AI’ın son yıllarda hızla yaygınlaşmasına rağmen özellikle:

Sağlık
Hukuk
Finans gibi kritik alanlarda hâlâ ciddi riskler taşıdığını gösteriyor. Akıcı ve ikna edici yanıtlar, her zaman doğru bilgi anlamına gelmiyor.

Geçmişte de “halüsinasyon” sorunlarıyla gündeme gelen AI modelleri için bu çalışma önemli bir hatırlatma niteliğinde. Uzmanlara göre yapay zekâ, güçlü bir yardımcı olmaya devam edecek ancak yakın gelecekte de insan denetimi olmadan tam güvenilir bir kaynak hâline gelmesi zor görünüyor.

İLGİNİZİ ÇEKEBİLİR

Turizm merkezini fırtına ve dolu vurdu!

Zelenskiy: "Ukrayna'nın cephedeki konumu, savaşın başlangıcından bu yana hiç olmadığı kadar güçlü"

Haberin Devamı İçin Tıklayın

Anahtar Kelimeler:

HABER

Google açıkladı, ezberler bozuldu: En iyi yapay zeka bile her 3 cevaptan 1'inde hata yapıyor

Yapay zeka sohbet botlarını "her şeyi bilen bir uzman" sanıyorsanız dikkat! Google DeepMind’ın yeni raporu, en gelişmiş modellerin bile kritik bir eşiği geçemediğini ve ciddi oranda "halüsinasyon" gördüğünü kanıtladı.

EN İYİSİNDE BİLE DOĞRULUK ORANI EN FAZLA %69

HÂLÂ CİDDİ RİSKLER TAŞIYOR

İLGİNİZİ ÇEKEBİLİR