Yapay zeka hayatımızın merkezine yerleşti. Sağlık sorularından finansal tavsiyelere kadar her şeyi onlara soruyoruz. Ancak Google'ın yapay zeka laboratuvarı DeepMind'dan gelen son rapor, bu "sonsuz güvenin" tehlikeli olabileceğini ortaya koydu.
Google DeepMind tarafından geliştirilen FACTS Benchmark Suite, yapay zekâ sohbet botlarının gerçek hayattaki doğruluk seviyesini ölçmek için hazırlandı. Testler; bilgi tabanlı sorular, uzun metinler, web verileri ve görsel yorumlama gibi alanları kapsıyor.
Sonuçlar oldukça çarpıcı:
Bu tablo, AI’ın son yıllarda hızla yaygınlaşmasına rağmen özellikle:
Geçmişte de “halüsinasyon” sorunlarıyla gündeme gelen AI modelleri için bu çalışma önemli bir hatırlatma niteliğinde. Uzmanlara göre yapay zekâ, güçlü bir yardımcı olmaya devam edecek ancak yakın gelecekte de insan denetimi olmadan tam güvenilir bir kaynak hâline gelmesi zor görünüyor.