Yapay zeka dünyasındaki rekabet hız kesmeden devam ederken, ChatGPT'nin sahibi OpenAI da yeni hamlesini yaptı. Şirket, GPT-5.4'ü resmen duyurdu.
TechCrunch'ta yer alan habere göre; yeni model, OSWorld-Verified ve WebArena Verified gibi bilgisayar kullanımı kıyaslamalarındaki rekor puanlar da dahil olmak üzere, önemli ölçüde iyileştirilmiş kıyaslama sonuçlarıyla birlikte geliyor.
Buna göre GPT-5.4, OpenAI'ın GDPval testinde %83 ile rekor bir puan elde etti. Mercor CEO'su Brendan Foody'nin açıklamasına göre GPT-5.4, hukuk ve finans alanlarındaki profesyonel becerileri test etmek için tasarlanan Mercor'un APEX-Agents kıyaslamasında da liderliği ele geçirdi.
OpenAI, yeni modelin GPT-5.2'ye kıyasla bireysel iddialarda hata yapma olasılığının %33 daha az olduğunu açıklarken; genel yanıtların %18 daha az hata içerme olasılığına sahip olduğunu belirtti.