Teknoloji, Yapay zeka

Bilim insanları, yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce testte kusur buldu

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

Aybüke İnal Kamacı | 04.11.2025 - Güncelleme : 04.11.2025

Ankara

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 araştırmacı, "Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği" başlıklı bir çalışma yaptı.

📲 Artık haberler size gelsin
AA'nın WhatsApp kanallarına katılın, önemli gelişmeler cebinize düşsün.

🔹 Gündemdeki gelişmeler, özel haber, analiz, fotoğraf ve videolar için Anadolu Ajansı
🔹 Anlık gelişmeler için AA Canlı

Bilim insanları çalışmada, yapay zekanın alt dallarından olan "doğal dil işleme" ve "makine öğrenimi" alanlarının önde gelen konferanslarından alınan 445 değerlendirme testini sistematik olarak inceledi.

İncelemeler sonucunda, testlerin neredeyse hepsinin "sonuçların geçerliliğini zedeleyebilecek" kusurlara sahip olduğu sonucuna ulaşıldı.

Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ilişkin Guardian'a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.

Bean, değerlendirme testlerinin yapay zekayla ilgili tüm iddiaların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğini anlamanın zorlaştığını kaydetti.

Anadolu Ajansı web sitesinde, AA Haber Akış Sistemi (HAS) üzerinden abonelere sunulan haberler, özetlenerek yayımlanmaktadır. Abonelik için lütfen iletişime geçiniz.

İlgili konular

AI araştırma Bilim İnsanı çalışma yapay zeka

Bu haberi paylaşın

Gündem

Bilim insanları, yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce testte kusur buldu

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

Ankara

İlgili konular

Bu haberi paylaşın

Ferdi Zeyrek'in elektrik akımına kapılarak ölümüne ilişkin iddianame tamamlandı

İstanbul'da akşam saatlerinde trafik yoğunluğu yüzde 83'e çıktı

Semerkant'ta 15 Aralık’ın "Dünya Türk Dili Ailesi Günü" ilan edilmesiyle ilgili etkinlik yapıldı

Kızılay İstasyonu'ndaki ANKARAY treni arızalandı, yolcular EGO otobüslerine yönlendirildi

Gaziantep'te 318 hafız için icazet töreni düzenlendi

Benzer haberler

Bilim insanları, yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce testte kusur buldu

Kocaeli'de 7 katlı apartmanın çöktüğü bölgede çalışmalar sürüyor

Yapay zeka en çok Reddit verilerine bakarak öğreniyor

Araştırmaya göre, günde en az 3 bin adım atmak Alzheimer'ın ilerlemesini yavaşlatabilir

Türkiye, gümrük işlemlerini yapay zeka desteğiyle hızlandıracak

Araştırma: Daha akıllı hale gelen yapay zekanın "benmerkezciliği" artıyor