AKİT MENÜ

Teknoloji-Bilişim

Yapay zeka abartı mı? Bağlamı anlamıyorlar

Güncelleme Tarihi:

Tencent tarafından yayımlanan kapsamlı araştırma, en gelişmiş yapay zeka modellerinin bile gerçek dünyadaki karmaşık bağlamlardan öğrenmede ciddi biçimde zorlandığını ortaya koydu. Test sonuçları, yapay zekanın “akıllı” görünmesine rağmen hâlâ kırılgan olduğunu gösteriyor.

2

Tencent tarafından yayımlanan kapsamlı araştırma, en gelişmiş yapay zeka modellerinin bile gerçek dünyadaki karmaşık bağlamlardan öğrenmede ciddi biçimde zorlandığını ortaya koydu. Test sonuçları, yapay zekanın “akıllı” görünmesine rağmen hâlâ kırılgan olduğunu gösteriyor.

3

Tencent araştırmacılarına göre insanlar, yeni bir durumla karşılaştığında geçmiş ezberlere değil, o anki bağlama dayanarak öğreniyor. Bir yazılımcının bilmediği bir aracı kısa sürede kavraması, bir oyuncunun yeni bir oyunu oynayarak öğrenmesi ya da bir bilim insanının dağınık verilerden yeni bir ilişki çıkarması buna örnek.

4

Mevcut büyük dil modelleri ise bu şekilde öğrenmiyor. Aksine, ön eğitim sırasında parametrelerine gömülen bilgiyi geri çağırmaya odaklanıyorlar. Çıkarım aşamasında yeni bilgiyi gerçekten “öğrenmek” yerine, statik iç belleklerini kullanıyorlar.

5

Araştırmada bu durum, yapay zekanın yapısal bir uyumsuzluğu olarak tanımlanıyor. Modeller, bildikleri şeyler üzerinden akıl yürütmeye uygun; ancak kullanıcıların ihtiyaç duyduğu şey, sürekli değişen ve düzensiz bağlamlara uyum sağlayabilen sistemler.

6

Bu sorunu ölçmek için Tencent ekibi CL-bench adlı yeni bir değerlendirme çerçevesi geliştirdi. Testlerde:

7

19 üst düzey yapay zeka modeli, 500 karmaşık bağlam, 1.899 görev, 31.607 doğrulama kriteri kullanıldı.

8

CL-bench’i klasik kıyaslamalardan ayıran temel fark, her görevin kendi bağlamıyla birlikte sunulması. Amaç, modellerin “iş başında öğrenme” yani verilen bağlamdan anlam çıkarma yeteneğini ölçmek. Bu yöntem, insanların öğrenme biçimine daha yakın bir yaklaşım sunuyor.

9

Ortaya çıkan tablo oldukça dikkat çekici. İlk 10’daki modellerin CL-bench üzerindeki ortalama başarısı yalnızca yüzde 17,2 oldu.

10

ne çıkan sonuçlar şöyle: GPT-5.1 (OpenAI): #,7, Claude Opus 4.5 (Anthropic): !,1 , Kimi K2 (Moonshot AI): ,6 , Hunyuan 2.0 (Tencent): ,2.

11

Daha da çarpıcı olan nokta şu: En iyi performansı gösteren GPT-5.1 bile hiç bağlam verilmediğinde görevlerin yüzde 1’inden daha azını çözebildi.

12

Araştırma, yapay zekanın temel probleminin bilgi eksikliği olmadığını vurguluyor. Modeller çoğu zaman gerekli bilgiye erişebiliyor; ancak bu bilgiyi doğru bağlamda yorumlayamıyor.

13

Bu nedenle yapay zekalar, kontrollü test ortamlarında başarılı görünürken, gerçek dünyanın düzensizliği karşısında hızla performans kaybediyor. Tencent’e göre bağlam öğrenme, gelecekte model tasarımının merkezinde yer almazsa, yapay zekanın pratik kullanım alanları sınırlı kalacak.

14

Araştırmada dikkat çeken bir öngörü de insan-yapay zeka ilişkisine dair. Eğer bağlam öğrenme gelişirse, insanlar sadece veri sağlayan kullanıcılar olmaktan çıkıp, “en doğru bağlamı tasarlayan” aktörlere dönüşebilir. Ancak burada kritik bir sorun var: Bağlam öğrenme geçici. Bağlam penceresi kapandığında model öğrendiklerini unutuyor. Asıl büyük soru ise hâlâ yanıt bekliyor:

15

Bağlamdan edinilen bilgi nasıl kalıcı hale getirilebilir? Bu soru, yalnızca olguları değil; becerileri, deneyimi ve kalıpları kapsayan çok daha derin bir öğrenme problemini işaret ediyor. Tencent’in çalışması, yapay zekanın henüz bu eşiği aşamadığını net biçimde ortaya koyuyor. Haber Kaynağı: Tencent