Yapay zeka devriminde şaşırtan açık: GPT-5.2 “strawberry” testinde takıldı

Milyarlarca dolarlık yatırımlarla geliştirilen yapay zeka modelleri karmaşık problemleri çözerken, “strawberry” kelimesindeki harf sayısını yanlış hesaplamaya devam ediyor; uzmanlara göre bu durumun temel nedeni sistemlerin harfleri değil, “token” adı verilen blokları algılaması.

Yapay zeka sistemleri bugün grafik tasarımdan profesyonel raporlara, müzik bestelerinden ileri matematik problemlerine kadar birçok alanda insan seviyesine yaklaşmış durumda. Ancak bu gelişmiş sistemler, şaşırtıcı biçimde en temel görevlerden bazılarında hâlâ zorlanıyor.

Aralık 2025’te yayınlanan OpenAI’ın en güncel modeli GPT-5.2, “strawberry” kelimesinde kaç tane “r” harfi olduğu sorusuna yanlış yanıt vermeye devam ediyor. Oysa kelimede biri başta, ikisi sonda olmak üzere toplam üç adet “r” harfi bulunuyor. Buna rağmen model, ısrarla “iki” cevabını veriyor.

Uzmanlara göre bu hatanın temelinde yapay zekanın metni algılama biçimi yatıyor. GPT benzeri modeller, kelimeleri harf harf değil, “token” adı verilen parça bloklar halinde işliyor. “Strawberry” kelimesi sistem tarafından “st”, “raw” ve “berry” olarak üç ayrı tokene bölünüyor. Model, bu blokları birer bütün olarak değerlendirdiği için harfleri tek tek saymakta zorlanıyor ve sonuçta yanlış hesaplama yapıyor.

Benzer sorunların “raspberry” gibi başka kelimelerde de görüldüğü belirtilirken, bu durum yapay zekanın hassas sayım işlemlerinde hâlâ zayıf kaldığını ortaya koyuyor. Öte yandan geçmişte problem yaşanan “Mississippi” veya “lollipop” gibi kelimelerde artık doğru sonuçlar alınabildiği de ifade ediliyor.

Dikkat çeken bir diğer nokta ise rakip modellerin bu testi başarıyla geçmesi. Yapılan karşılaştırmalarda Claude, Gemini, Grok, Qwen ve Microsoft Copilot’un “strawberry” kelimesindeki üç “r” harfini doğru şekilde tespit ettiği görülüyor. Bu da her yapay zeka modelinin metni parçalama ve işleme mimarisinin farklı sonuçlar doğurduğunu gösteriyor.

Milyarlarca dolarlık yatırımlarla geliştirilen yapay zeka teknolojileri hızla ilerlerken, bir kelimedeki harfleri saymak gibi basit görünen görevlerin bile dijital zekanın önünde hâlâ ilginç bir sınav olmaya devam ettiği görülüyor.

İLGİLİ HABERLER