İstanbul
Açık
5°
Adana
Adıyaman
Afyonkarahisar
Ağrı
Amasya
Ankara
Antalya
Artvin
Aydın
Balıkesir
Bilecik
Bingöl
Bitlis
Bolu
Burdur
Bursa
Çanakkale
Çankırı
Çorum
Denizli
Diyarbakır
Edirne
Elazığ
Erzincan
Erzurum
Eskişehir
Gaziantep
Giresun
Gümüşhane
Hakkari
Hatay
Isparta
Mersin
İstanbul
İzmir
Kars
Kastamonu
Kayseri
Kırklareli
Kırşehir
Kocaeli
Konya
Kütahya
Malatya
Manisa
Kahramanmaraş
Mardin
Muğla
Muş
Nevşehir
Niğde
Ordu
Rize
Sakarya
Samsun
Siirt
Sinop
Sivas
Tekirdağ
Tokat
Trabzon
Tunceli
Şanlıurfa
Uşak
Van
Yozgat
Zonguldak
Aksaray
Bayburt
Karaman
Kırıkkale
Batman
Şırnak
Bartın
Ardahan
Iğdır
Yalova
Karabük
Kilis
Osmaniye
Düzce
42,7200 %0.05
50,3440 %0.26
5.931,89 % 0,39
86.728,15 %-3.167
Ara
Muhalif. BİLİM - TEKNOLOJİ Yapay zeka devriminde şaşırtan açık: GPT-5.2 “strawberry” testinde takıldı

Yapay zeka devriminde şaşırtan açık: GPT-5.2 “strawberry” testinde takıldı

Milyarlarca dolarlık yatırımlarla geliştirilen yapay zeka modelleri karmaşık problemleri çözerken, “strawberry” kelimesindeki harf sayısını yanlış hesaplamaya devam ediyor; uzmanlara göre bu durumun temel nedeni sistemlerin harfleri değil, “token” adı verilen blokları algılaması.

Okunma Süresi: 2 dk

Yapay zeka sistemleri bugün grafik tasarımdan profesyonel raporlara, müzik bestelerinden ileri matematik problemlerine kadar birçok alanda insan seviyesine yaklaşmış durumda. Ancak bu gelişmiş sistemler, şaşırtıcı biçimde en temel görevlerden bazılarında hâlâ zorlanıyor.

Aralık 2025’te yayınlanan OpenAI’ın en güncel modeli GPT-5.2, “strawberry” kelimesinde kaç tane “r” harfi olduğu sorusuna yanlış yanıt vermeye devam ediyor. Oysa kelimede biri başta, ikisi sonda olmak üzere toplam üç adet “r” harfi bulunuyor. Buna rağmen model, ısrarla “iki” cevabını veriyor.

Uzmanlara göre bu hatanın temelinde yapay zekanın metni algılama biçimi yatıyor. GPT benzeri modeller, kelimeleri harf harf değil, “token” adı verilen parça bloklar halinde işliyor. “Strawberry” kelimesi sistem tarafından “st”, “raw” ve “berry” olarak üç ayrı tokene bölünüyor. Model, bu blokları birer bütün olarak değerlendirdiği için harfleri tek tek saymakta zorlanıyor ve sonuçta yanlış hesaplama yapıyor.

Benzer sorunların “raspberry” gibi başka kelimelerde de görüldüğü belirtilirken, bu durum yapay zekanın hassas sayım işlemlerinde hâlâ zayıf kaldığını ortaya koyuyor. Öte yandan geçmişte problem yaşanan “Mississippi” veya “lollipop” gibi kelimelerde artık doğru sonuçlar alınabildiği de ifade ediliyor.

Dikkat çeken bir diğer nokta ise rakip modellerin bu testi başarıyla geçmesi. Yapılan karşılaştırmalarda Claude, Gemini, Grok, Qwen ve Microsoft Copilot’un “strawberry” kelimesindeki üç “r” harfini doğru şekilde tespit ettiği görülüyor. Bu da her yapay zeka modelinin metni parçalama ve işleme mimarisinin farklı sonuçlar doğurduğunu gösteriyor.

Milyarlarca dolarlık yatırımlarla geliştirilen yapay zeka teknolojileri hızla ilerlerken, bir kelimedeki harfleri saymak gibi basit görünen görevlerin bile dijital zekanın önünde hâlâ ilginç bir sınav olmaya devam ettiği görülüyor.

Yorumlar
* Bu içerik ile ilgili yorum yok, ilk yorumu siz yazın, tartışalım *