Aralarında ChatGPT’nin de yer aldığı büyük dil modelleri, yanıt üretirken en çok Reddit platformundaki verilerden yararlanıyor. Online istatistik portalı Statista tarafından yapılan araştırmaya göre, yılın ilk çeyreğinde büyük dil modellerinin alıntı yaptığı web siteleri arasında Reddit yüzde 40,11 ile ilk sırada yer aldı.
Uzmanlar, yapay zekâ modellerinin gerçek kullanıcıların doğal konuşmalarını içeren Reddit verilerini tercih etmesinin, geliştiricilerin resmi bilgi kaynaklarından çok günlük insan etkileşimlerine odaklandığını gösterdiğini belirtiyor.
Reddit’i yüzde 26,3 ile Wikipedia, yüzde 23,5 ile YouTube, yüzde 23,2 ile Google, yüzde 21 ile Yelp, yüzde 19,9 ile Facebook, yüzde 18,7 ile Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile Mapbox ve OpenStreetMap izliyor.
Büyük dil modellerinin bu kaynaklardan yararlanması, yapay zekâların bilgi üretiminde hangi platformların etkili olduğunu da ortaya koyuyor.
Öte yandan, yapay zekâ şirketleriyle sosyal medya devleri arasında yapılan anlaşmalar bu etkiyi daha da güçlendiriyor. 2024 yılında Google ile Reddit arasında yapılan anlaşma kapsamında Google’ın yapay zekâ sistemleri Reddit verileriyle eğitilmeye başlandı. Reuters’a göre Google bu iş birliği için Reddit’e yıllık 60 milyon dolar ödeme yapıyor. Ayrıca Reddit, OpenAI ile de ChatGPT için veri paylaşımı anlaşması imzaladı.
Bu anlaşmalarla birlikte, yapay zekâ modellerinin yanıtlarında “Reddit etkisi” giderek daha belirgin hale geliyor.