Sosyal medya algoritmaları nasıl çalışıyor? Bir gönderi nasıl “viral” olabiliyor? Bot hesapları hangi aktörler ne için kullanıyor?
Dezenformasyon ve manipülasyon nasıl gerçekleşiyor?
Levent Ulusu
İki kelimeden oluşuyor, ister istemez hayatımızda yer alıyor ve çeşitli platformlar aracılığıyla bizi dijital bir dünyada buluşturuyor. Neredeyse 30 yıldır hayatımıza temas eden ve her geçen gün kendini anın koşullarına göre güncelleyen bu platformlar toplamına “sosyal (ya da dijital) medya” deniyor.
Artık herkes kendi de içerik üretebiliyor, haber niteliğinde paylaşımlar yapabiliyor ya da en basitinden kendi fikrini herkesin görebileceği şekilde belirtebiliyor. Yani eskiden olduğu gibi tek taraflı, sadece dinlemekten, okumaktan ya da izlemekten oluşan bir bilgi akışı yok.
Anlık olarak cevaplar vermemizin ve tepkilerimizi belirtmemizin mümkün olduğu yüksek bir etkileşimlilik durumu söz konusu. Geleneksel medyada kullanılan en önemli araçlardan biri olan televizyonda ise üç ya da beş büyük kanal genel izleyici kitlesini kendine çekiyor, o kanallarda ne pişiyorsa izleyici de onu alıyordu.
Buraya kadar her şey iyi gibi duruyor değil mi?
Sonuçta kapitalist “demokrasi”nin bizlere vaat ettiği “şeffaflık”, “eşitlik” ve “özgürlük” teknolojik aygıtların da geldiği seviye açısından artık mümkün olabilir gibi gözüküyor?
Maalesef mesele bundan biraz daha karmaşık. Bunu anlamak için, çokça kullandığımız şu önemli soruları sormamız gerekiyor: ”ne?“, “nasıl?” ve “kimin için?”
Hangi algoritma ne işe yarar?
Herhangi bir büyük sosyal medya platformunun arkasında birçok algoritma var. Bir dizi algoritma, içeriği işler. Başka bir algoritma seti bunu yayar, yani kimin neyi gördüğünü belirlemeye yardımcı olur. İçeriği işleyen algoritmalar, yeni türdeki içeriklerin ortaya çıkması ve yeni algoritmik yeteneklerin gelişmesi gibi değişen koşullara göre sürekli olarak güncellenir ve adapte edilir. Yani akıcı bir özelliğe sahiptir.
İçeriği yayan algoritmalar ise daha sabittir, içeriğin nasıl yayıldığına dair temel süreçlerde genellikle büyük değişiklikler olmaz ve algoritmaların ana işlevleri sabit kalır. İçerik öneri algoritmaları, sosyal medya akışlarımızı oluşturur. YouTube kenar çubuğu önerileri gibi birkaç yerde daha görünürler. Bunlar sosyal medya veya kullanıcı tarafından oluşturulan içeriklerle sınırlı değildir: Netflix'teki film önerileri ve Amazon'daki ürün önerileri aynı algoritma sınıfına aittir.
Öneri algoritmaları neden önemlidir? Arama algoritmasıyla karşılaştırıldığında öneri algoritması, etkileşimin daha büyük ve giderek artan bir kısmını sağlar. Daha da önemlisi, platform kullanıcıya ne tavsiye edeceği konusunda neredeyse tam kontrole sahipken, arama sonuçları arama terimi tarafından nispeten sıkı bir şekilde kısıtlanır.
Her ne kadar günümüzde neredeyse bütün sosyal medya platformları algoritmik modeller de kullansa da, eskiden tek seçenek olup şimdilerde algoritmik modellerle sentez edilen birkaç yöntem gözünüze aşina gelecektir. Bunlar; “abonelik” ve “ağ” modelleri olarak belirtilebilir. Abonelik modelinde gönderi, gönderi sahibine abone olan kişilere ulaşır.
Ağ modelinde, onu gören kullanıcılar onu daha fazla yaymayı seçtiği sürece ağ boyunca basamaklanır. Abonelik modeli basittir: Her kullanıcı bir grup yaratıcıya abone olur ve yayınları, yaratıcıların gönderilerinden oluşur. Geleneksel medyada buna yayın diyoruz. Bir dizi gazeteye veya kablolu yayın kanalına abone olursanız alacağınız içerik budur.
Başlangıçta (2000'li yıllarda), ne Facebook'un ne de Twitter'ın akışınızdaki gönderileri yeniden paylaşma veya “retweetleme” olanağı yoktu. Bu kritik özellik, abonelik modelini ağ modelinden ayıran şeydir. Ağ modelinde, bir kullanıcı sadece abone oldukları kişilerin oluşturduğu gönderileri değil, aynı zamanda bu kullanıcıların yaymayı seçtiği gönderileri de görür, bu da gönderinin viral olma olasılığını yaratır. Twitter, algoritmik olarak sıralanan akışı 2016'da tanıtmadan önce, neredeyse tamamen ağ modelini takip ediyordu. Bu modellerin yayılımını daha iyi anlamak için aşağıdaki figüre bakabiliriz:
Günümüzde neredeyse hiçbir gerçek platform herhangi bir modele tamamen bağlı değildir. Örneğin, abonelik ve ağ modellerini uygulayan platformlar bile öneri algoritmalarını önemli bir şekilde kullanma eğilimindedir. Bunun sebebi, hangi gönderilerin dahil edileceğini veya hariç tutulacağını belirlememekle birlikte, kullanıcının akışındaki gönderileri sıralamaktır.
Son yıllarda abonelik ve ağ modelinden algoritmik modele doğru bir geçiş söz konusu ancak bu türden değişimlerin, bir işletme olarak platform üzerinde, yayılan içerik türü ve kullanıcı deneyimi kapsamında büyük etkileri olabiliyor. Örneğin Instagram'ın bazı değişiklikleri, bu değişiklikleri geri almaya zorlayan bir kullanıcının tepkisine yol açtı.
'Viral' nedir? Ne değildir?
Bu kavramlara daha hakim olduğumuza göre, önceden bahsettiğimiz “viral” kavramına dönelim. Sosyal medyada viral gönderiler etkileşim oranını yükselttiği ve geniş bir etki alanı yarattıkları için bunun ne olduğunun anlaşılmasında fayda var.
Bu iki tweet’i ele alalım. Sizce hangisi viral bir tweet olmuştur?
İlk bakışta Joe Biden’ınki gibi görünüyor, öyle değil mi? Retweet ve beğeni sayısına dayanarak, @JoeBiden'in tweet'inin daha popüler olduğunu söyleyebiliriz. Ancak virallik popülerlik değildir. Virallik, içeriğin bir virüs gibi yayılıp yayılmadığıyla ilgilidir, yani ağdaki kişiden kişiye yayılması olarak düşünebiliriz. Bu ölçülebilirdir ve bir şeyin ne kadar viral olduğunu yakalayan “yapısal virallik” adı verilen tek bir sayı atayabiliriz.
Yapısal virallik şu sorunun cevabıdır: "Gönderi ağda gönderi sahibinden ne kadar uzağa gitti?" @JameelJaffer'ınki gibi bir tweet'in basamaklı düzeni, orijinal hesabı takip etmeyen birçok kişi tarafından retweetlenerek soldaki şekile benzerken, @JoeBiden'ın tweeti sağdaki şekile benzer. Onun tweet’ini beğenen hesaplar zaten onu takip eden hesaplar olmuştur. Bir gönderinin yapısal viralliği, ilgili ağaçtaki kullanıcılar arasındaki ortalama ayrılık derecesinin sayısıdır. Ağaç ne kadar derin olursa, dal sayısı da o kadar fazla olur.
Örnek vermek gerekirse, en azdan en çok virale doğru sıralanmış, değişen virallik derecelerine sahip altı gerçek Twitter akışının gösterimi şu şekildedir:
Kullanıcı davranışının öngörülemezliğinin kaçınılmaz olduğu unutulmamalı. Bir kullanıcının günün hangi saatinde uygulamada olduğuna bağlı olarak, akışlarında görecekleri gönderiler önemli ölçüde farklılık gösterebilir. Gönderilerin yalnızca küçük bir kısmı viral haline gelmektedir. Bu, viraliteyi tahmin edilemez yapan en önemli faktörlerden bir tanesidir. Bu durum, yalnızca küçük bir kısmın viral olma olasılığının yüksek olması gerçeğiyle daha da kötüleşir.
Yapısal virallik üzerine yapılan bir çalışma bunu (içerik üreticisi başına değil, küresel düzeyde) nicel olarak belirlemiştir: Veritabanlarında, 100.000 tweetten daha azı 1.000 kez retweetlenmiştir. 2022 tarihli bir makale bunu TikTok ve YouTube için şöyle ölçüyor: TikTok'ta bir hesabın videolarının ilk %20'si, görüntülemelerin %76'sını alıyor ve bir hesabın en çok görüntülenen videosu, ortalama videodan ortalama 64 kat daha popüler oluyor. YouTube'da, bir hesabın videolarının ilk %20'si görüntülemelerin %73'ünü alır ve bir hesabın en çok görüntülenen videosu ortalama videodan ortalama 40 kat daha popülerdir. (Benjamin Guinaudeau et al., Fifteen Seconds of Fame: TikTok and the Supply Side of Social Video, 4 Computational Commc'n Rsch. 463, 2022).
Algoritmalar nasıl taraf tutar?
Mercek altına aldığımız algoritmalarla ilgili aklımızda bulundurmamız gereken diğer bir şey ise, algoritmaların da tarafsız olmayabilecekleridir. Algoritmaların karar alma mekanizmasını oluşturan temel unsurlardan biri eğitildikleri veri setleridir.
Eğer bu veri setleri önyargılı, eksik veya yanıltıcı ise, algoritmalar da yanıltıcı sonuçlar üretebilir. Örneğin, bir algoritma belirli bir demografik grubu ya da toplumsal sınıfı temsil etmeyen verilerle eğitilirse, bu gruplar hakkında kararlar verirken adil olmayabilir. Bu algoritmalar, bir gönderinin “doğruluğunu” ya da “güncelliğini” değerlendirme kapasitesine zaten sahip değildir. Zaten kimin için neyin doğru olduğu sorusu başka bir konudur.
Twitter’ı neden satın almak istersiniz?
Elon Musk'ın Twitter'ı devralmasından sonra, platformun algoritmalarında önemli değişiklikler yapıldığı ve bu değişikliklerin sağ siyasi görüşü içeren veya öfke ve diğer güçlü duygusal tepkileri artıran tweetleri öne çıkardığı gözlemlenmiştir.
Sosyal medya şirketleri, kendi şirket politikaları gereğince “zararlı” ve “yanıltıcı” içerikleri tespit etmek için birtakım araçları bünyesinde bulundurur. Bu tespit sürecinde ise “otomatik filtreleme” ve “manuel inceleme” işlemleri yapılır. Hiçbir şirket bu detayları kendi gizlilik politikaları kapsamında paylaşmadığı için, bu “filtreleme” neye göre yapılıyor ya da “manuel” inceleme sırasında neye dikkat ediliyor sorusunun cevabı tam anlamıyla bulunmamaktadır.
Örnek olarak bir cinayet suçuna dair görüntülerin paylaşılmasının engellenmesi ile muhalif bir siyasetçinin sosyal medya hesabının bloke edilmesi arasında ciddi farklar bulunuyor ve ikincisinin sıklıkla gerçekleşmesi, bu araçlar ve politikalar hakkında tartışma yaratabiliyor. Bunlar dezenformasyona karşı dikkatli olunmasını gerektiren durumlar olarak karşımıza çıkıyor.
Dezenformasyon, kitle manipülasyonu, 'sosyal' medya ve 'sosyal' botlar
Dezenformasyonun bilinçli yönlendirilmesi noktasında kitle manipülasyonu bir hayli olası hale geliyor. Sosyal medya üzerinden bu manipülasyonu uygulamak için kullanılan en uygun araçlardan biri ise bizim sosyal medya botları diye bildiğimiz otomatik programlardır.
Bu botlar, kısmen veya tamamen otonom bir şekilde davranır ve genellikle insan kullanıcıları taklit edecek şekilde tasarlanmıştır. İyi niyetli sosyal medya botları olsa da, birçok sosyal medya botu dürüst olmayan ve kötü amaçlarla kullanılır. Twitter yöneticileri, ABD Kongresi önünde verdikleri ifadelerde, Twitter hesaplarının %5'inin botlar tarafından işletildiğini belirtmişlerdir. Bot davranışlarını tespit etmek için tasarlanmış algoritmaları uygulayan uzmanlar, bu sayının %15'e daha yakın olabileceğini bulmuşlardır. Bu sayının diğer sosyal platformlar için de geçerli olması muhtemeldir.
Ancak bu konuda yapılan araştırmalar bot hesapları tespit etmek için tasarlanan algoritmaların o kadar da doğru sonuçlar vermediğini göstermektedir. Bot algılama modellerinin sınırlı veri setleriyle eğitildiği ve bu nedenle gerçek dünya uygulamalarında yüksek hata oranlarına sahip olabileceği belirtilmektedir. Daha etkili bot algılama için veri şeffaflığının artırılması gerektiği vurgulanmaktadır.
MIT araştırmacıları Chris Hays, Zachary Schutzman, Manish Raghavan, Erin Walk ve Philipp Zimmer, yeni yayımlanan makalelerinde, bot tespit modellerinin iddia edilen yüksek doğruluk oranlarının aslında bu modelleri eğitmek için kullanılan verilerdeki kritik bir sınırlamadan kaynaklandığını bildirmişlerdir. Bu da bot hesaplarının yüzdesinin daha bile çok olabileceğini göstermektedir.
Bazı veriler
Sayısal bir istatistik vermek gerekirse, hakemli bir dergi olan First Monday tarafından yapılan bir araştırma, 2016 ABD başkanlık seçimlerinden bir gün önce, sosyal medyada siyasi tartışmaların %20'sinin yaklaşık 400.000 sosyal medya botu tarafından oluşturulduğu sonucuna varmıştır. Ayrıca, 2010-2012 “Arap Baharı” sırasında, devlet kurumları sosyal medya akışlarını boğmak için Twitter botlarını kullanmıştır. Bu botlar, protestocuların ve aktivistlerin mesajlarını bilinçli olarak aşağıya itmek için kullanılmıştır.
Oxford'un "Sosyal Medya Manipülasyonu: Siyasi Aktörler Tarafından Sanayi Ölçeğinde Bir Sorun" adlı raporuna göre, 2020'de 81 ülkede organize manipülasyon kampanyaları tespit edilmiş. Hükümetler, siyasi partiler ve özel firmalar, sahte haber yaymak için milyonlar harcıyor. Raporda, siber birliklerin devlet ajanslarıyla bağlantılı olduğu ve stratejik iletişim firmalarının bu propaganda yayılımında büyük rol oynadığı belirtiliyor.
62 ülkede kamuoyunu şekillendirmek için hesaplamalı propaganda kullanan bir devlet ajansının kanıtlarının bulunduğu, 48 ülkede ise hesaplamalı propagandanın yayılmasında artan bir rol oynayan özel “iletişim” firmaları ile çalışan devlet aktörleri tespit edilmiştir. Araştırmacılar, siber birliklerin kamuoyunu manipüle etmek için farklı iletişim stratejilerini nasıl kullandığını incelemişlerdir. Bu stratejiler arasında dezenformasyon veya manipüle edilmiş medya oluşturma, veri odaklı hedefleme ve karalama kampanyaları düzenleme veya çevrimiçi taciz gibi kötü niyetli stratejilerin kullanımı bulunmaktadır. Rapora göre; 76 ülke, kampanyalarının bir parçası olarak dezenformasyon ve medya manipülasyonunu; 30 ülke, belirli kullanıcıları siyasi reklamlarla hedeflemek için veri odaklı stratejilerini; 2019'da 59 ülke, siyasi rakipleri veya aktivistleri saldırmak için devlet destekli trolleri kullanmıştır.
Rachel Levinson-Waldman, Harsha Panduranga, Faiza Patel tarafından hazırlanan “ABD Hükümeti Tarafından Sosyal Medya Gözetimi” adlı raporda, ABD hükümeti kurumlarının (İç Güvenlik Bakanlığı, FBI ve Dışişleri Bakanlığı gibi federal kurumlar) sosyal medyayı denetlediğine; bu denetlemenin ise soruşturma yürütmek, “tehditleri” tespit etmek ve göçmenleri taramak için kullanıldığına değinilmiştir. Bu izleme faaliyetlerinin ifade özgürlüğü ve mahremiyet açısından riskler taşıdığı ifade edilmekte ve bunca denetimin güvenlik hedeflerine yönelik olup olmadığında ise soru işaretleri bulunmaktadır.
Denetim faaliyetleri sırasında sıklıkla hatalar yaşanmaktadır. Örneğin, New York Polis Departmanı 19 yaşındaki Jelani Henry'yi yanlışlıkla cinayete teşebbüs suçundan tutukladı. Ardından, kefaletle serbest bırakılma talebi reddedildi ve büyük ölçüde savcıların, Jelani'nin sosyal medyada yaptığı "beğeniler" ve fotoğrafların onu şiddetli bir çetenin üyesi olarak gösterdiğini düşünmeleri nedeniyle bir buçuk yıldan fazla bir süre hapiste kaldı. Bir diğer örnek ise, ABD İç Güvenlik Bakanlığı yetkililerinin Harvard'da eğitim almak için gelen bir Filistinli öğrencinin arkadaşlarının sosyal medya paylaşımlarının içeriği nedeniyle ülkeye girişini engellemesiyle alakalı. Öğrenci, ABD hükümetini eleştiren bu paylaşımları ne yazmasına ne de onlarla etkileşime geçmesine rağmen ülkeye sokulmadı.
“Doğru”ya kim karar veriyor?
Dezenformasyonun bilinçli yönlendirilmesi ve kitle manipülasyonu konusu sosyal medya patolojilerinin çoğunun ya insan davranışına ya da bilgi yayılımını yöneten algoritmalara atfedildiği tartışmalarını beraberinde getiriyor.
Mesela Twitter'da insanların çok negatif olduğu ve Twitter algoritmasının bu negativiteyi ödüllendirdiği şeklinde iki farklı görüş ortaya çıkıyor. Özellikle platformlara erişimlerin kısıtlı olması sebebiyle hangi görüşün doğru olduğu muğlak kalıyor. Ayrıca aynı algoritmalar, reklamcılık ve pazarlama faaliyetleri için verilerinizi ve davranışlarınızı depolayıp kullanmaktan da çekinmiyor. Tıkladığınız gönderilere göre karşınıza çıkan reklamlar da ondan oluyor yani.
Bu algoritmalar kendi kendilerine oluşmuyor, belirli direktifler altında, makine öğrenmesi, derin öğrenme, doğal dil işleme gibi süreçlerden geçerek geliştiriliyor. Geliştirilen bu teknolojilerin bir iş modelinin yapıtaşları olduğunu unutmayalım. Her iş modelinin tasarım önceliği, sahibine yani kuruluşuna, yarattığı değerden ne kadar kâr ettirdiğidir. Kapitalizmde de, her nasıl ki üretim araçları sermaye sınıfının elinde ve sermaye sınıfının uğruna kullanılıyorsa, sosyal medya hizmeti veren ve kendi ağlarına müdahale edebilen büyük şirketler de sermaye sınıfına ait olduğundan, bu algoritmalar yine o sermaye sınıfına kâr ettirecek ve gerekirse adil gözüken kuralları eğip bükebilecek şekilde dizayn ediliyor.
O halde bakmamız gereken yer teknolojinin kendisinden ziyade, bunların kim tarafından nasıl geliştirildiği olmalıdır. Bu platformların ve benzerlerinin sosyalist bir dünyada, işçi sınıfının iktidarında gereksizleşip gereksizleşmeyeceğini ya da insanlığın ilerlemesine katkı sağlayıp sağlayamayacağını ise düşünmeden edemiyor insan.