Montaj, dublaj, patinaj

Geçtiğimiz hafta, politikacılardan gazetecilere pek çok kişi, adli sesbilim uzmanıydı. Önce, oğluyla arasında geçtiği öne sürülen ses kaydı için Recep Tayyip Erdoğan kafiyeli bir yanıt verdi: Montaj ve de dublaj. Bu kararsız açıklamanın ardından, montaj mı dublaj mı, şantaj mı, sabotaj mı, yoksa AKP’ye bir tür mesaj mı olduğu tartışılırken Bilim, Sanayi ve Teknoloji Bakanı Fikri Işık’tan, bakanlığının adına yakışır bir açıklama geldi: “Montaj olduğunu hissettim.” Sonrasında yandaş basın, kaydın kurgulandığını gösteren bir rapor yayımladı, ancak raporu yazdığı iddia edilen firma böyle bir rapor yazmadığını, dahası yazamayacağını, zira adli sesbilim konusunda uzmanlaşmadıklarını söyledi. Yandaş basın bu defa bir başka firmaya beş ayrı telefon görüşmesinden oluşan kaydın süreklilik içerip içermediğini sordu, firma da doğal olarak süreklilik içermediğini belirtti. Zaten Türkçe bilseler çözümleme zahmetine girmeden beş ayrı görüşme olduğunu da anlayacaklardı. Böylece “montaj” iddiası geçerliliğini büyük ölçüde yitirmiş oldu.

İkinci iddia dublajdı. Yani, söz konusu ses kaydında konuşanların Recep Tayyip Erdoğan ve Bilal Erdoğan olmadığı iddiasıydı. Bu konu adli sesbilim alanında “konuşucu tanıma” olarak adlandırılır ve bu işlem, ses örneğinin iddia edilen kişiye ait olup olmadığının belirlenmesi anlamına gelen “konuşucu doğrulama” ve ses örneğinin kayıtlı örneklerden hangisine ait olduğunun belirlenmesi anlamına gelen “konuşucu belirleme” biçiminde iki yolla yapılır. Bu örnekte yapılması gereken konuşucu doğrulama işlemiydi. Ancak şimdiye dek böyle bir çözümleme yapılmadı.

Peki, herkesin konuşma sinyalleri birbirinden gerçekten farklı mıdır? Aslında, bir sesi diğerinden ayıran sesbilim özellikleri aynı dilin konuşucuları için farklılık göstermez. Aksi halde, aynı dili konuşanların birbirini anlaması da olanaksız olurdu. Söz gelimi, dere ile bere sözcüklerini ele alalım. Burada anlam ayırt edici en küçük birimler /d/ ve /b/ sesbirimleridir. Anlam ayırt edici birim, yani sesbirim oldukları için bu birimleri birbirinden kolaylıkla ayırt edebiliriz. Oysa tek bir sözcük içinde bile aynı olduğunu düşündüğümüz birimlerin birbirinden farklılaşması söz konusudur. Söz gelimi dere sözcüğünde aslında farklı [e] ve [ɛ] sesleri bulunmaktadır. Aynı şekilde bere sözcüğünde de bu böyledir. Bunları kulağımızla ayırt etmek oldukça zordur. Biraz daha ayrıntılı bir çözümlemede, aynı sözcüğü sesleten iki ayrı konuşucunun ürettikleri konuşma sinyalinin de farklılaştığını görürüz. İşte konuşucu tanıma bu tür bir çözümlemeye dayanır.

Aslında bakan, “montaj” değil de “dublaj olduğunu hissettim” deseydi daha iyiydi. Çünkü, günlük yaşamda konuşucular tanıdıkları ya da birkaç kere duydukları konuşma sinyallerini kolaylıkla ayırt edebilmektedirler. Zihinsel olarak konuşma sinyallerini ayırt etme işlemi çok yönlü olduğundan, konuşucu tanıma yöntemlerinde de birbirinden çok farklı özellikler, olanak olduğunca geniş bir veri tabanı kullanarak ele alınmaktadır. Perde frekansı, formant frekansı, enerji gibi çeşitli parametrelerin ölçümlerinin yanı sıra vurgu, süre gibi parçalarüstü sesbirimlerin özellikleri de veri tabanındaki öğelerle karşılaştırılır.

Geldiğimiz noktada, çelişkili açıklamalar ve sahte raporlar olup bitenin ne montaj ne de dublaj olduğunu söylüyor, olup biten basbayağı patinaj. Recep Tayyip Erdoğan ve çevresindekilerin bu konudaki görünümü, kaygan zeminde yol alamaya çalışan bir araç gibi, boşa nefes tüketiyor. Yapılacak şey, adli konuşucu tanıma yoluna başvurmak. Unutulmamalı ki bu yol sadece suçun saptanmasında kullanılmıyor, aynı zamanda suçsuzluğun kanıtlanmasında da etkin bir araç olarak kullanılıyor.