ÖZET Günlük konuşmalarda kullanılan bazı deyişlerin nasıl doğduğunu, nasıl tutulup geniş kitlelerce kullanıldığını ve nasıl öldükleri, popüler bir web sitesi olan Ekşi sözlük üzerinde incelendi. Çıkan sonuca göre; toplulukta daha popüler olan kullanıcılar daha fazla deyiş yaratıyor ve kullanıyorlar. Nedensellik ise bu araştırmanın kapsamına girmiyor. ABSTRACT Bu makalenin amacı, günlük konuşma kalıplarının yaşamlarının izini sürmektir. Bir deyişin ortaya çıkışı, yayılıp tutulma süreci, eğer tutulmazsa ölüşü gözlenecektir. Ayrıca, deyişin yaratıcıları üzerine de odaklanılacaktır. Bu projenin cevaplamaya yeltendiği soru: “Tutulan deyişleri kim yaratır ve bu deyişleri yaratan ve kullananlar hep popüler kişiler midir?” Tüm bu soruları cevaplamak için, kolektif, çok kullanıcılı bir web sitesi olan ‘ekşi sözlük’ verisi kullanılacaktır. Özellikle bu sitenin seçilmiş olmasının sebebi, metin tabanlı büyük bir veritabanına sahip olması, çok kullanıcılı bir ağ oluşu, ve popülarite ölçümünün mümkün olmasıdır. Anahtar Kelimeler: Sosyal dilbilim, İnternet, sosyal ağ analizi, memetik
1. GİRİŞ İlk kim “Fol yok yumurta yok” demiş? Cevap yok? Peki, bu deyiş ne zaman yayıldı? Yine cevap yok? Belki soru yanlıştı; neden insanlar bu deyişi bu kadar uzun süredir kullandılar? İlk kullanan kişi neden böyle yeni bir terim yaratmıştı? İşte bu makale bu tip soruları yanıtlamaya çalışacak.
Fikirlerin, düşüncelerin veya deyişlerin yaşamlarının izini sürmek zordur. İlk olarak, ağızdan her çıkan kelimenin saklandığı bir veritabanı yoktur. İkincisi, insanlar arasındaki sosyal ilişkilerin tam olarak incelenmesi imkânsızdır. Son olarak da, bir deyişi anlamanın, hatırlamanın ve kullanmaya karar vermenin ardında yatan zihinsel süreçlerin tam olarak incelenmesi çok zor bir iştir.
Bu makalenin tezi, kişilerin popülerlikleri ile yeni icat edilen deyişleri kullanma eğilimleri arasında korelasyon olduğudur. Özellikle, sosyal bir grupta, bir kişinin yeni deyişler yaratma veya önceden yaratılmış deyişleri daha kapsamlı olarak kullanabilme gücü, o kişinin grup içindeki popülaritesiyle ilişkilidir. Nedensellik, bu makalenin kapsamı dışındadır.
Belirsizliği gidermek için, terimleri netleştirelim. Popülariteyi nasıl ölçeriz? Bu, ileriki bölümlerde çözeceğimiz zor bir hesaplama. Her ağızdan çıkan kelimeyi barındıran bir veritabanı var mı? Hayır. Peki ya sosyal ağlar? Doğal dilleri kullanan kişilerin bir topolojisi var mı? O da yok.
Artık 21. yüzyıldayız; dünya inanılmaz bir hızla değişti. Tüm dünya, tek bir ağda birleşti: İnternet. İnternet bizlere, gerçek insanların oluşturdukları ağlar sunuyor, örneğin arkadaşın-arkadaşı ağları veya çöpçatanlık siteleri, ayrıca insanların düşüncelerinin büyük bir birikim oluşturduğu, Wikipedia gibi veritabanları. Artık bir fikrin, düşüncenin, deyimin veya mimin izini sürmek kolaylaştı. Bir söz öbeğinin ortaya çıkış, yaşam ve ölümü, etkileşimli ve sosyal bir ortamda takip edilebiliyor.
Bu noktada Ekşi sözlük isimli bir web sitesi öne çıkıyor. Yarı-sanal bir insan ağı olan bu site, metin tabanlı bir veritabanı olmasının yanı sıra, yazıların kim tarafından ve ne zaman yazıldığını da kaydediyor.
Özetle, bu makalenin kapsamı, günlük kullanıma giren bir deyişin ortaya çıkışını, yaşamını ve yok oluşunu tespit etmektir. Özel bir web sitesi olan Ekşi Sözlük, bu tespiti mümkün kılan bir araç. Sitenin veritabanında bir deyişin ilk ortaya çıkışı ve yaşamı, zaman eksenli olarak takip edilebiliyor. Ek olarak, kullanıcıların popülariteleri ile yeni bir deyiş yaratma ve yayma veya mevcut deyişleri taklit etmeleri arasındaki ilişkiyi de inceleyeceğiz.
2. METODOLOJİ VE ÇALIŞMANIN YÖNTEMİ
Ekşi sözlük
Ekşi sözlük yaklaşık 10.000 kullanıcı tarafından girilen 11 milyon girdiden oluşuyor. Bazı kullanıcıların yazılarının belirli sebeplerle silinmiş olması yüzünden sitede 6,3 milyon girdi bulunuyor. Bir girdinin uzunluğu için bir sınırlama bulunmadığı için, bir kelimelik girdiler olabildiği gibi, on sayfalık girdilere de olabilir.
Modelleme
Bir deyişin yayılmasını modellemek için çeşitli seçenekler mevcut. İlk seçenek, tüm metinleri tarayarak tüm deyişleri belirlemekti. Öte yandan, bu yöntem iki açıdan verimsiz kalıyor. İlk olarak Türkçenin yapısı nedeniyle morfolojik araçlar kullanılması gerekiyor, ama böylesine büyük bir veri üzerinde morfolojik araçlar kullanılması uzun zaman alacaktır ve büyük depolama alanına ihtiyaç duyacaktı. Ayrıca, sonuçların ümit vaat etmeyeceği, devam edilen benzer araştırmalarda görülmektedir. Tüm metinleri taramanın verimsiz olmasının ikinci sebebi de değişken girdi uzunluğu. Değişken karakter sayısı, n-gram1analizinde olduğu gibi, dinamik uzunluğu zorunlu kılıyor, bu da süreci ve kapsamı genişletiyor. Sonuç olarak, tüm metinleri taramanın bu çalışma için uygun olmadığına karar verilmiştir.
Bu kısıtlamaları göz önünde tutarak, Ekşi sözlük’teki bağlantı yapısına bir göz atalım.
Ekşi sözlük bağlantıları: ‘bakınız’
Şekil 1: Tipik bir Ekşi Sözlük girdisi Bir Ekşi Sözlük yazarı farklı şekillerde bağlantı vermeyi seçebilir. Bu, cümlenin içinde seçilen kelimelere doğrudan bağlantı vererek veya “bkz: bağlantı” şeklinde yapabilir.2 Bkz’ler, bu araştırmada önemli bir rol oynayacaktır.
İlk olarak, yazının rengini değiştirerek onun bir bağlantı olduğunu belli eder ve okuyucuların ilgisini çeker. Yeni deyişlerin yaratıcıları ve kullanıcıları için bu önemli bir konudur. Pratikte, Ekşi Sözlük’teki yeni deyişler “bkz” olarak ortaya çıkarlar. İkinci olarak, dilbilimsel bir işlem gerekmediği için bağlantıları çıkarmak çok daha kolaydır. Son olarak da, bağlantı verildiğine göre, bu isimde bir sayfanın varlığından emin olunabilir. Deyişin zaman içindeki gelişimi hakkında, bu sayfadan da faydalanılabilir.
Sonuç olarak, Ekşi Sözlük’te deyişleri tespit etmek için bağlantıları kullanmak en etkili yoldur.
Veriyi işlemek
Tüm başlıklardaki tüm girişler taranarak bkz’ler çıkarıldı. Depolama alanı kısıtlamaları nedeniyle 4 karakterden kısa veriler değerlendirme dışında tutuldu. İşlem sonucunda, tüm başlıklar altındaki 1 milyon bkz toplandı. Popülarite arandığı için, 5 defadan az bkz verilen terimler elendi. Ardından, benzer bağlantılar gruplandı.
3. ÇALIŞMA Tüm deyişler içinden 220 yeni deyiş ayıklandı. Bu liste hiçbir nesnel ölçüte göre filtrelenmedi ve nesnel bir ölçüt belirlenemedi. Hangi deyişlerin Ekşi Sözlük’e özel olduğunu anlamak için öznel bir değerlendirme gerekiyor. 220 deyişin çoğunun gerçek hayatta kullanımının olmamasına rağmen, bazılarının vardır. Ne var ki, anlamlarındaki farkın nesnel bir değerlendirmeyle açıklanması zordur. Bunun için Ekşi Sözlük topluluğuna aşina bir kişinin değerlendirmesine ihtiyaç vardır.
Deyişler
Deyişleri analiz ettikten sonra, terimler arasında belli bir farklılaşmanın olduğu görüldü. Deyişler, 4 ana kategoriye ayrılıyordu. Diğer bir bahse değer gözlem de, argo içeriğin yoğunluğuydu. Bu veri, Ekşi Sözlük kültürünün günlük hayattan daha liberal ve üretken olduğu tezini de destekliyor.
Aşağıdaki tablolar, kategorilerden bazı örnek deyişler ve tekrarlanma sayılarını gösteriyor. Parantez içindeki sayılar da ilgili kategoride olduğu tespit edilen deyişlerin sayısıdır. Alan kısıtlaması nedeniyle sadece örnek deyişler gösterilmiştir.
Şekil 2: kusuratli rakam vereyim de salladigim anlasilmasin
Şekil 3: gibi geliyor bana yoksa şüphen mi var Tablolarda kullanımı gösterilen deyişler, popüler olmuş tipik deyişlerdir. İlk başlarda kullanımları düzensiz olmasına rağmen, sonradan hızlı bir artış olmuş.
Şekil 4: tostumu yedim seni bekliyorum Bu örnek, yaşamının sonuna gelen, belki de tükenen bir deyişin kullanım yoğunluğunu gösteriyor. Ancak son anda yine yoğunlaşan bir kullanımı olmuş.
Şekil 5: düz adam “düz adam” hızlı tutan bir deyiş. Bu tip cevap niteliğindeki kısa terimlerin Ekşi Sözlük’te hızlı tuttuğunu varsayabiliriz.
Kullanıcılar
Ekşi sözlük’te 10 bini aşkın kullanıcı var. Kullanıcıların Sözlük’te geçirdikleri zamanlar, “karma” adı verilen bir puanlama sistemi ile hesaplanan popülerlikleri, üretkenlikleri ve kalıplaşmış deyişleri kullanma şekilleri birbirlerinden farklı. Aşağıdaki grafik, kullanıcıların Ekşi Sözlük deyişlerini kullanım sayılarına göre dağılımını gösteriyor.
Şekil 6: Kullanıcıların deyişleri kullanma sayıları Yukarıdaki şekil, tezimizi desteliyor: bazı kullanıcılar deyişleri kullanmada uzmanlaşmışlar ama çoğu kullanıcı bu deyişleri hiç kullanmıyor. Aynı “gerçek” hayatta olduğu gibi. Günlük hayatta da herkes deyimleri kullanmazken, bazıları çok kullanır.
Bu noktada soru “Kim bu insanlar?” oluyor. Deyimlerde usta olmak için gerekli olduğu düşünülen, ilk akla gelen özellik; ileri dil bilgisi. Ancak bu tahmini böylesine bir ortamda doğrulamak çok zordur. İkinci akla gelen özellik ise, deyişleri kullanmadaki ustalığın popülerlik ve tanınmışlık ile bir ilişkisi olduğu. Demek ki bir popülerlik ölçütünün bulunması gerekiyor.
Tablo 1: En çok deyiş yaratan 10 kullanıcı Popülerliği iki yolla ölçmek mümkün. İlk yol zaten ölçülmekte olan popülerlik puanlarına erişmek. Ne var ki sistem tarafından ölçülen popülerlik sadece dilin kullanımı ile ilgili değil. Politik ve dini altyapılar, mizah anlayışları ve insanlar arasındaki sosyal ilişkiler de önemli bir rol oynuyor popülerlik puanında. Diğer bir yol da, yazarın ne kadar tanınmış olduğu bilgisini kullanmak. Bu bilgi daha temiz olduğu için, bunu korelasyon için kullanıyoruz.
Bir kullanıcının tüm ağa ne kadar iyi bağlı olduğu bilgisi gizlidir. Neyse ki, site sahibi ricamız üzerine bu veriyi bizimle paylaştı.
Korelâsyon
Korelâsyon katsayısı
Kalıpların türleri
0.390709691
Tüm deyişler
0.315177725
Yeni kalıplar
0.333659784
Mevcut terime yeni anlam eklenmesi
0.307259795
Ekşi sözlük kullanımı hakkında terimler
0.336408316
Yeni deyişler
Tablo 2: Türlerine göre deyişlerin korelâsyonları 5. SONUÇLAR Bu çalışma, özellikle Türk dili için yeni bir yaklaşımdır. İnsan ağları ve doğal dik analizi için İnternet kaynaklarının kullanılması da yeni bir yaklaşımdır ve verimli olduğu görülmüştür.
Bu çalışmanın sonuçları, “bir kullanıcının popülerliği ile deyişleri sık kullanması ilişkilidir” tezimizi doğrulamıştır. Ancak önceden de belirtildiği gibi, nedensellik konusunda bir çıkarım yapılmamıştır.
1 http://en.wikipedia.org/wiki/N-gram
2 Bundan böyle tüm bağlantılardan kısaca ‘bkz’ olarak bahsedilecektir.