İnternet’te kelime ve kalıpların doğuşu, yaşamı ve tükenişi



Yüklə 68,08 Kb.
tarix04.11.2017
ölçüsü68,08 Kb.
#30401


İnternet’te kelime ve kalıpların doğuşu, yaşamı ve tükenişi


Ahmet Engin Ural

Koç Üniversitesi

Bilgisayar Bölümü

aural@ku.edu.tr



Deniz Utku

Boğaziçi Üniversitesi

Yönetim Bilişim Sistemleri Bölümü

deniz.utku@boun.edu.tr





ÖZET
Günlük konuşmalarda kullanılan bazı deyişlerin nasıl doğduğunu, nasıl tutulup geniş kitlelerce kullanıldığını ve nasıl öldükleri, popüler bir web sitesi olan Ekşi sözlük üzerinde incelendi. Çıkan sonuca göre; toplulukta daha popüler olan kullanıcılar daha fazla deyiş yaratıyor ve kullanıyorlar. Nedensellik ise bu araştırmanın kapsamına girmiyor.
ABSTRACT
Bu makalenin amacı, günlük konuşma kalıplarının yaşamlarının izini sürmektir. Bir deyişin ortaya çıkışı, yayılıp tutulma süreci, eğer tutulmazsa ölüşü gözlenecektir. Ayrıca, deyişin yaratıcıları üzerine de odaklanılacaktır. Bu projenin cevaplamaya yeltendiği soru: “Tutulan deyişleri kim yaratır ve bu deyişleri yaratan ve kullananlar hep popüler kişiler midir?” Tüm bu soruları cevaplamak için, kolektif, çok kullanıcılı bir web sitesi olan ‘ekşi sözlük’ verisi kullanılacaktır. Özellikle bu sitenin seçilmiş olmasının sebebi, metin tabanlı büyük bir veritabanına sahip olması, çok kullanıcılı bir ağ oluşu, ve popülarite ölçümünün mümkün olmasıdır.
Anahtar Kelimeler: Sosyal dilbilim, İnternet, sosyal ağ analizi, memetik
1. GİRİŞ
İlk kim “Fol yok yumurta yok” demiş? Cevap yok? Peki, bu deyiş ne zaman yayıldı? Yine cevap yok? Belki soru yanlıştı; neden insanlar bu deyişi bu kadar uzun süredir kullandılar? İlk kullanan kişi neden böyle yeni bir terim yaratmıştı? İşte bu makale bu tip soruları yanıtlamaya çalışacak.
Fikirlerin, düşüncelerin veya deyişlerin yaşamlarının izini sürmek zordur. İlk olarak, ağızdan her çıkan kelimenin saklandığı bir veritabanı yoktur. İkincisi, insanlar arasındaki sosyal ilişkilerin tam olarak incelenmesi imkânsızdır. Son olarak da, bir deyişi anlamanın, hatırlamanın ve kullanmaya karar vermenin ardında yatan zihinsel süreçlerin tam olarak incelenmesi çok zor bir iştir.
Bu makalenin tezi, kişilerin popülerlikleri ile yeni icat edilen deyişleri kullanma eğilimleri arasında korelasyon olduğudur. Özellikle, sosyal bir grupta, bir kişinin yeni deyişler yaratma veya önceden yaratılmış deyişleri daha kapsamlı olarak kullanabilme gücü, o kişinin grup içindeki popülaritesiyle ilişkilidir. Nedensellik, bu makalenin kapsamı dışındadır.
Belirsizliği gidermek için, terimleri netleştirelim. Popülariteyi nasıl ölçeriz? Bu, ileriki bölümlerde çözeceğimiz zor bir hesaplama. Her ağızdan çıkan kelimeyi barındıran bir veritabanı var mı? Hayır. Peki ya sosyal ağlar? Doğal dilleri kullanan kişilerin bir topolojisi var mı? O da yok.
Artık 21. yüzyıldayız; dünya inanılmaz bir hızla değişti. Tüm dünya, tek bir ağda birleşti: İnternet. İnternet bizlere, gerçek insanların oluşturdukları ağlar sunuyor, örneğin arkadaşın-arkadaşı ağları veya çöpçatanlık siteleri, ayrıca insanların düşüncelerinin büyük bir birikim oluşturduğu, Wikipedia gibi veritabanları. Artık bir fikrin, düşüncenin, deyimin veya mimin izini sürmek kolaylaştı. Bir söz öbeğinin ortaya çıkış, yaşam ve ölümü, etkileşimli ve sosyal bir ortamda takip edilebiliyor.
Bu noktada Ekşi sözlük isimli bir web sitesi öne çıkıyor. Yarı-sanal bir insan ağı olan bu site, metin tabanlı bir veritabanı olmasının yanı sıra, yazıların kim tarafından ve ne zaman yazıldığını da kaydediyor.
Özetle, bu makalenin kapsamı, günlük kullanıma giren bir deyişin ortaya çıkışını, yaşamını ve yok oluşunu tespit etmektir. Özel bir web sitesi olan Ekşi Sözlük, bu tespiti mümkün kılan bir araç. Sitenin veritabanında bir deyişin ilk ortaya çıkışı ve yaşamı, zaman eksenli olarak takip edilebiliyor. Ek olarak, kullanıcıların popülariteleri ile yeni bir deyiş yaratma ve yayma veya mevcut deyişleri taklit etmeleri arasındaki ilişkiyi de inceleyeceğiz.
2. METODOLOJİ VE ÇALIŞMANIN YÖNTEMİ


  1. Ekşi sözlük

Ekşi sözlük yaklaşık 10.000 kullanıcı tarafından girilen 11 milyon girdiden oluşuyor. Bazı kullanıcıların yazılarının belirli sebeplerle silinmiş olması yüzünden sitede 6,3 milyon girdi bulunuyor. Bir girdinin uzunluğu için bir sınırlama bulunmadığı için, bir kelimelik girdiler olabildiği gibi, on sayfalık girdilere de olabilir.


  1. Modelleme

Bir deyişin yayılmasını modellemek için çeşitli seçenekler mevcut. İlk seçenek, tüm metinleri tarayarak tüm deyişleri belirlemekti. Öte yandan, bu yöntem iki açıdan verimsiz kalıyor. İlk olarak Türkçenin yapısı nedeniyle morfolojik araçlar kullanılması gerekiyor, ama böylesine büyük bir veri üzerinde morfolojik araçlar kullanılması uzun zaman alacaktır ve büyük depolama alanına ihtiyaç duyacaktı. Ayrıca, sonuçların ümit vaat etmeyeceği, devam edilen benzer araştırmalarda görülmektedir. Tüm metinleri taramanın verimsiz olmasının ikinci sebebi de değişken girdi uzunluğu. Değişken karakter sayısı, n-gram1 analizinde olduğu gibi, dinamik uzunluğu zorunlu kılıyor, bu da süreci ve kapsamı genişletiyor. Sonuç olarak, tüm metinleri taramanın bu çalışma için uygun olmadığına karar verilmiştir.
Bu kısıtlamaları göz önünde tutarak, Ekşi sözlük’teki bağlantı yapısına bir göz atalım.


  1. Ekşi sözlük bağlantıları: ‘bakınız’



Şekil 1: Tipik bir Ekşi Sözlük girdisi
Bir Ekşi Sözlük yazarı farklı şekillerde bağlantı vermeyi seçebilir. Bu, cümlenin içinde seçilen kelimelere doğrudan bağlantı vererek veya “bkz: bağlantı” şeklinde yapabilir.2 Bkz’ler, bu araştırmada önemli bir rol oynayacaktır.
İlk olarak, yazının rengini değiştirerek onun bir bağlantı olduğunu belli eder ve okuyucuların ilgisini çeker. Yeni deyişlerin yaratıcıları ve kullanıcıları için bu önemli bir konudur. Pratikte, Ekşi Sözlük’teki yeni deyişler “bkz” olarak ortaya çıkarlar. İkinci olarak, dilbilimsel bir işlem gerekmediği için bağlantıları çıkarmak çok daha kolaydır. Son olarak da, bağlantı verildiğine göre, bu isimde bir sayfanın varlığından emin olunabilir. Deyişin zaman içindeki gelişimi hakkında, bu sayfadan da faydalanılabilir.
Sonuç olarak, Ekşi Sözlük’te deyişleri tespit etmek için bağlantıları kullanmak en etkili yoldur.



  1. Veriyi işlemek

Tüm başlıklardaki tüm girişler taranarak bkz’ler çıkarıldı. Depolama alanı kısıtlamaları nedeniyle 4 karakterden kısa veriler değerlendirme dışında tutuldu. İşlem sonucunda, tüm başlıklar altındaki 1 milyon bkz toplandı. Popülarite arandığı için, 5 defadan az bkz verilen terimler elendi. Ardından, benzer bağlantılar gruplandı.
3. ÇALIŞMA
Tüm deyişler içinden 220 yeni deyiş ayıklandı. Bu liste hiçbir nesnel ölçüte göre filtrelenmedi ve nesnel bir ölçüt belirlenemedi. Hangi deyişlerin Ekşi Sözlük’e özel olduğunu anlamak için öznel bir değerlendirme gerekiyor. 220 deyişin çoğunun gerçek hayatta kullanımının olmamasına rağmen, bazılarının vardır. Ne var ki, anlamlarındaki farkın nesnel bir değerlendirmeyle açıklanması zordur. Bunun için Ekşi Sözlük topluluğuna aşina bir kişinin değerlendirmesine ihtiyaç vardır.


    1. Deyişler

Deyişleri analiz ettikten sonra, terimler arasında belli bir farklılaşmanın olduğu görüldü. Deyişler, 4 ana kategoriye ayrılıyordu. Diğer bir bahse değer gözlem de, argo içeriğin yoğunluğuydu. Bu veri, Ekşi Sözlük kültürünün günlük hayattan daha liberal ve üretken olduğu tezini de destekliyor.

Aşağıdaki tablolar, kategorilerden bazı örnek deyişler ve tekrarlanma sayılarını gösteriyor. Parantez içindeki sayılar da ilgili kategoride olduğu tespit edilen deyişlerin sayısıdır. Alan kısıtlaması nedeniyle sadece örnek deyişler gösterilmiştir.




      1. Yeni tümceler (68)

adam olamadım bari marjinal olayım

57

yok boyle bisii

710

onerme seklinde baslik acip forum yapmak

47

kahveden adam summon etmek

48




      1. Yeni anlamlar kazanan mevcut terimler (38)

ben bir tespit yapmak istiyorum sayin kirca

45

okudugumuzu anladik mi

48

hayrettin yapma

74

seni kınıyorum ve sana laflar hazırladım

98




      1. Yeni terimler (79)

emrah koş

155

ironiyi anlamayan nesle asina degilim

54

Pisssssmi

171

cok yalnizim be sozluk

114

O kadar strong bir presence var ki

155




      1. Sözlük kullanımı ile ilgili yeni deyişler

uktenin gerzek kullanimi

42

anket bu

102

başucu eserleri

49

Badi

450




    1. Deyişlerin kullanımı




Şekil 2: kusuratli rakam vereyim de salladigim anlasilmasin




Şekil 3: gibi geliyor bana yoksa şüphen mi var
Tablolarda kullanımı gösterilen deyişler, popüler olmuş tipik deyişlerdir. İlk başlarda kullanımları düzensiz olmasına rağmen, sonradan hızlı bir artış olmuş.


Şekil 4: tostumu yedim seni bekliyorum
Bu örnek, yaşamının sonuna gelen, belki de tükenen bir deyişin kullanım yoğunluğunu gösteriyor. Ancak son anda yine yoğunlaşan bir kullanımı olmuş.



Şekil 5: düz adam
“düz adam” hızlı tutan bir deyiş. Bu tip cevap niteliğindeki kısa terimlerin Ekşi Sözlük’te hızlı tuttuğunu varsayabiliriz.


    1. Kullanıcılar

Ekşi sözlük’te 10 bini aşkın kullanıcı var. Kullanıcıların Sözlük’te geçirdikleri zamanlar, “karma” adı verilen bir puanlama sistemi ile hesaplanan popülerlikleri, üretkenlikleri ve kalıplaşmış deyişleri kullanma şekilleri birbirlerinden farklı. Aşağıdaki grafik, kullanıcıların Ekşi Sözlük deyişlerini kullanım sayılarına göre dağılımını gösteriyor.




Şekil 6: Kullanıcıların deyişleri kullanma sayıları
Yukarıdaki şekil, tezimizi desteliyor: bazı kullanıcılar deyişleri kullanmada uzmanlaşmışlar ama çoğu kullanıcı bu deyişleri hiç kullanmıyor. Aynı “gerçek” hayatta olduğu gibi. Günlük hayatta da herkes deyimleri kullanmazken, bazıları çok kullanır.
Bu noktada soru “Kim bu insanlar?” oluyor. Deyimlerde usta olmak için gerekli olduğu düşünülen, ilk akla gelen özellik; ileri dil bilgisi. Ancak bu tahmini böylesine bir ortamda doğrulamak çok zordur. İkinci akla gelen özellik ise, deyişleri kullanmadaki ustalığın popülerlik ve tanınmışlık ile bir ilişkisi olduğu. Demek ki bir popülerlik ölçütünün bulunması gerekiyor.

Mahlas

Yeni terimler

Mevcut kelime, yeni anlam

Ekşi Sözlük kullanımı ile ilgili terim

Yeni deyiş

Toplam

marlboro insani

111

16

50

36

213

386 dx

60

11

83

35

189

atlantis

18

14

28

36

96

spincrus

17

6

50

20

93

iett 99 806

79

0

1

12

92

spinapubica

30

3

20

30

83

barbie

24

1

35

17

77

kurukafa

25

8

12

26

71

nuitari

21

5

8

37

71

ssg

21

8

22

12

63

lecagot

18

4

24

17

63

Tablo 1: En çok deyiş yaratan 10 kullanıcı
Popülerliği iki yolla ölçmek mümkün. İlk yol zaten ölçülmekte olan popülerlik puanlarına erişmek. Ne var ki sistem tarafından ölçülen popülerlik sadece dilin kullanımı ile ilgili değil. Politik ve dini altyapılar, mizah anlayışları ve insanlar arasındaki sosyal ilişkiler de önemli bir rol oynuyor popülerlik puanında. Diğer bir yol da, yazarın ne kadar tanınmış olduğu bilgisini kullanmak. Bu bilgi daha temiz olduğu için, bunu korelasyon için kullanıyoruz.
Bir kullanıcının tüm ağa ne kadar iyi bağlı olduğu bilgisi gizlidir. Neyse ki, site sahibi ricamız üzerine bu veriyi bizimle paylaştı.


    1. Korelâsyon




Korelâsyon katsayısı

Kalıpların türleri

0.390709691

Tüm deyişler

0.315177725

Yeni kalıplar

0.333659784

Mevcut terime yeni anlam eklenmesi

0.307259795

Ekşi sözlük kullanımı hakkında terimler

0.336408316

Yeni deyişler

Tablo 2: Türlerine göre deyişlerin korelâsyonları
5. SONUÇLAR
Bu çalışma, özellikle Türk dili için yeni bir yaklaşımdır. İnsan ağları ve doğal dik analizi için İnternet kaynaklarının kullanılması da yeni bir yaklaşımdır ve verimli olduğu görülmüştür.

Bu çalışmanın sonuçları, “bir kullanıcının popülerliği ile deyişleri sık kullanması ilişkilidir” tezimizi doğrulamıştır. Ancak önceden de belirtildiği gibi, nedensellik konusunda bir çıkarım yapılmamıştır.





1 http://en.wikipedia.org/wiki/N-gram

2 Bundan böyle tüm bağlantılardan kısaca ‘bkz’ olarak bahsedilecektir.




Yüklə 68,08 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin