MiLLİ Dİl korpuslari və onlarin formalaşmasi priNSİPLƏRİ



Yüklə 235,68 Kb.
səhifə17/41
tarix05.01.2022
ölçüsü235,68 Kb.
#111770
1   ...   13   14   15   16   17   18   19   20   ...   41
1.3. Korpusların təsnifi
Korpusların təsnifi seçilmiş meyardan asılıdır. Format meyarına görə korpus qeyri-elektron və elektron korpus tiplərinə bölünür. Qeyri-elektron korpuslar daha əvvəlki dövrlərə aiddir. Hazırda yalnız elektron korpuslardan istifadə olunur.

Korpus təsnifində tətbiq edilən ikinci meyar mətnlərin korpusa daxil olunma xüsusiyyətidir. Braun korpusuna müxtəlif mətnlərdən təqribən eyni həcmli mətn hissələri toplanmışdır. Ona görə də, bu korpus seçmə mətndir. Korpuslar tam mətnli də olur. Bu halda tam mətn korpusa daxil edilir. Yazılı abidələrin korpusuna abidənin bütün mətni salınır. Ümumiyyətlə, korpusa mətnin tam şəkildə daxil edilməsi qarşıya qoyulan tədqiqat vəzifələrindən asılıdır. Əgər müəyyən yazıçının və ya şairin dili öyrənilirsə, bu zaman onun əsərlərinin tam mətnləri korpusda öz yerini tutur.

Korpuslar statik və yenilənən olmaqla iki qrupa bölünür. Braun korpusu, LOB, LLC, COCA korpusları tamamlanmış sayılır. Onu da qeyd edək ki, bu korpuslar da müxtəlif dövrlərdə təkmilləşdirilmiş, onların həcmi və proqram təminatında dəyişmələr aparılmışdır. Hazırda yaradılan milli korpuslar açıq saxlanılır və yeni materiallarla zənginləşdirilir. Bu imkan həm də müasir kompüter texnologiyasının inkişafı ilə əlaqədardır. Elektron daşıyıcılarındakı materialların, mətnlərin miqdarı günbəgün artır. İndi mətnlərin elektron daşıyıcılarında toplanması üçün əlavə emala ehtiyac yoxdur. İnternetdə qəzetlər, jurnallar və bədii ədəbiyyat yerləşdirilir. Korpusun qurulması üçün bu materialların hər hansı birindən istifadə etmək mümkündür. Təsadüfi deyil ki, internet özü böyük korpus adlandırılır.

Korpus materialının hansı nitq növünə aidliyi meyarına görə yazılı və şifahi nitq korpusları fərqləndirilir. Eyni korpusda həm yazılı, həm də şifahi nitq materialı yerləşdirilə bilir.

Dil materialının fərqliliyi də müxtəlif korpusların qurulmasına səbəb olur. Korpus linqvistikasında standart dil, sosial dialektlər, slenqlər, dilin variantları korpuslarının yaradılması təcrübəsi vardır.

Dil tarixinin dövrləri üzrə korpusların qurulması mümkündür. Bundan başqa, birdilli, çoxdilli korpuslar, dil qrupları korpusları yaradılır. Korpusların janr və üslublar üzrə də təşkili də maraq doğurur.

Ümumiyyətlə, korpusların təsnifi meyarları dairəsi kifayət qədər genişdir. Bu meyarlar korpusların təyinatı ilə bağlılığa malikdir. Kompüter dilçiliyi inkişaf etdikcə korpuslardan istifadənin yeni formaları axtarılıb tapılır. Korpus linqvistikasının gələcək perspektivləri və tipləri həm də korpus materiallarının annotasiyalaşdı­rılmasına əsaslanır. Morfoloji, sintaktik, semantik, terminoloji markerləmə ən azı bu dörd korpusu qeyd etməyin zəruriliyini təsdiqləyir. Müasir korpuslarda “sintaktik strukturlar bankı” formalaşdırılır.

Korpusların fərqliliyinə baxmayaraq korpusun bölünməsində iki əsas üsulu göstərmək olar.

1) Hər hansısa bir stilə, janra aid olan korpusları təsnifləndirmək

2) Linqvistik kodlaşmaya görə korpusları təsnifləndirmək

Müxtəlif tip korpusların sayı kifayət qədərdir. V.P. Zaxarova görə: “Qoyulmuş məqsəd və göstəricilərdən asılı olaraq müxtəlif tip korpusları fərqləndirmək olar” [54, s.15]. O, korpusun klassifikasiyasını aşağıdakı kimi vermişdir:


Yüklə 235,68 Kb.

Dostları ilə paylaş:
1   ...   13   14   15   16   17   18   19   20   ...   41




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin