Cədvəl 1.2.2
FLOB korpusunda mətn kateqoriyaları
Press: Reportage (Mətbuat)
|
Religion (Din)
|
Skills, Trades and Hobbies (Bacarıq, ticarət və məşğuliyyət)
|
Belles Lettres, Biographies, Essays (Məktub, esse ,bioqrafiya)
|
Science (Elm)
|
General Fiction (Ümumi bədii ədəbiyyat)
|
Mystery and Detective Fiction (Detektiv janr)
|
Science fiction (Elmi ədiyyat)
|
Adventure and Western ( Macəra)
|
Romance and Love story (Sevgi hekayələri)
|
Humour (Yumor)
|
[158]
FLOB korpusunda istifadə olunmuş mətn janrlarının siyahısından görünür ki, onların seçilməsi korpus yaradıcılarından asılıdır. Təbii ki, materialın daha geniş və əhatəli olması korpusun imkanlarını, eləcə də, onun reprezentativliyini artırır.
Rus dilinin milli korpusu: İlk dəfə olaraq rus dilinin korpusu 1980-ci illərdə İsveçdə, Uppsala universitetində yaradılmışdır. Lakin 1980-ci ilə qədər 1960-cı ildə L.N. Zasorina tərəfindən rus dilinin lüğət korpusu yaradılmışdır. Bu lüğətin tərkibinə 1 milyon sözforma həcmində mətnlər toplanmışdır. Mətnlər elmi, ədəbi, siyasi və s. sahələri əhatə edirdi.
1985-ci ildə keçmiş SSRI də akademik A.P. Yerşovun təşəbbüsü ilə rus dilinin maşın fondunun yaradılması üzrə iş başladı. Bu fondun yaradılmasında 40-dan artıq qurum iştirak edirdi. Onların arasında Rusiya EA-nın Rus Dili İnstitutu, Moskva, Sankt-Peterburq, Xarkov, Saratov və s. universitetləri var idi. Fondun məqsədi mətnləri, leksik və qrammatik materialı, habelə, rus dilinin araşdırılması üçün lazım olan digər mənbələri bir yerə toplamaq idi. 1985-1992-ci illərdə artıq rus dilinin maşın fondu, terminoloji bankı, rus dilinin əsas lüğətləri, qısa akademik qrammatikası, ədəbi, siyasi və texniki mətnləri korpusları yaradılmışdır. 1991-ci ildən sonra rus dilinin maşın fondunun yaradılması üzrə işlər dayandırıldı [54, s.70].
O zamandan sonra uzun müddət dilçilərin istifadə edə biləcəkləri bir korpus olmamışdır. Rus dilinin korpusunun yaradılması üçün işlər yalnız 2000-ci illərdən başlanmışdır. Rus dilinin milli korpusu rus mətnlərinin elektron formada toplanmış informasiya sistemi şəklində quruldu. Bu korpus rus dili ilə maraqlanan, müxtəlif suallara cavab axtaran hər kəs üçün nəzərdə tutulmuşdur. Korpusdan tədqiqatçılar, müəllimlər, tələbələr, dilçilər, şagirdlər və s. istifadə edə bilir. Rus dilinin milli korpusu 2003-cü ildən Rusiya Elmlər Akademiyasının “Filologiya və İnformatika proqramı” çərçivəsində davam etdirilir. Rus dilinin milli korpusu təxminən 140 mln-dan çox sözü əhatə edir və gələcəkdə onun həcminin 200 mln-a çatdırılması nəzərdə tutulur [78, s.36].
M.Mahmudov öz əsərində qeyd edir: “Rus dilinin milli korpusunun ən mühüm xüsusiyyətlərindən biri onun balanslaşdırılmış mətn korpusuna malik olması və dili lazımi dərəcədə təmsil edə bilməsidir. Bu, o deməkdir ki, korpus dildə mövcud olan yazılı və şifahi mətnlərin bütün tiplərini imkan daxilində ehtiva edir. Həmin mətnlər dildə malik olduqları paya müvafiq olaraq korpusda təmsil olunmuşlar” [12, s.51]. Rus dilinin milli korpusu müasir korpusların bütün tələblərinə cavab verir. O, müxtəlif janrları - rəsmi-işgüzar, publisistik, dini, bədii, məişət-danışıq və s janrları əhatə edir. Korpusu şərti olaraq 2 yerə bölmək olar: müasir və diaxronik. Müasir korpusa aid olan mətnlər 1951-2010-cu illəri əhatə edir. Digər hissədə isə XVIII, XIX- əsrləri və XX əsrin I yarısını əhatə edən mətnlər toplanmışdır. Rus dilinin milli korpusuna toplanan mətnlərin əsas hissəsi son 200 ili əhatə edir. Ona görə də burada edilən xırda dəyişiklikləri öyrənmək çətin deyildir.
V.P. Zaxarov rus dilinin milli korpusunu aşağıdakı altkorpuslara bölür:
“1. qəzet korpusu - 2000-ci illərin kütləvi informasiya vasitələrində çap olunmuş mətnləri əhatə edir;
Dostları ilə paylaş: |