MiLLİ Dİl korpuslari və onlarin formalaşmasi priNSİPLƏRİ



Yüklə 235,68 Kb.
səhifə13/41
tarix05.01.2022
ölçüsü235,68 Kb.
#111770
1   ...   9   10   11   12   13   14   15   16   ...   41
Cədvəl 1.2.1

Braun korpusunda bədii əsərlərdən nümunələrin sayı

Kateqoriya

Nümunə sayı

Ümumi bədii ədəbiyyat



Novella

20

Qısa hekayələr

9

Cəmi

29

Detektiv janrı




Novella

20

Qısa hekayələr

4

Cəmi

24

Elmi ədəbiyyat




Novella

3

Qısa hekayələr

3

Cəmi

6

Qərb ədəbiyyatı




Novella

15

Qısa hekayələr

14

Cəmi

29

Sevgi hekayələri




Novella

14

Qısa hekayələr

15

Cəmi

29

Yumor




Novella

3

Esse, və s.

6

Cəmi

9

[156]
Göründüyü kimi, korpusda yerləşdirilən material onun həcmi, müəllifi, janr və s. haqqında müvafiq göstəricilər şəklində yerləşdirilir. Bu göstəricilər korpusdan istifadə olunmasını, ondakı məlumatlar barədə informasiya alınmasını asanlaşdırır. Digər korpuslarda, o cümlədən, Böyük Britaniya ingiliscəsinin milli korpusunda bu, nəzərə alınır.

Britaniya ingiliscəsinin milli korpusu: “British National Corpus” böyük korpuslardan biri hesab olunur. Tərkibinə 100 milyon söz daxil edilmişdir. Korpus Oksford universitetində Lankaster universiteti və Britaniya kitabxanasının iştirakı ilə yaradılmışdır. Korpusun 90%-i yazılı ingilis dilini təmsil edir, tərkibinə bədii və sənəd nümunələri, qəzet və jurnal materialları, elmi əsərlər, məktəb və universitet inşaları və s. cəmləşdirir. Korpus, həmçinin, müxtəlif üslubları da əhatə edir və mövzu etibarilə çox zəngindir. Şifahi altkorpusa müxtəlif yaşda olan adamların nitqindən seçmələr salınmışdır. Şifahi nitqdə çoxsayda kontekst iştirak edir. Bura sadə danışıq dili, telefon danışıqları, rəsmi, işgüzar görüşlərdə danışıqlar və s. daxildir. Bu korpus yalnız müasir ingilis dilində olan mətnlərdən ibarətdir. Korpusda həmçinin Britaniya ingiliscəsində işlənən alınma sözlər yer almışdır [54, s.65].

Britaniya milli korpusunda təqdim olunan mətnlər 3 əsas kriteriya ilə seçilib toplanmışdır: zaman, məkan və yaranma tipi. Zaman baxımından bütün mətnlər eyni dövrü əhatə edir. Bura 1975–ci illərdən sonrakı yaradılmış mətnlərdən nümunələr daxil edilmişdir. Bədii ədəbiyyat nümunələri korpusun ümumi həcminin 25%-ni təşkil edir. Yazılı mətnlərin 75%-i elm, mədəniyyət, sosiologiya və siyasət sahəsindən götürülmüşdür.

Şifahi nitqin bütün 10 milyonluq altkorpusu 2 hissəyə bölünmüşdür: 1) təbii dialoqlar; 2) kontekstlər.

Birinci hissədə Böyük Britaniya ərazisində yaşayan, korpusun təşkilində könüllü iştirak edən sakinlərin dialoqları toplanmışdır. Material könüllülərin bir neçə gün ərzində danışıqlarının maqnitafona yazılması ilə toplanmışdır. Materialın toplanmasına bərabər sayda kişi və qadın cəlb edilmişdir. Onlar yaş və sosial statusa görə seçilmişdilər. Onlar ünsiyyət qurduqları adamlardan danışığın korpusa salınması ilə bağlı icazə alırdılar. Bu cür dialoqlar hazırda şifahi dilin öyrənilməsində çox yararlı mənbə hesab edilir. Kontekst hissə 4 əsas kateqoriyaya görə təsniflənir:

1. Mühazirələrdə, seminarlarda müzakirə olunan məsələlər



  1. İşgüzar görüşlər, intervyular, sərgilərdə, ticari görüşmələrdəki danışıqlar

  2. Siyasi danışıqlar, parlament iclasları

  3. İdman görüşləri, klub dialoqları və s.” [81]

Belə bölgülər şərti səciyyə daşıyır. Hər bir korpus yaradıldıqda onun bölmə və hissələri müəyyənləşdirilir. Korpus linqvistikası inkişaf etdikcə bölmələrin sayı artır.

Müasir Amerika ingilis dilinin korpusu: Müasir Amerikan dilinin korpusu ingilis dilinin ən iri korpusu sayılır. Korpus 2008-ci ildə ABŞ-da M.Devisin (M.Davies) başçılığı ilə yaradılmışdır. 2013-cü ilin əvvələrində COCA-nın ölçüsü 450 mln. söz təşkil edirdi. Bura 1990-2012-ci illərin mətnləri daxil edilmışdir. İldə 2 dəfə yenilənən bu korpusa giriş və ondan istifadə çox rahatdır.

Müasir Amerikan dilinin Korpusu müxtəlif janrları özündə birləşdirən və pulsuz daxil olma imkanı olan ən böyük korpus hesab olunur. Korpus əsasən 5 janrı əhatə edir: şifahi, bədii ədəbiyyat, tanınan jurnal və qəzetlər, akademik nəşrlər.

Şifahi janr materialı 85 mln sözü birləşdirir. Təxminən 150 televiziya kanalından və radio verilişlərindən toplanmışdır. Ədəbi janr 81 mln sözformadan ibarətdir. Bura qısa nağıl və pyeslər, kinofilmlərin ssenariləri də daxil edilmişdir. Jurnallardan seçmələr 86 mln sözforma həcmindədir. Korpus üçün müxtəlif mövzuda olan 100 jurnaldan material seçilmişdir. Bu jurnallar xəbərlər, idman, dini və digər mövzularda olmuşdur. Qəzetlər (81mln sözforma) ABŞ-ın 10 qəzetinin idman, xəbər, maliyyə və iqtisadiyyat bölmələrini əhatə etmişdir. Akademik nəşrlərdən seçmələr (81mln sözforma) təxminən 100 elmi jurnaldan nümunələri özündə birləşdirir [63, s.3].

Qeyd olunduğu kimi, Milli korpuslar eyni bir dil daşıyıcılarının nitqlərinə dair materiallar üzrə qurulur. İngilis dilinin əsas iki variantı sayılan Britaniya və Amerika ingiliscələri üçün ayrı-ayrı korpusların yaradılması bu dil variantlarındakı fərqləri qarışdırmamaq məqsədi daşımaqla yanaşı, hər bir dilin materialını ayrılıqda öyrənmək məqsədi daşıyırdı. Ayrı-ayrı korpuslarda dil variantının müxtəlif səviyyələr üzrə materialları toplanırdı. Son nəticədə oxşar və fərqli cəhətləri aydınlaşdırmaq üçün iki korpus əsasında müqayisəli tədqiqatlar aparmaq tələbi ortaya atıldı. Bu baxımdan Amerika ingiliscəsini Britaniya ingiliscəsindən fərqləndirən xüsusiyyətləri nəzərdən keçirmək maraq doğurur. Amerika ingilis dilinin Britaniya ingiliscəsindən fərqlənən bir sıra cəhətləri vardır.

Store” sözü (mağaza) Britaniya ingiliscəsində müxtəlif əşyalar, məhsullar satılan böyük ticarət mərkəzi kimi başa düşülür. Bu söz İngiltərədə “shop” adlanan kiçik mağazanı ifadə edir. XVIII əsrin ortalarına qədər “store” sözü geniş istifadə olunurdu. Hal-hazırda isə “hardware store” ifadəsi ingilis üçün qəribə səslənə bilər. Müasir dövrdə “shop” sözü Amerikada müəyyən məhsulların satışı üzrə ixtisaslaşmış mağazalara aid edilir. Məsələn, “leather goods shop, dress shop” və s.

Digər fərqlərə nəzər salaq. Amerikada mağazada xidmət göstərən şəxsə “clerk”, İngiltərədə isə “shop assistant” deyilir. Britaniya ingiliscəsində “clerk” kitab satıcısı və ya sənədlərlə məşğul olan işçi kimi qəbul olunur.

Rock” sözü XVIII əsrdən bəri Amerikan ingiliscəsində “stone” (daş) sözünün sinonimi kimi işlənməkdədir. Britaniya ingiliscəsində (həmçinin Amerika ingiliscəsinin bəzi variantlarında) “rock” çox böyük daş, qaya kimi anlaşılır [135, s.9].

Yeni ifadələr və yeni sözlər yeni dünyada (Amerikada) mədəni və ictimai həyat şəraitinə öz əksini göstərirdi. Yeni dünyada məskən salmış ingilislər yeni əşyalarla, yeni bitki və heyvanlarla qarşılaşmış və onları adlandırmaq üçün ingilis elementlərindən istifadə edərək yeni terminlər yaratmışlar. İngiltərədə anlaşılan, nadir halda istifadə olunan bəzi sözlər mövcuddur. İngilislərə görə bu tip sözlər arxaik sözlərdir. Məsələn, “fall” sözü ingilislər üçün arxaik hesab olunur. Müasir standart ingilis dilində bu söz “autumn” sözü ilə (payız) ifadə olunur. Amerikada isə müasir dövrdə çox nadir halda “autumn” sözünü eşitmək olar. “To loan” sözü XVIII əsrdən etibarən Britaniya ingiliscəsində istifadədən çıxdığı halda Amerika ingiliscəsində geniş istifadə olunmaqdadır.

Amerika ingilis dilində vurğusuz hecalarda “our” şəkilçisi “or”-la əvəz olunur: “color, labor, flavor” və s. “re” sonluğu “er”-lə əvəz olunur: “center, meter, liter, theater” və s.

Britaniya və Amerika ingiliscələrinin qrammatik fərqlərinə nəzər yetirək.

We work nine through five. (Am)



We work nine till five. (Br)

It’s a quarter of five. (Am)

It’s a quarter to five. (Br)

In school, in hotel (Am)

At school, at hotel (Br)

In ages (Am)

For ages (Br)” [147]

Amerikan ingiliscəsinə aid kontekst: On the weekend I went to the mall. There were some fries and candy to buy, but I was trying to be healthy so I didn’t get any. Me and my buddies saw awesome movie- it’ll probably be one of my favorites in the future. We prefer the cinema to the theater. As the parking lot’s always full, we took the subway to get there and back. When we’d had enough, we used the elevator to get down to the first floor and go home [159].

Britaniya ingiliscəsinə aid kontekst: At the weekend, I went to my local shopping centre. There were some chips and sweets to buy, but I was to be healthy so I didn’t get any. Me and my mates saw an amasing film- it’llprobably be one of my favourite in the future. We prefer the cinema to the theatre. As the car park’s always full, we took the underground to get there and back. When we’d had enough, we used the lift to get down to the ground floor and go home [159].

Britaniya ingilis dili və Amerika ingilis dilinin tələffüzündə də fərqlər mövcuddur. Ən çox nəzərə çarpan fərqlərdən biri də Amerika ingiliscəsində [r] səsinin bəzi sözlərdə çox tələffüz olunmasıdır. Məsələn: “more, dinner”. Bu sözlərin tələffüzündə Britaniya ingiliscəsində [r] səsi tələffüz olunmadığı halda Amerika ingiliscəsində tələffüz olunur. İ.V.Arnold Amerikan ingiliscəsinin Britaniya ingiliscəsindən fərqini aşağıdakı kimi vermişdir: (sözlərin yazılışı fərqli olsa da tələffüzü eynidir)

Britaniya İngiliscəsi Amerikan İngiliscəsi

Cosy [kəuzi] cozy [kəuzi]

Offence [əfens] offense [əfens]

Practice [prᴂktis] practise [prᴂktis]

Travelling [trᴂvliɳ] traveling [trᴂvliɳ]” [104, s.267]

Amerikan ingiliscəsində bir çox leksik fərqlər də mövcuddur. Məsələn, amerikalılar “pavement” əvəzinə “sidewalk”, “lift” əvəzinə “elevator”, “frosting” əvəzinə “icing” sözlərini işlədirlər. Bu sözlər, ümumiyyətlə amerikanizmlərə aid edilir: highway, mail, movie, truck, gas və s. Amerika ingilis dili ayrı-ayrı ştatlarda yaşayan müxtəlif xalqların dillərində fərqli səslənir. Bəzən klassik ingilis dilini başa düşmək çətin olur. Bəzən isə əksinə, amerikalı bir britaniyalının ona nə demək istədiyini başa düşmür. İlk dəfə Böyük Britaniyada Amerika filmi nümayiş olunduqda onu altyazı ilə təqdim etməli olmuşdular. Çünki o vaxta qədər britaniyalılar amerikan ingiliscəsini eşitməməşdilər və onlar üçün bütün dialoqları anlamaq çətin idi [111, s.5].

İ.V.Arnold öz “The English Word” əsərində 2 variant arasındakı fərqi aşağıdakı kimi səciyyələndirmişdir: “1) sözlərin Britaniya ingiliscəsində qarşılığı olmadığı hallar: “drive in” (maşından düşməyərək izləyə biləcəyin kinoteatr və ya alış-veriş edə biləcəyin məkan); 2) fərqli sözlərin hər 2 dildə eyni mənada işləndiyi hallar: “can, candy, mailbox, movies” (ABŞ-da); “tin, sweet, letter-box, pictures” (İngiltərədə); 3) qismən ekvivalent sayılan sözlərin semantik stukturunda fərqlilik olduğu hallar: məsələn, “pavement” asfalt və ya daşdan tikilmiş küçənin bir hissəsi kimi anlaşılır. İngiltərədə isə bu söz yolun kənarında səki kimi anlaşılır. Amerikada isə bu mənanı “sidewalk” sözü verir; 4) ekvivalent sözlərin işlənmə fərqləri olan hallar: məsələn, standart ingilis dilində “ride” feli “a horse”, “a bicycle” kimi sözlərlə işləndiyi halda, Amerikan ingiliscədə “ride on a train”, “ride in a boat” və s kimi formalarda işlənir; 5) bəzən eyni söz Amerikan ingiliscədə bir az fərqli, emosional formada işlənir: “nasty”, məsələn, Britaniya ingiliscəsində daha mülayim səslənən ifadədir; 6) sözlərin daha tez-tez istifadə olunma halları: məsələn, “timetable” Amerikan ingiliscəsində çox nadir hallarda istifadə olunan bir sözdür. Onun əvəzinə orada “schedule” sözü daha çox istifadə olunur” [104, s.267].

Bu cür fərqliliklər və fərqli mənalar korpusların formalaşmasında nəzərə alınmalıdır.

FLOB dil korpusu: 1991-ci ildə Kristian Mayer Braun və LOB korpuslarının əlaqələndirilməsi və komplektləşdirilməsi təşəbbüsü ilə çıxış etdi. O, mövcud olan korpusların 1990-cı ildən sonrakı mətnlərlə genişləndirilməsi və işarələmənin yaxşılaşdırılması məqsədlərini qarşıya qoymuşdur. Frayburq universitetinin tələbələrini işə cəlb edən Kristian Mayer LOB korpusunun qəzet materialları bölmələrinə müvafiq yazılardan hər biri 2000 sözforma olan mətnlərin seçilib korpusa daxil edilməsi yolu ilə yeni korpus yaratmağı planlaşdırdı. Son nəticədə bir milyon sözformanı əhatə edən paralel korpus hazırlandı. Paralel korpus ötən 30 ildə dilin dəyişmə xüsusiyyətlərini araşdırmaq üçün geniş material verirdi. Braun, LOB və FLOB korpuslarının əlaqələndirilməsi nəticəsində dil materiallarının müqayisəli tədqiqatı üçün kifayət qədər geniş həcmə malik olan material bazası belə formalaşdırıldı. Yeni korpusun daha bir müsbət xüsusiyyəti onda idi ki, bu korpus Hindistan, Avstraliya, Heni Zellandiya ingilis dillərinin müqayisəli tədqiqatı üçün da zəmin yaratmışdı. Braun korpusunun yaradılma tələblərindəki bəzi məhdudiyyətlər FLOB-da ortadan götürülmüşdü. Məsələn, materialın müəyyən bir zaman ərzində yazılması şərti bu korpusa şamil edilməmişdi. Material ötən əsrin 90-cı illərində yazılmış qəzet yazılarını əhatə edirdi. Korpus əsasında dilin kəmiyyət xüsusiyyətlərinin öyrənilməsi də nəzərdə tutulmuşdur. Korpus materialı üzrə 90-cı illərin tezlik lüğətini hazırlamaq və bu lüğətə düşən sözlərin Braun və LOB korpuslarındakı müvafiq nəticələrlə qarşılaşdırılması aparılırdı.

Məlumdur ki, Braun və LOB korpuslarında mətnlər təsadüfi ədədlər cədvəli üzrə seçilirdi. Bu da üslublar üzrə reprezantativ seçmə imkanını məhdudlaşdırırdı və ümumiyyətlə, Braun və LOB korpusları üsluba görə statistik tədqiqatlar üçün reprezentativ deyildi. FLOB korpusunda bu çatışmazlıq aradan qaldırıldı, materialın eyni üslub üzrə seçilməsinə üstünlük verildi. Bədii mətnlərin seçilməsi zamanı da biblioqrafiyada təsadüfi ədədlərə görə əsərin adının təyin edilməsi üsulundan imtina olunmuşdur. Yeni korpusun yaradıcıları daha bir vacib məsələyə xüsusi diqqət vermişdilər. Onlar FLOB-un Braun və LOB korpuslarına daha yaxın olması məqsədilə təqribən 30 il əvvəl çap olunmuş qəzetlərdən nəşri davam etdirilənlərini yenidən tədqiqata cəlb edilməsinə nail olmuşdular. Seçilən mətnlərin müəyyən meyarlar üzrə ekvivalentliyi də nəzərə alınırdı.

FLOB korpusunun markerlənməsində də bir sıra dəyişikliklər aparılmışdır. Burada alınma sözlərin göstərilməsi üçün yeni teglərdən (markerlərdən) istifadə edilmişdir. Korpusda bu məqsədlə (word) tipli markerlər işlədilmişdir.

FLOB korpusunda istifadə edilmiş mətn kateqoriyalarının siyahısı aşağıdakı cədvəldə verilmişdir:




Yüklə 235,68 Kb.

Dostları ilə paylaş:
1   ...   9   10   11   12   13   14   15   16   ...   41




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin