MiLLİ Dİl korpuslari və onlarin formalaşmasi priNSİPLƏRİ


Maşın tərcüməsi və linqvistik korpus



Yüklə 235,68 Kb.
səhifə35/41
tarix05.01.2022
ölçüsü235,68 Kb.
#111770
1   ...   31   32   33   34   35   36   37   38   ...   41
3.3. Maşın tərcüməsi və linqvistik korpus
Maşın tərcüməsi – yazılı və şifahi mətnlərin bir dildən başqa dilə kompüter vasitəsilə tərcümə olunması prosesidir. Son zamanlar xarici dillərin öyrənilməsi nəinki səfərlər və qonaq qəbulu üçün lazımdır, o, həm də məşhur hollivud filmlərini seyr etmək, xarici məhsulların üzərindəki yazıları oxumaq və ya Veb- səhifələri oxumaq üçün lazım olur. Belə qənaətə gəlirik ki, hətta, öz ölkəmizin hüdudlarında belə biz xarici dildən istifadə etməli oluruq. Bununla da biz tərcüməçiyə ehtiyac duyuruq. Lakin, bu xidməti bizə hər birimizin yiyələndiyi kompüter göstərə bilər.

Hamıya məlumdur ki, yaxşı texnika həmişə insan üçün köməkçi vasitə sayılır. Lakin, düşünürük ki, tərcümə zamanı canlı tərcüməçinin etdiyi tərcümə ilə maşının etdiyi tərcümə çox fərqlənir. Bədii əsərlərin tərcüməsi zamanı tərcüməçi bədii əsəri yaşayaraq, oradakı obrazların sanki roluna girərək tərcümə edir. Əsərdəki bədiiliyi canlı saxlamaq üçün o, sanki obraza girir və dolğun ifadələrlə tərcüməni zənginləşdirir. Kompüterin etdiyi tərcümə isə, əlbəttə ki, bu hisslərdən uzaq olur.

Maşın tərcüməsinə iki yolla yanaşmaq olar: deduktiv və induktiv. Birinci metod “mətn- məna-mətn”, ikinci metod isə “mətn-mətn” modellərin istifadəsinə əsaslanır.

Birinci yanaşmada dilin semantikasından maksimal istifadə edərək yüksək səviyyəli maşın tərcüməsi almaq mümkündür. Ümumi sxemi morfoloji, sintaktik və semantik səviyyələrin mətnin mənasına keçidi kimi təsəvvür etmək olar. Sistemin əsasını, beləliklə, mətndən onun mənasına doğru keçidi təşkil edir. Bu keçid daxil olan və xaric olan dillərin lüğət fondları hesabına baş verir. Əlbəttə ki, burada qrammatik qaydaların da böyük rolu vardır.

İkinci yanaşmada mətnə çoxşaxəli bir sistem kimi baxılır. Tərcümə aşağıdakı üsulla aparılır:

Leksik tərcümə avtomatlaşmış lüğətin köməkliyi ilə, semantik tərcümə isə qrammatik alqoritmlər əsasında aparılır. Bu model tərcümə 2 əsasda mövcud olur: birinci, predmet əsaslı, ikinci isə dinamik əsaslı komponent.

Predmet komponenti nəyin tərcümə olunacağına cavab verir, dinamik komponent isə tərcümənin necə həyata keçəcəyinə cavabdehlik edir.

Y.Şemyakin özünün “Начала компюторной лингвистики” kitabında tərcümə elementinin 3 növünü qeyd edir: “ekvivalent, variantlı və transformasion”. Tərcümənin isə ən kiçik elementini cümlə hesab edir. Lakin, eyni zamanda, tərcümənin sərhədlərinin zərurətə görə dəyişə bildiyini də qeyd edir [91, s.69].

Texniki və ya tibbi mövzuların tərcüməsində də, həmçinin terminlərin yerli-yerində işlənməsi çox önəmlidir. Tərcüməçi kontekstə uyğun sözləri işlətdiyi halda maşın tərcüməsi kontekstdən kənar sözlər istifadə edir. Düzdür, müasir dövrdə daha mürəkkəb, daha məhsuldar maşın tərcümələri var, ancaq ki, canlı tərcümənin əvəzini verə bilmir.

Hamıya aydındır ki, lüğətlərin sayı nə qədər çox olarsa tərcümə o qədər də yaxşı alınar. Deməli birinci əsas məsələ sistemdə geniş lüğətlərin tərtibatıdır. Hər bir dildə cümlə quruluşu fərqləndiyi üçün tərcümə zamanı cümlədə söz sırası maşın üçün çətin məsələyə çevrilir. Məsələn, ingilis dilində cümlədə söz sırası mübtəda, xəbər, tamamlıq və s. olduğu halda, Azərbaycan dilində xəbər sonda gəlir. Bu ardıcıllığa tərcümə zamanı insan tərcüməçi qaydalara riayət edərək əməl edir, lakin, maşın tərcüməçi bunun öhdəsindən gələ bilmir. Deməli, qarşıda bir məsələ durur. Bu qaydaları proqram şəklində kompüterin beyninə yükləmək.

Maşın tərcüməsindən danışarkən ilk növbədə bilməliyik ki, o, cansız bir əşyanın etdiyi tərcümədir. O, dil meyarlarını anlamır, mətndəki incə məsələləri tuta bilmir. Məsələn, ingilis dilində “This is my book” cümləsi hərfi tərcümədə “Budur mənim kitab” olacaq. Formal cəhətdən bu tərcümə düzgün sayılır. Ancaq, danışıqda və dilimizdə biz bu şəkildə cümlə işlətmirik. Dinləyərkən, sanki, dilimizi bilməyən bir şəxs belə bir cümlə qurub.

Bəzən mətnlərdə elə sözlər olur ki, onları ancaq konteksti anladıqdan sonra tərcümə etmək olur. Məsələn, “democrat” sözü ABŞ-da siyasətçi mənasını verdiyi halda, Rusiyada azad bazar üçün savaşan insanlara deyilir. Tamamilə fərqli mənalar alınır. Yəni, belə bir söz işlənən cümlədə tərcüməçi kontekstdən onun hansı mənada işləndiyini çıxara bilir. Maşın isə çox güman ki, birinci mənada tərcüməni verər.

Əvvəlki fəsildə ingilis dilinin dialektlərindən söz açmış, onlardan nümunələr gətirmişik. Müxtəlif dialektlərdə işlənən sözlər də həmçinin maşın tərcüməsinin mükəmməlliyinə mane olur. Məsələn, Amerikanın hər hansısa bölgəsində işlənən bir söz Britaniyada başqa məna verə bilər. Bu dialektlərdən xəbəri olan tərcüməçi tərcümə zamanı kontekstə uyğun gələn mənanı tərcümədə verdiyi halda, kompüter onu yalnız sistemə yerləşdirilən sözlə ifadə edir. Məsələn, “kitchen” sözü ingilis dilində mətbəx deməkdir. Amerikan İngiliscəsində isə bu sözün boyunun arxasındakı tük mənası da vardır:

Sheila should comb her kitchen because it is looking kinda raugh” [122, s.49].

Bu cümlənin tərcüməsində maşın tərcüməsi çox guman ki, düzgün tərcümə verməyəcək. İnsan tərcüməçi isə kontekstdən yanaşaraq bu cümlənin tərcüməsini düzgün verəcək. “Şeyla gərək boynun arxasındakı tükləri qırxsın, çünki, çox eybəcər görsənir”.

Bunlardan savayı, ingilis dilində bəzi Afrika mənşəli sözlər əsasən bədii ədəbiyyatda daha çox istifadə olunur. Müəllif əsəri daha da mənalı, daha dolğun və daha reallığa uyğun etməsi üçün bu mənşəli sözlərdən istifadə edir. Onların tərcüməsini isə kompüter çətinliklə də olsa edə bilmir. Bu cür sözlər sistemdən tərcümə olunmamış şəkildə çıxır. Tərcüməçi isə araşdırmalar aparır və belə sözlərin tərcüməsini verə bilir.

Maşın lüğətlərinin yaradılması ideyası XX əsrin əvvəllərinə təsadüf edir. 1930- cu ildə eyni məqsədlə 2 araşdırmaçı bu ideya üzərində çalışmışlar. Onlar fransız-amerikan Corc Arstrun və Rusiyadan olan Pyotr Smirnof Troyanskiy idilər. Rus alimi daha çox səyləri ilə tanınır, çünki, o, maşın tərcüməsində 3 mərhələnin vacibliyi ideyasını irəli sürmüşdür. Troyanskinin ideyasının çox vacib olmasına baxmayaraq bu ideya 1950-ci illərə qədər örtülü qalmışdır. Kompüterlərin ixtirası bu prosesi daha da sürətləndirmişdir. İlk dəfə olaraq Birləşmiş Ştatlarda tərcümə sahəsində kompüterlərdən istifadə olunmuşdur. İlk dəfə 1954-cü ildə Amerikanın Corctaun Universiteti ilə IBM şirkəti arasında proyekt hazırlanmış və uğurla nəticələnmişdir.

Maşın tərcüməsinin ilk versiya proqramı 2 dilli lüğətlərə əsaslanırdı. Məxəz dildə verilən sözə qarşılıq olaraq tərcümə ediləcək dildə bir neçə ekvivalent təqdim edirdi. 1964-cü ildə Birləşmiş Ştatlar hökuməti maşın tərcüməsi proqramını qiymətləndirmək məqsədilə ALPAC (Automatic Language Processing Advisory Committee) yaratdı. 1966-cı ildə komitə maşın tərcüməsi sahəsində çox kritik bir raport çıxartdı. Komitəyə görə maşın tərcüməsi insan tərcüməsi ilə müqayisədə 2 dəfə bahalı və asta idi. Buna baxmayaraq, Kanada, Fransa, Almaniyada araşdırmalar davam edir və bir neçə il sonra 2 maşın tərcümə sistemi meydana gəlir. O dövrlərdə Kanada, Almaniya, Fransada Logos adlı maşın tərcümə sistemi çox məşhur idi. 1990-ci illərin əvvəlləri maşın tərcüməsi tarixində ən yüksək inkişaf mərhələsi hesab olunur. Artıq tərcümə ilə birgə nümunələr də verilirdi. Hal-hazırda iri şirkətlər maşın tərcüməsindən geniş istifadə edirlər [146].

Kompüter tərcüməsi və ya maşın tərcüməsi mətnləri avtomatik yolla, kompüterlərin köməkliyi ilə tərcümə etmək deməkdir. Maşın tərcüməsinin effektivliyi son illər daha da büruzə verir. Bu da maşın tərcüməsi fondunda daha çox söz bazasının olması, sinonim, antonimlərin ora artırılması və tərcümənin kontekstə uyğun tərcümə edilməsi ilə bağlıdır. Əlbəttə ki, bu 100% təminat deyil ki, maşın tərcüməsi tam kontekstə uyğun tərcümə edir. Sözsüz, insan tərcüməsinin əvəzini verə bilməsə də, müəyyən üstünlüklərə malikdir.

Hazırda müxtəlif dillərdə çox sayda kompüter tərcümə proqramları mövcuddur. Maşın tərcüməsinin çatışmayan cəhətləri tərcümədə təhriflər və kontekst azlığıdır.

Ümumiyyətlə, kompüter tərcüməsi tərcüməçinin işini asanlaşdırmaq, ona tərcümə prosesində yardımçı olmaq məqsədilə kompüterdən istifadəsi deməkdir. Müasir dövrdə beynəlxalq əlaqələrin getdikcə intensivləşməsi, elmin surətli inkişafı nəticəsində elmi-texniki ədəbiyyatların onlarla xarici dillərə qısa müddət ərzində tərcüməsi zəruri tələbata çevrilmişdir. Hazırda xüsusi tərcüməçi kadrların yetişdirilməsinə böyük diqqət yetirilməsi, tərcümə büroları və mərkəzlərin geniş fəaliyyət göstərməsi, xüsusi jurnalların nəşri geniş vüsət almışdır. Tərcümə ədəbiyyatının nəşri durmadan artır. Məhz bu səbəbdən tərcümə prosesinin avtomatlaşdırılması ideyası meydana gəlmişdir [12, s.98].

Fikrimizcə, müasir dövrdə elmi işlərin, tədqiqatların sayının artması, dünya ölkələrinin qarşılıqlı əlaqələrinin artması tərcümə sahəsinin inkişaf etməsinə təsir edib, eyni zamanda kompüter tərcüməsinin inkişafına təkan vermişdir. Çünki, informasiya texnologiya dövründə yaşayan insanlar kimi, hər sahədə kompüterdən geniş istifadə edildiyi halda tərcümə sahəsində də həmçinin kompüterdən istifadə etmək məcburiyyətindəyik. Bu həmçinin bizim işimizin asanlaşmasına da kömək edir. İstədiyimiz zaman az vaxt çərçivəsində yüzlərlə lüğətlərə müraciət edə bilirik. Yüzlərlə səhifələri vərəqləmək əvəzinə barmağımızın ucunu toxunduraraq istənilən kontekstdə mətni və ya cümləni tərcümə edə bilərik. Bu da bizim işimizi xeyli asanlaşdırır.

Avtomatik tərcümə ideyası ilk dəfə Amerikada 1946-cı ildə alimlər A.But və U. Uiver tərəfindən söylənmişdir [59, s.13]. 1949-cu ildə U. Uiverin məşhur “Tərcümə” memorandumu nəşr olunandan sonra bu sahədə geniş tədqiqatlar aparılmağa başladı. İlk dəfə maşın tərcüməsi ABŞ-da həyata keçdi.

Hazırda bu sahədə dünyanın bir çox ölkələrində tədqiqat işləri aparılır. Elmi-tədqiqat işlərinin sayı da həmçinin artmaqdadır. MT-nin ən sadə növü sözbəsöz tərcümədir. Təcrübələr göstərir ki, elə dillər var ki, sözbəsöz tərcümə öz əhəmiyyətini göstərir. Nəticə almaq olur, lakin, əksər dillərdə sözbəsöz tərcümə böyük səhvlər törədə bilir. Sözbəsöz tərcümədə idiom və frazeoloji birləşmələr nəzərə alınmır. Həm də sözlərin sırası olduğu kimi qalır. Bu da tərcümə olunan dilin leksik-qrammatik quruluşuna uyğun gəlməyə bilir. Sonralar bu problemin həlli ilə bağlı çoxsaylı səylər edilmişdir.

Maşın tərcüməsi prosesini aşağıdakı mərhələlərə bölmək olar.


  • Daxil edilən dildə mətnin təhlili

  • Çevrilmə

  • Mətnin çıxışda alınan dildə sintezi

Üçüncü mərhələdə mətn sintaktik və morfoloji formalaşmadan keçir.

Hazırda maşın tərcümə sistemləri bu mərhələ ilə fəaliyyət göstərirlər.

Əlbəttə, maşın tərcüməsi olduqca maraqlı bir sahədir. Bunu inkar etmirik. Eyni zamanda perspektivli sahədir. Lakin, onu da boynumuza almalıyıq ki, yüksək keyfiyyətli tərcüməni almaq maşın tərcüməsində mümkün deyil. Maşın tərcüməsində keyfiyyətin aşağı olmasının səbəbi maşında insan tərcüməçiyə xas olan ekstra linqvistik biliklərin olmamasıdır. Kompüterin araşdıra bilmədiyi sintaktik, semantik omonimliyi insan məhz bu biliklərin sayəsində müəyyən edə bilir.

Görkəmli mütəxəssis V.İnqve yazır: “Maşın tərcüməsi sahəsində işlər semantik sədd qarşısındadır. Biz belə bir müddəanı anlamağa başlamışıq ki, maşın tərcüməsində yeganə metod ondan ibarətdir ki, maşın nəyi tərcümə etdiyini “qavramalıdır” [57, s.44].

Fikrimizcə, bu çox doğru bir açıqlamadır. Kompüterin beyni insan beyni ilə eyni ola bilməz. Kompüterin tərcümə etdiyini qavraması çox çətin bir prosesdir. İnsan hər hansı bir mətni tərcümə etdikdə öz bədii, ədəbi biliklərini də işə salır. Dünya görüşünü ora əlavə edir, kontekstə daha uyğun olan sözü axtarıb tapır, tərcümə olunan mətnə daha çox bədiilik əlavə edir. Çünki, insan bu mətni qavrayır və dərk edir. Maşın tərcüməsinin bir qolu kimi yarımavtomatik tərcümə də çox məşhurdur [120, s.490]. Yarımavtomatik tərcümədə kompüterlərdən tam istifadə olunmur. Onlar yalnız köməkçi vasitə kimi işlədilir. Bu zaman tərcüməçi xüsusi maşınların köməyilə tərtib olunmuş xüsusi lüğətlərdən istifadə edir. Tərcüməçi sözü lüğətdə axtarmaq kimi uzun vaxt itkisindən azad olur və az vaxt ərzində bütün naməlum sözlərin mənasını tapır. Tərcüməçi mətndə qeydə alınmış naməlum sözü və onun əhatəsində olan sözləri kompüterə daxil edir, nəticədə geniş kontekstdə terminin mümkün tərcümə variantını tapır.

Bu üsul tərcümə maşın tərəfindən edilmir. Tərcümə insan, yəni tərcüməçi tərəfindən edilir, maşın isə köməkçi vasitə olur. Məsələnin bir başqa tərəfini müzakirə edək. Hər hansı xarici dili bilən insan istənilən mətni tərcümə edə bilərmi? Hətta tərcümə etsə belə, riyazi analizə aid mətni tərcümə edə bilərmi? Əsla yox. Maşın tərcüməsində də eyni vəziyyətdir. Riyaziyyata aid linqvistik bazası, terminoloji lüğəti olmayan tərcümə sistemi həmin sahədə tərcümə apara bilməz.

İnsan tərcüməçi müəyyən ixtisas sahəsində ixtisaslaşdığı kimi maşın tərcüməsi sistemləri də konkret elm sahələri üzrə ixtisaslaşmış olur” [12, s.106].

N.Əzizli türk dillərindən bir-birinə tərcümə məsələsinə münasibət bildirərək yazır: “Türk dillərindən bir-birinə avtomatik tərcümə ümumi bir problem kimi qəbul olunarsa, konkret iki dildən qarşılıqlı tərcümə həmin problemin xüsusi məsələsi sayıla bilər. Eyni zamanda, türk dillərindən avtomatik tərcümənin hansı istiqamətdə aparılması da araşdırmalar əsasında müəyyənləşdirilə bilər. Hansı məsələ birinci həll olunmalıdır? Türk dilindən Azərbaycan dilinə, yoxsa qazax (qırğız, noqay və s.) dilindən Azərbaycan dilinə avtomatik tərcümə ilə məşğul olmaq daha düzgündür. Təbii ki, ayrı-ayrı türk dillərindən tərcümə məsələləri ayrı-ayrılıqda eyni zamanda tədqiqat obyekti də ola bilər. Zənnimizcə, bu dillərin arasından ikisinin optimal seçimi ümumi problemin həllini sürətləndirə bilər. İlkin müqayisələr bir-birinə daha yaxın olan dillərdən avtomatik tərcümənin uğurlu və keyfiyyətli nəticələrə gətirib çıxaracağını təsdiq edir” [5, s.152].

Fikrimizcə, ixtisaslaşma maşın tərcüməsində vacib məsələdir. Əvvəlki fəsildə ingilis dilinin variantlarından bəhs etmişdik. İngiltərə ingiliscəsi və onun yarım­qolları, Amerika ingiliscəsi və onun yarımqolları və s. variantlar haqda araşdırmalar aparmışdıq. Həmin fəsildə, məsələn, Amerikan ingiliscəsində işlənən bəzi Afrika mənşəli sözlər, anqlo-sakson mənşəli sözlər və ifadələrə rast gəlinir. Tutaq ki, bir tərcüməçinin qarşısına həmin terminlər və ifadələr çıxmışdır. Bu zaman tərcüməçi nə etməlidir? Həmin vaxt tərcümə etdiyi və ya tərcümə edəcəyi dilin korpusu həmin tərcüməçiyə kömək edir. Kompüterdən axtarış verərək və ya konteksti daxil edərək həmin ifadənin tam tərcüməsi olmasa belə, onun mənasını, izahını tapa bilir. Əgər həmin söz və ya ifadə o dilin maşın fondunda varsa avtomatik tərcümə vasitəsilə asanlıqla həmin sözün mənasını tərcüməçi tapa bilər. Bu da tərcüməçinin işinin xeyli asanlaşmasına gətirib çıxarır. Günlərlə kitablarda, lüğətlərdə axtarış etmə və vaxt itirmə prosesini aradan götürür. Zənnimizcə, bu baxımdan da maşın tərcüməsinin böyük əhəmiyyəti vardır [120, s.490-491].


Yüklə 235,68 Kb.

Dostları ilə paylaş:
1   ...   31   32   33   34   35   36   37   38   ...   41




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin