Alisher navoiy nomidagi samarqand davlat universiteti



Yüklə 0,93 Mb.
Pdf görüntüsü
səhifə42/60
tarix23.06.2022
ölçüsü0,93 Mb.
#117181
1   ...   38   39   40   41   42   43   44   45   ...   60
KOMPYUTER LINGVISTIKASIDAN UNIVERSAL QO‘LLANMA

Avtomatik lug‘at – mashinaning maxsus formatida saqlanuvchi, matnni 
kompyuter yordamida ishlov beruvchi lug‘at hisoblanadi. Hozirgi kunda mukammal 
avtomatik lug‘at ingliz tilining izohli lug‘ati va Ojegovaning lug‘ati hisoblanadi. 
Aniq lingvistik ma’lumotlarni lug‘atlardan olish mumkin. Mukammal ishlangan 
lug‘atlarda fonetik, morfologik, sintaktik, semantik va hokazo ma’lumotlar aks etib, 
til sathlarining barchasini o‘zida mujassamlashtiradi.
Masalan: 
Grammatik 
axborot 
Atamalar haqida 
axborot 
Semantik axborot 
Frazeologik 
axborot 
Axborotlar 
tezaurusi 
Leksik-
grammatik 
kodlar, sintaktik-
morfologik 
kategoriyalarga 
guruhlangan so‘z 
shakllarini o‘z 
ichiga oladi. 
So‘z shakllarining 
atama sifatida 
qo‘llanishini 
o‘rganib, 
uslublardagi 
xususiyatlari 
tekshiriladi va 
kodlashtiriladi. 
Uslublararo 
qo‘llangan so‘z 
shakllarining 
semantik 
guruhlanishi 
inobatga olinadi. 
Frazeologik 
birikmalar va 
oborotlarni 
alohida birlik 
sifatida o‘ziga 
xos xususiyatlari 
o‘rganiladi. 
So‘z shakllarining 
munosabati 
kodlashtiriladi. 
Avtomatik lug‘at yaratishda lug‘at maqolasining ahamiyati katta. U quyidagicha 
tuziladi: 
S
em
ant
ik b
el
gi
M
orfol
ogi
k z
ona
O‘
z
iga
xos
t
as
ni
fi
Sintagmatik zona 
Paradigmatik zona 


M
orfol
ogi

ta
sni

S
em
ant
ik
be
lgi
M
is
ol
la

S
inoni
m
Ie
ra
rxi

m
unos
aba

P
ara
di
gm

ti
k m
unos
aba

x
o‘
jalik
turdos
h, 
m
avhum

ja
m
lov
chi
ot
h
ara
ka
tg

m
unos
aba

1. 
ob’ekt 
S
o‘
z s
ha
kl

U
m
um
iy 
tus
hunc
ha
Ba
ja
ri
lm
ag
an
li
gi
ha
q
ida
da
lol
at
nom

2. tasnif 
da
li

la
r a
sos
ida
V
os
it
a,
m
ehna
t, 
fa
ol
iya

3. vaqt 
za
m
on, 
va
qt
ya
nva

oyi
da
4. 
sub’ekt 
ha
ra
ka

T
as
hki
lot
la
r bi
la
n


54 
5. 
miqdor 
m
iqdor
…foi

hi
sobi
da
tops
hi
ri

di
Jadvalda keltirilganidek, ot so‘z turkumining lug‘at sistemasi quyidagi zonalarda 
tashkil topadi: 
1) semantik belgi 
2) morfologik zona 
3) sintagmatik zona: semantik relyatsiya nomi; majburiylik (natijaviylik; 
mumkin bo‘lgan aloqalar); sintagmadagi asosiy so‘z; relyatsiyaning ikki komponenti 
formal belgilari; misollar. 
4) paradigmatik zona: sinonimik korrelyatsiya; ierarxik korrelyatsiya; turli 
pragmatik munosabatlar. 
Formal 
morfologiyada 
kompyuter 
uchun 
tegishli 
bo‘lgan 
zaruriy 
ma’lumotlarning barchasi morfologik lug‘atdan olinadi. 
Morflogik lug‘at – so‘zlarning grammatik kategoriyalari va ularning 
qo‘llanishi, ma’nosi qayd etiladigan lug‘at turi. 
Grammatik kategoriya – ma’nosiga ko‘ra birlashuvchi shakllar sistemasi. 
Kelishik ma’nosini kelishik kategoriyasi, zamon ma’nosini zamon kategoriyasi 
birlashtiradi.
Avtomatik lug‘atda so‘z shakllari so‘z uyalarida joylashtiriladi. So‘z uyalarining 
tuzilishi quyidagicha: 
Birinchi pozitsiyada so‘zning grammatik turkumi haqidagi ma’lumot beriladi. 
Bu ma’lumot quyidagilardan iborat: masalan: N - ot so‘z turkumi; Aj – sifat so‘z 
turkumi va hokazo. 
Ikkinchi pozitsiyada va undan keyin ma’lum bir so‘z turkumiga mansub lug‘at 
birligining o‘ziga xos grammatik kategoriyalar to‘g‘risida ma’lumot beriladi, agar ot 
so‘z turkumi bo‘lsa, masalan, s – birlik; sk - ko‘plik; Ш – o‘zgarmas shakl. 
Otlarda egalik kategoriyasi haqidagi ma’lumotlar so‘z uyalarida uchinchi 
pozitsiyani egallab quyidagicha o‘z ifodasini topadi: eb1 – 1-shaxs birlik; eb2 – 2 
shaxs birlik; eb3 – 3 shaxs birlik va hokazo. 
Kelishik kategoriyasi lug‘at maqolalari tarkibida to‘rtinchi pozitsiyani egallab 
quyidagi simvollar bilan ifodalanadi. Masalan: k1 – bosh kelishik; k2 – qaratqich 
kelishik; k3 – tushum kelishigi va boshqalar. 
Kompyuterda semantik ma’lumotlarni yozib olishda informasion qidiruv tili 
muhimdir. Tabiiy til bilan information qidiruv tilini solishtirish maqsadida 
yaratiladigan lug‘atlar informasion qidiruv tezaursi deyiladi. Bunday tezaurslar 
tilning jumladan, o‘zbek tilining turli xil ideografik lug‘atlarini yaratishda muhim 
ahamiyat kasb etadi. Olimlar ana shunday ideografik lug‘atlar tuzish jarayonida 
quyidangi operasiyalarni kompyuter yordamida bajarmoqdalar: 
a) tuzilayotgan tezaursning mavzu ko‘lamini belgilab olish; 
b) lug‘at uchun zarur bo‘lgan kalit so‘z diskeriptorlarni aniqlash va ularga ishlov 
berish; 
c) deskriptorlar orasidagi shartli ekvivalentlik hollarini belgilash; 


55 
d) deskriptorlar orasidagi paradigmatik munosabatlarni aniqlash va ularni ochib 
berish; 
e) tezaurs lug‘atni to‘la shakllantirish. 
1998-2001 yillar davomida mamlakatimizda bir guruh tilshunoslar “Hozirgi 
o‘zbek tili faol so‘zlarning izohli lug‘ati”ni tuzish jarayonida kompyuter 
texnologiyasidan unumli foydalandilar. Ular adabiy tilimiz materiallari ko‘proq 
ijtimoiy-siyosiy matnlarda ifodalanishini inobatga olib, “Yoshlik” , “Tafakkur”, 
“Guliston”, “Sharq yulduzi” kabi jurnallar va bir qator gazetalar sahifalarida 
qo‘llangan barcha so‘zlar maxsus dastur yordamida 94 ta fayl asosida sahifalab 
chiqildi. Ana shu fayllarda ajratib olingan so‘zlar jami 8168 sahifani tashkil etadi. 
Har bir sahifada 200 tadan so‘z mavjud bo‘lib, ishlatilgan so‘zlar (turli grammatik 
shakllar bilan qo‘shilib hisoblanganda) 1.633.600 tani tashkil etadi. Kompyuter 
vositasida bu so‘zlarning qo‘llanilish chastotasi birma-bir belgilab chiqildi. Maskur 
lug‘atni tuzuvchilar eng kamida 4 marta qo‘llanilgan leksik birliklarni nisbatan faol 
so‘z deb qaraganlar va shu tamoil asosida lug‘atga kiritish uchun ularni tanlab 
olganlar. Lug‘atga kiritilgan ana shunday faol so‘zlar 15.000 tani tashkil etadi. 
Dastlab tanlab olingan ana shu so‘zlar negizida bo‘lajak faol so‘zlar lug‘atining 
so‘zligi yaratildi va alifbo tartibi bilan har bir leksemaga tegishli izohlar yozishga 
kirishildi. Muhimi shundaki, 2001 yilda nashr etilgan “Hozirgi o‘zbek tili faol 
so‘zlarning izohli lug‘ati”ni yaratish jarayonida tuzuvchilar ideografik lug‘at, 
elementlardan biri bo‘lgan uyali lug‘at tamoillaridan samarali foydalanganlar. Bu 
tamoilga ko‘ra, an’anaviy alifbo tartibidan chetga chiqiladi, bitta uyaga jamlangan 
barcha leksemalar ular qanday grammatik shaklda bo‘lishidan qatiy nazar bitta joyda 
izohlanadi.
O‘zbek tilida tub va yasama so‘zlarni kompyuter lug‘atlarida berilishi o‘ziga xos 
muammolarga olib keladi. Kompyuter lug‘atshunosligida so‘z deyilganda, “so‘z 

Yüklə 0,93 Mb.

Dostları ilə paylaş:
1   ...   38   39   40   41   42   43   44   45   ...   60




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin