Alisher navoiy nomidagi samarqand davlat universiteti


-MAVZU: INFORMATSION QIDIRUV TIZIMI



Yüklə 0,93 Mb.
Pdf görüntüsü
səhifə47/60
tarix23.06.2022
ölçüsü0,93 Mb.
#117181
1   ...   43   44   45   46   47   48   49   50   ...   60
KOMPYUTER LINGVISTIKASIDAN UNIVERSAL QO‘LLANMA

 
11-MAVZU: INFORMATSION QIDIRUV TIZIMI. 
GIPERTEKST TEXNOLOGIYASI. 
 
 
Kompyuter lingvistikasining yana bir yo‘nalishi information qidiruv tizimi 
hisoblanadi. Ular axborotlarni qidirishga mo‘ljallangan. U quyidagi bosqichlarda 
ishlaydi: 
- informatsiya (axborot)ni jamlash; 
- informatsiya (axborot)ni tasniflash; 
- hujjatni qidiruv obrazini yaratish; 
- hujjatni qidiruv obrazi va hujjanrlarni saqlash; 
- qidirish va natijani chiqarish. 
Informatsiyon qidiruv (inglizcha information retrieval) atamasi 1948-yil Kelvin 
Mur tomonidan birinchi marta fanga kiritilgan.
Axborot-izlanish sistemasi – 1950-1960 yillarda ilmiy-texnik axborotlar keskin 
sur’atda oshdi. Millionga yaqin ixtirolar va turli ko‘rinishdagi bir necha million ilmiy 
yangiliklar mavjud bo‘lib, ular muntazam ravishda ko‘pgina tillarda berib boriladi. 
Millionlab ilmiy-texnika jurnallari nashr qilinib, ularda maqolalar chop etilmoqda. 
Har qanday ilmiy-texnik axborotni keng kitobxonlar ommasiga o‘z vaqtida va oson 
yetkazishning birdan-bir yo‘li – matnlarni turli tillarga tarjima va annotatsiya 
qiladigan dasturlarni yaratishdir. Shunday sharoitda kompyuter lingvistikasi 
axborotlarni saqlaydigan va qayta ishlov beradigan axborot – izlanish (AIS) sistemasi 
ishlab chiqdi.
AIS o‘zining xususiyatiga ko‘ra ikki xil bo‘ladi: hujjatiy va faktografik. 


61 
Hujjatiy AISda hujjat matnlari saqlanadi. Masalan: referatlar, bibliografik 
kartochkalar va boshqalar. 
Faktografik AISda aniq daliliy ashyolar saqlanadi. Masalan, jadvallar, 
formulalar, turli suratlar va boshqalar. 
Hozirgi kunda ham hujjatiy, ham faktografik AIS birgalikda ma’lumotlar 
bazasida (MB) saqlanadi. AISni ishlash jarayonida maxsus til qo‘llaniladi. Bu til 
indeksatsiya yoki indekslash deyiladi. Birinchi marta amerikalik olim M.Taube AIS 
uchun UNITERM nomli maxsus deskriptor til yaratgan. UNITERMda deskriptorlar 
sifatida hujjatning kalit so‘zlari – unitermlar ishlatiladi. Hozirgi kunda ushbu tildan 
takomillashtirilgan holda foydalanilmoqda. 
Matnning asosiy mazmun-mundarijasini aks ettiradigan kalit so‘zlar, tayanch 
tushunchalar, atamalar bazasi asosida kompyuterda lug‘at tuziladi. Bunday lug‘at 
information qidiruv tezaurusi deb ataladi. 
Tezauruslar ensiklopedik va izohli lug‘atlardan farqli ravishda til birliklarining 
matnda qo‘llanish chastotasi va matnning predmet mundarijasini aks ettirish 
darajasiga qarab tuziladi. Bunday tezauruslar matnni tezkor tanlab olish va topish 
imkonini beradi.
MBsidagi axborotlar olimlarimiz tomonidan yaratilgan mashina lisoniy-axborot 
ta’minoti bilan to‘ldiriladi. Ishlangan lisoniy algoritmlar, modullar bir sistemaga 
jamlanishi lozim. Sistemaga jamlangan lisoniy-axborot, kompyuter-axborot 
ta’minoti, ma’lumotlar bazasi (bank) ma’lum bir matnni avtomatik qayta ishlash 
mexanizmini yaratadi. Mexanizmni ishlash jarayonida har bir soha mutaxassisi 
o‘zining axborotlari bazasi bilan ta’minlaydi. 
Ma’lumotlar bazasining kengayishi bilan lisoniy-axborot ta’minoti muammosi 
kamayadi. Lisoniy ma’lumotlar banki umumiy tizimda blok-sxemada o‘z ifodasini 
topadi, ya’ni tilning mashina fondi (TMF) yaratiladi. Amaliy ishlarda TMF zarur 
bo‘lib, unda til tizimining modellari, tizim sifatida aniq bir uslubning (funktsional 
uslublari, hozirgi va qadimgi adabiy til) barcha til birliklari, nutqdagi til birliklarining 
qo‘llanish qonuniyatlari, nutq birliklarining yuzaga kelish qoidalari to‘liq o‘z 
ifodasini topmog‘i lozim. 
Bu yo‘nalish INTERNET yuzaga kelgandan so‘ng yanada rivojlandi. Masalan, 
Internetda Google, Yandex, Rambler, Yaho kabi qidiruv tizimlari ishlamoqda. 
Axborotni qidirish 4 bosqichni o‘z ichiga oladi: 
- axborotga bo‘lgan talabni aniqlashtirish hamda informatsiyon so‘rovni 
shakllantirish; 
- so‘ralgan axborotni saqlagan manbalarni aniqlash; 
- axborot massivlaridan zarur axborotni ajratib olish; 
- axborot bilan tanishish va qidiruv natijalarini baholash. 

Yüklə 0,93 Mb.

Dostları ilə paylaş:
1   ...   43   44   45   46   47   48   49   50   ...   60




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin