VB texnologiyalarının inkişaf perspektivləri
40-ildən artıq inkişaf tarixi olmasına baxmayaraq, VB texnologiyaları bu gün də inkişaf etməkdədir. Bu, ilk növbədə, hesablayıcı və kommunikasiya texnikasının yüksək sürətlə inkişafı ilə bağlıdır.
Son illərdə Veb mühitində işləyən telekommunikasiya müraciətli VB sistemlərinin yaradılması geniş vüsət almışdır. Bu, naqilsiz rabitə kanallarının tətbiqi ilə bağlıdır.
Aktual istiqamətlərdən biri də çox böyük VB-lərin idarə edilməsi texnikasının yaradılmasıdır. Bu sistemlər kosmik tədqiqatlar, molekulyar biologiya, zərrəciklər fizikası və Yer səthinin aerofotoçəkilişi sferalarında mövcuddur və gələcəkdə kommersiya sferasına da tətbiq ediləcəyi istisna edilmir.
8.8. Mətni axtarış texnologiyaları
Mətni axtarış texnologiyalarının əsasları
Cəmiyyətdə informasiya mübadiləsi əsas etibarı ilə mətn formasında həyata keçirilir. Buna görə də müasir informasiya sistemlərinin informasiya resurslarının olduqca böyük hissəsini mətn informasiyası təşkil edir.
İnformasiya sistemlərinin ilk inkişaf mərhələlərindən mətn informasiyasının səmərəli saxlanması, emalı və axtarışı texnologiyalarının işlənib hazırlanmasına xüsusi diqqət yetirilmişdir.
Mətn informasiyası ilə işləyən informasiya sistemləri arasında ən geniş yayılmış mətni axtarış sistemləridir. Bunların vəzifəsi istifadəçini maraqlandıran təbii dildə olan sənədləri kompüterdə saxlanan mətn sənədləri kolleksiyasından tapıb təqdim etməkdən ibarətdir. Mətni axtarış sistemlərinin inkişafı elmi-tədqiqat və təhsil sferalarında avto- matlaşdırılmış kitabxana sistemlərinin yaranmasına səbəb oldu.
Son illərdə isə bu sistemlər daha geniş diapazonda tətbiq edilir.
Ötən əsrin 50-ci illərində yaradılan ilk avtomatlaşdırılmış informasiya sistemləri başlıca olaraq informasiya axtarışını reallaşdırdığına görə, informasiya-axtarış sistemi adlanırdı. Bunlar 2 yerə: sənədli və faktoqrafik axtarış sistemlərinə bölünürdü ki, bunla- rın haqqında yuxarıda bəhs edilmişdir.
Mətni axtarış texnologiyalarında təbii dilin emalı əhəmiyyətli yer tutur. Bu, təbii dildəki mətnin kompüter tərəfindən dərki, təhlili və mətn üzərində müxtəlif əməliyyat-
ların icrası, həmçinin mətnin kompüter yaddaşına generasiyası ilə bağlı işləri əhatə edir. Bu məsələlər isə süni intellekt sahəsinə aiddir.
Müasir mətni axtarış texnologiyalarında mətni təhlil etmək üçün təkcə linqvistik aparat deyil, həmçinin statistik metodlar, riyazi məntiq və ehtimal nəzəriyyəsi, klaster təhlili, süni intellekt metodları və verilənlərin idarə edilməsi texnologiyaları tətbiq edilir.
İnformasiya supermagistralı üzrə işlər, xüsusilə də, 1990-cı illərin ortalarında bir sıra dünya ölkələrində meydana çıxan elektron kitabxanalar mətni axtarışa marağı kəskin şəkildə artırdı. Qlobal kompüter şəbəkələrində, Veb-də mətni axtarış, multidilli axtarış istiqamətləri yarandı.
50 illik tarixi ərzində deskriptorlu informasiya-axtarış sistemlərindən tammətnli axtarış sistemlərinədək böyük bir inkişaf yolu keçilmişdir.
Əsas anlayışlar.
Təbii dilin məzmun müxtəlifliyi olduqca genişdir. Belə ki, bu material qəzet və jurnallarda çap edilmiş məqalələr, müxtəlif texniki sənədlər, hesabatlar, kitablar, dissertasiyalar, məktublar, qanunvericilik aktları və s. ola bilər.
Mətni axtarış sistemlərində əsas informasiya vahidi sənəddir. Sənəd – bu və ya digər təbii dildə təqdim edilən bitkin məzmunlu hüquqi mahiyyətdir.
Tammətnli axtarış sistemləri elektron sənədləri ilə, yəni kompüter yaddaşında saxlanan və avtomatlaşdırılmış emal üçün hazır olan sənədlərlə işləyir. Bunlara ―sənədlər kolleksiyası‖ deyilir. Mətni axtarış istifadəçi sorğuları ilə aktuallaşır. Sorğu axtarış kriterisi şəklində formalaşdırılır. Axtrış çoxaspektliliyinin vahidi sənəddir. Axtarış kriterisi termlər yığımı (söz və ya sözbirləşməsi) və ya məntiqi operator simvolları (VƏ, VƏ YA, DEYİL) ilə birləşdirilmiş termlər ola bilər. Sorğuya uyğun elektron sənədi relevant sənəd,yəni, tanına bilən sənəd adlanır. Bu, sadə halda ―hə-yox‖ məntiqi ilə, mürəkkəb sistemlərdə isə ―qeyri-səlis‖ məntiqlə reallaşdırılır. Sonuncu halda tanıma dərəcəsi mühüm rol oynayır. Bəzən sorğu kompüter tərəfindən səhv anlaşılır, lazım olan sənəd əvəzinə başqa sənəd təqdim edilir. Bu hadisə informasiya küyü adlanır.
Axtarışın keyfiyyət göstəricisi tamlıq və dəqiqlikdir. Axtarışın tamlığı sorğulara təqdim edilən relevant sənədlərin sayının yaddaşdakı relevant sənədlərin ümumi sayına nisbətidir. Axtarışın dəqiqliyi sorğuya cavab verən relevant sənədlərin sayının sorğuya cavab olacaq sənədlərin ümumi sayına nisbətidir.
Dostları ilə paylaş: |