İnformatikanin əsaslari


Linqvistik təminat vasitələri



Yüklə 5,72 Mb.
səhifə57/63
tarix24.02.2020
ölçüsü5,72 Mb.
#102163
növüDərs
1   ...   53   54   55   56   57   58   59   60   ...   63

Linqvistik təminat vasitələri


Mətni axtarış sistemlərində tammətnli sənədlərlə işləyərkən təbii dilin emalı vasitələrindən istifadə edilir. Bu vasitələr sözügedən sistemlərin son dərəcə mürəkkəb komponentləridir. Təbii dilin emalı vasitələri mətn sənədlərindəki sorğulardakı term- ləri (söz söz birləşmələrini, frazaları) təhlil edib onların məzmununu aydınlaşdırır, termlər arasındakı münasibətləri aşkarlayır səmərəli axtarışı təmin edir. Bu məqsədlə mətni axtarış sistemlərində linqvistik təminat vasitələri kompleksindan istifadə edilir. Bu kompleksə müxtəlif lüğətlər, tezauruslar, sistemin predmet oblastının ontoloji xüsusiy- yətlərini əks etdirən materiallar daxildir.

Sistem lüğətləri. Təbii dilin emalı ilə məşğul olan mətni axtarış sistemlərində həm ümumdil leksikası, həm predmet oblastı leksikası üzrə lüğətlərdən istifadə edilir. Bu lüğətlər mətnin morfoloji təhlilinə axtarış zamanı müxtəlif qrammatik formalardakı sözləri tanımağa imkan verir.

Tezauruslar. Mətn sənədlərinin formal təqdimatında tezaurus adlanan xüsusi lüğətlər mühüm rol oynayır. Tezaurus dilin əsas anlayışları lüğətidir. Tezaurus həm sorğunu genişləndirmək üçündür.

Ontoloji materiallar. Təbii dildə təqdim edilmiş mətn sənədlərinin və axtarış sorğularının adekvat dərki (interpretasiyası) üçün sistem predmet oblastının əsas anlayışlarını onların arasındakı müxtəlif semantik əlaqələri təyin edən vasitə olmalıdır ki, buna da ontoloji materiallar deyilir. Buraya predmet oblastının tezaurusu, birinci dərəcəli məntiq dilləri və s. aiddir.

      1. Axtarış modelləri


Axtarış modeli anlayışı. Axtarış modeli dedikdə, sənədlərin və sorğuların təqdimatı üsulları və relevantlıq kriterisinin növü və bunların əlaqələndirilməsi nəzərdə tutulur.

Sadə axtarış modeli. Bu modellər deskriptorlu və klassifikatorlu axtarışı təsvir edir.

Aidi axtarış modeli. Mətndə tez-tez rast gələn söz və söz birləşmələri əsasında

Məntiqi (Bul) axtarış modeli. Bu halda VƏ, VƏ YA, DEYİL operatorlarından istifadə edilir.

Vektor axtarış modeli. Bu halda sənəd və sorğular vektor kimi təsəvvür edilir. Sənəddəki sorğudakı söz sözbirləşmələrinin lüğətdəki koordinatları əsas rol oynayır. Axtarılan söz sənəddə varsa, onun koordinatına 1, əks halda 0 yazılır.

      1. Mətni axtarış sistemlərinin vəziyyəti və yeni tələblər


İlk mətni axtarış sistemləri kitabxana işi üçün nəzərdə tutulsa da, hal-hazırda bu, insan fəaliyyətinin bir çox sahələrinə uğurla tətbiq edilir. Xüsusən qlobal informasiya məkanı olan Veb-lə bağlı təkamül intensiv xarakter almışdır.

Mətni axtarış sahəsinin problemləri. Müasir dövrdə mətni axtarış problematikası olduqca genişlənmişdir. Belə ki, buraya: konkret axtarış modellərinin inkişafı; sistemlər üzərində eksperiment aparılması, onların testləşdirilməsi qiymətləndirilməsi metodo- logiyası; mətni axtarışın reallaşdırılması metodları; mətni axtarış VB texnologiya- larının inteqrasiya edilməsi üçün tətbiq edilən yanaşmalar; Veb mühitində axtarış; verilənlərin sıxılması metodları; sorğuların emalı səmərəliliyinin qiymətləndirilməsi; təbbi dilin emalı; mətn sənədlərinin təsnifləşdirilməsi klasterləşdirilməsi metodları; elektron kitabxanalardakı informasiya axtarışı üzrə proqram əlavələri; mətnlərin dərin təhlili; multimediya informasiyasının indeksləşdirilməsi və axtarışı texnologiyaları;

insan kompüter interfeysləri s. aiddir. Bu istiqamətlərin hamısında böyük urlar əldə edilmişdir.

      1. Mətn sistemlərinin funksional imkanlarının genişləndirilməsi


Mətni axtarış sistemləri həm baza funksiyalarının icra mexanizmlərinin təkmilləş- diriliməsi, həm əlavə imkanların yaradılması istiqamətində inkişaf etdirilir. Əlavə imkanlardan bəziləri aşağıdakilardır:

Axtarış dəqiqliyinin yüksəldilməsi. İstifadəçi sorğusundaskı termlər müxtəlif qiy- mətlilik nümayiş etdirdiyindən, bəzi sistemlər sorğuda iştirak edən termlərin əhəmiy- yətini xarakterizə edən əmsallar da verir. Bu informasiya relevantlığın qiymətləndiril- məsi zamanı istifadə edilərək axtarış dəqiqliyini yüksəltməyə imkan verir.

Sorğulara görə sənədlərin ranqlaşdırılması. Bir sıra səbəblərə görə mətni axtarış

dərəcədə uyğun gələn sənədləri sorğuya yaxınlıq dərəcəsinə görə ardıcıl düzmək lazım gəlir.



Relevantlıq üzrə əks-əlaqə. Bu, axtarışın nəticəsi istifadəçini təmin etmədikdə sor- ğunu dəqiqləşdirmək üçün yaradılan imkandır. Yəni axtarışın nəticəsi kimi təqdim edilmiş sənədlərin siyahısında istifadəçini təmin etməyən sənədlərin qeyd edilməsi yolu ilə axtarışın dəqiqləşdirilməsi həyata keçirilir.

İstifadəçi sorğularının avtomatik genişləndirilməsi. Bu, istifadəçi sorğusuna avto- matik əlavələr edilməsi yolu ilə edilir və axtarışın səmərəliliyini artırır.

Sənədlərin avtomatik indeksləşdirilməsi. Bu, işi əhəmiyyətli dərəcədə sürətləndirir.

Multi-dilli axtarış. Bu, bir neçə təbii dildə təqdim edilmiş sənədləri axtarmağa im- kan verir. Burada əsas problem sənəd ya onun fraqmentinin hansı dildə tərtib edil- diyini düzgün təyin etməkdən ibarətdir.

Kross-dilli axtarış. Bu o halda tətbiq edilir ki, sorğu bir dildə, axtarılan sənəd isə başqa dildə tərtib edilmiş olsun. Burada, ilk növbədə, sorğu sənədin hansı dillərdə tərtib edildiyi müəyyən edilir, sonra ya sorğu sənədin, ya da sənəd sorğunun dilinə tərcümə edilir.

VB sistemlərində mətni axtarış. VB resurslarının mətn sənədləri kolleksiyaları ilə inteqrasiya edilməsi mühüm əhəmiyyət daşıyır. Bir sıra relyasiyalı obyekt-relyasiyalı serverlərdə, məsələn, İBM kompaniyasının DB2, Oracle kompaniyasının Oracle Corp., Microsoft Corp. kompaniyasının SQL Server 7.0 SQL-server 2000 VBİS-lərində mətni axtarış mexanizmləri mövcuddur. Lakin bu sistemlərdəki axtarış yalnız məntiqi (bul) modelə əsaslanır.

Veb-də mətn resurslarının axtarışı. Veb resursları zənginləşdikcə bu mühitdə mətni axtarış aktuallaşır. Çünki ənənəvi naviqasiya mexanizmləri informasiya resurslarına kifayət qədər operativ müraciəti təmin etmir. Veb mühitində ilk mətni axtarış axtarış maşınları vasitəsilə icra edilirdi bu zaman yalnız aidi axtarış aparmaq mümkün idi. Sonralar Veb mühitində məntiqi (bul) axtarışı tətbiq edildi. Hal-hazırda bir sıra universal predmet oblastına yönəldilmiş Veb-axtarış sistemləri mövcuddur. Bunlardan: çoxdilli AltaVista, Yahoo!, Google və s. nəhəng axtarış sistemlərini misal göstərmək olar.

Sözügedən istiqamətdə növbəti ciddi uğurlar XML platforması standartlarına əsaslanan yeni nəsil texnologiya ilə bağlı olacaqdır. Çünki bu texnologiya axtarış



Mətni axtarış sistemləri qarşısında qoyulan əsas tələblər aşağıdakılardır: Çox iri sənəd kolleksiyaları ilə səmərəli mətni axtarışın təmin edilməsi;

Sənədin və sorğunun məzmununu daha yaxşı təqdim edən metodların işlənib hazırlanması;

Mətn, şəkil, audio, video və s. təbiətli sənədlərin birgə emalı imkanının yaradılması;

Həm statik sənədlərin, həm də sənəd axınlarındakı sənədlərin axtarışını təmin edən səmərəli metodların işlənib hazırlanması;

Mətni axtarış sistemlərinin qiymətləndirilməsi metodologiyasının yaradılması.



Yüklə 5,72 Mb.

Dostları ilə paylaş:
1   ...   53   54   55   56   57   58   59   60   ...   63




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin