Encyclopedia


Teoria lexiconului generativ



Yüklə 371,54 Kb.
səhifə4/5
tarix07.09.2018
ölçüsü371,54 Kb.
#79597
1   2   3   4   5

Teoria lexiconului generativ (LG)
Teoria lexiconului generativ (LG) a fost propusă de James Pustejovsky după ani de cercetare în domeniul lingvisticii computaţionale. Teoria propusă este un răspuns cercetătorului la întrebările puse: (1) Cum este posibil de format un număr infinit de combinaţii din un număr finit de cuvinte într-o limbă? (2) Este posibil de separat informaţia lexicală de cunoştinţele de bun simţ în reprezentarea sensului?

(1) Cum este posibil că noi suntem capabili să combinăm un număr finit de cuvinte în limba noastră într-un număr nelimitat de contexte? (2) Este informaţia lexicală separabilă de cunoştinţele noastre de bun simţ în compunerea sensului?

Teoria LG este concentrată în reprezentarea compunerii semantice în limba naturală. În opoziţie metodelor concentrate numai pe verb ca elementul principal în reprezentarea sensului, GL repartizează semantica prin toate elemente ale clauzei.

Lexicon Generativ introduce un model de reprezentare a cunoştinţelor, care oferă un vocabular bogat şi expresiv pentru informaţii lexicale. În general, GL este preocupat de explicarea folosirii creative a limbii; se consideră că lexiconul conţine o mulţime de informaţie ce stă la baza acestui fenomen. Mai precis, este întrodusă noţiunea de un lexicon ce se află în dezvotare permanentă, care GL încearcă să imite, acest lucru este în contrast cu lexicon static utilizat larg în prezent. Una dintre cele mai dificile probleme cu care se confruntă semantica teoretică şi computaţională este definirea interfeţei între cunoştinţele lingvistice şi non-lingvistice. GL a fost iniţial dezvoltat ca un cadru teoretic pentru codificarea restricţiilor tematice în limbaj natural. Posibil că aspectul cel mai controversat al GL a fost modul în care codificarea lexicală a cunoştinţelor este exploatată în construcţia de interpretare a enunţurilor lingvistice. Următoarele ipoteze standarde în GL presupun că resursele disponibile pentru un element lexical constă din următoarele patru nivele:



  1. LEXICAL TYPING STRUCTURE: defineşte tipul cuvântului poziţionîndu-l
    în cadrul sistemului de tipuri pentru o limbă; este reprezentată relaţia sensului cuvîntului dat cu sensurile altor cuvinte şi legătura lui cu „cunoştinţele de bun simţ”.

  2. ARGUMENT STRUCTURE: specifică numărul şi natura argumentelor pentru un predicat; defineşte reaizarea sintactică a cuvîntului dat şi legătura acestei cu interpretarea lui semantică.

  3. EVENT STRUCTURE: defineşte tipul evenimentului exprimării şi toate subevenimente posibile pentru exprimarea dată; structura dată conţine trei componente de bază: tipul evenimentului (starea S, proces P sau tranziţie T), focusul evenimentului, şi regulile de compunere a evenimentului.

  4. QUALIA STRUCTURE: o diferenţiere structurală a forţei predicative al elementelor lexiconului.

QUALIA STRUCTURE, inspirată de Moravcsik's (1975), este definită ca moduri de descrieri asociate cu un cuvânt sau o frază în limbă, şi sunt definite după cum urmează (Pustejovsky, 1991):

  1. FORMAL: categoria de bază care distinge semnificaţia unui cuvânt în cadrul unui domeniu mai vast;

  2. CONSTITUTIVE: relaţia dintre un obiect şi părţile sale componente;

  3. TELIC: scopul sau funcţia obiectului dat, dacă există;

  4. AGENTIVE: factorii implicaţi în apariţia obiectului dat şi originea lui.

Astfel, teoriile lingvistice clasice presupun existenţa unui lexicon static în care toate cuvintele obţin enumerarea şi descrierea sensurilor lor. Se presupune că numărul de sensuri este finit şi orice situaţie ce necesită detectarea sensului cuvîntului într-un context porneşte un algoritm de selectare a sensului potrivit pentru contextul dat dintr-un număr predefinit de sensuri descrise în lexicon în baza contextului. Analiza se face numai pentru un cuvînt, ambiguitatea cuvintelor din context în algoritmul dat este ignorată.

Însă în realitate nu este chiar aşa. Limba naturală are un caracter creativ, ea se află în permanentă scimbare, sensurile cuvintelor se schimbă, dispar, apar sensuri noi; în multe cazuri diferenţa între sensuri într-un context este foarte vagă, neclară. Sensurile cuvintelor vecine într-un context interacţionează, formînd nuanţe noi. Toate acestea impedică selectarea sensului corect din lista sensurilor predefinite în lexicon static.

GL propune un lexicon ce nu conţine o listă de sensuri predefinite pentru fiecare cuvînt. În lexicon generativ cuvintele sunt descrise de un set de caracteristici ce definesc un spaţiu de interpretări posibile ale cuvîntului dat. Caracteristicile date conţin organizarea conceptuală a unităţilor lexiconului, decompoziţia primitivă a lor şi descrierea structurii de predicat-argument posibile pentru unitatea dată. Într-un context caracteristicile cuvintelor interacţionează, formînd interpretarea adecvată a fiecărui cuvînt într-un enunţ. Astfel, noţiunea de compunere în interprearea semantică joacă un rol crucial formînd sensul enunţului din combinaţia caracteristicilor tuturor elementelor, nu numai verbului cu argumentele sale predefinite.
Adaptare Qualia Structure pentru lexiconul Simple
Una din caracteristicile principale ale lexicoanelor create în cadrul proiectului SIMPLE este abilitatea de a descrie diferite aspecte ale sensului cuvântului. Ca instrument pentru repreentarea sensului cuvântului este folosită teoria Lexiconului Generativ şi anume partea Qualia Structure (Pustejovsky 1995) care strcturizează conceptele ortogonale ale sensurilor cuvintelor în spaţiul multidimensional al utilizării lor care reprezintă limba naturală. Qualia Structure foloseşte patru aşa numite roluri care răspund la patru întrebări în privinţa fiecărei unităţi ale lexiconului. În urmare sunt prezentate rourie şi întrebările corespunzătoare ce ajută la definirea lor:

1. formal role – A cărei clase noţiunea dată este subclasă? Care sunt caracteristicile noţiunii date care o disting de alte noţiuni?

2. constitutive role – Care este structura internă a noţiunii date? Din care noţiune ea este parte-componentă?

3. telic role – Care sunt funţiile tipice ale noţiunii? Pentru ce este folosită noţiunea dată?

4. agentive role – Cum şi de unde a apărut noţiunea dată? Cine a creat noţiunea dată?

Cu toate că răspunsurile la întrebările date nu descriu conţinutul sensului conceptului, Pustejovsky (1995) a demonstrat că aceste patru Qualia dimensiuni joacă un rol proeminent în determinarea relaţiilor între conceptul dat şi alte unităţi ale lexiconului şi structurilor sintactice în care conceptul dat este folosit.

Se consideră că rolurile date pot descrie comportarea lingvistică a cuvintelor oricărei parţi de vorbire, însă la prima vedere par a fi mai direct potrivite pentru caracterizarea anumite tipuri de substantive. Una din sarcinile iniţiale în SIMPLE era extinderea fiecărei Qualia caracteristici cu scopul adaptării lor pentru descrierea tuturor părţilor de vorbire. Fiecare Qualia rol a fost considerat topul ierarhiei descrierii mai specifice ale sensurilor cuvintelor. Figura 1 prezintă o parte de ierarhie creată în SIMPLE.

Figura 1. Specificarea Qualia rolurilor în SIMPLE.


În urmare este prezentat un fragment al listei de subroluri pentru rolul Constitutiv:
3. CONSTITUTIVE [Top]

3.1. Part [Constitutive]

3.1.1. Body_part [Part]

3.2. Group [Constitutive]

3.2.1. Human_group [Group]

3.3. Amount [Constitutive]

. . .


În final au fost stabilite 64 subroluri Qualia Structure. Nu toate din acestea sunt aplicabile la toate cuvinte. Există aşa numite tipuri simple care sunt caracterizate cu un rol ca rolu principal pentru noţiunea dată. De exemplu, ROLE > LIVING_ENTITY > HUMAN este caracterizat doar de rolul formal. Altele au nevoie de descriere complexă ce include mai multe subroluri de tip diferit. De exemplu, în lexicon italian cuvîntul „ascia” (topor) este descris cu rolurile formal şi telic ca fiind un instrument de tăiet utilizat în special pentru prelucrarea lemnului (figura 2).

Figura 2. Descrierea cuvîntului „ascia” (topor) utilizînd Qualia roluri.
Descrierea Qualia caracteristicilor cuvîntului „butoi” implică mai multe subroluri. Astfel, sunt utilizate următoarele subroluri rolului constitutiv: „made_of” şi „contains” (figura 3).

Figura 3. Descrierea cuvîntului „botte” (butoi) utilizînd Qualia subroluri.


Qualia caracteristicile joacă un rol crucial în definirea sensurilor cuvintelor polisemantice în lexicon SIMPLE pedescriind diferite aspecte ale sensului. De exemplu, codificarea cuvântului ala (aripa) în lexiconul italian are patru sensuri(1):

(a) "part of an airplane" – aripa aeroplanului;

(b) "part of a building, annex" – aripa clădirii;

(c) "organ of birds for flying" - aripa pasării;

(d) "role in sport" - jucător în echipa de fotbal.

Rolul formal (is_a) deosebeşte primele trei sensuri de ultimul sens:

(a) isa (,


)

(b) isa (,


) partea-componentă

(c) isa (,


)

(d) isa (, ) jucător



Rolul constitutiv (is_a_par_of) deosebeşte primele trei sensuri prin obiectele a cărui părţi ele sunt:

(a) is_a_part_of (, ) aeroplan;

(b) is_a_part_of (, ) pasăre;

(c) is_a_part_of (, ) clădire.



Rolul telic (used for) ajută la evidenţierea similarităţii între primul şi al treilea sens:

(
este folosit pentru zbor


a) used_for (, )

(b) used_for (, )



Rolul agentiv introduce diferenţa între sensurile acestea din cauza că primul sens se referă la un obiect artificial creat de oameni, pe când al doilea este natural. Caracteristica aceasta este asămănătoare la primul şi a doilea sens:

(a) agentive (, ) fabricat

(b) agentive (, ) construit
Modelul SIMPLE
Modelul Simple prevede specificaţia formală pentru reprezentarea şi codificarea informaţiei următoare: i) tip semantic, ce corespunde structurii care instanţiază SemU; ii) informaţiile pe domeniu; iii) descrierea lexicografică; iv) structura argumentelor pentru SemU predicative; v) restricţii tematice selectionale pentru argumente; vi) tipul de eveniment, pentru caracterizarea predicatelor verbale; vii) legături dintre argumente pentru cadrele de subcategorizare sintactice, aşa cum este reprezentat în lexicoanele PAROLE; viii) Qualia Structure; ix) informaţii despre alternanţa polisemică regulată a sensurilor cuvintelor; x) relaţiilor între părţie de vorbire cu sens apropiat (de exemplu, inteligent - inteligenţa; scriitor - a scrie); xi) sinonimie. Toată informaţia dată este codificată în modelul Simple într-un mod cît mai compact.
Modelul Simple conţine trei tipuri de entităţi formale:


  1. Semantic Units (SemU) – codifică sensul sau conceptul semantic. Fiecare SemU este ataşat la un semantic type din ontologie. În afară de această, el este dotat cu altă informaţie care este prezentată în formă de cadre (şabloane) semantice (templates) şi care adaugă diferite caracteristici ale sensului.

  2. Semantic Type – include informaţia structurată despre cele patru Qualia roluri care este sortată în definirea tipului (type-defining information) şi informaţia suplimentară (additional information). Definirea tipului caracterizează tipul semantic pe când informaţia adăugătoare specifică alte componente ale unităţii semantice.

  3. Template – o structură schematică utilizată de lexicografi pentru codificarea unităţilor semantice. Lexicografi folosesc astfel de structuri pentru simplificarea descrierii lexemelor într-un mod unificat şi armonizat. În structură se înscrie tipul semantic şi alte tipuri de informaţie adăugătoare. Un set de structuri standardizate a fost creat la prima etapă de proiect cu scopul utilizării uniforme pentru toate limbile participante. Alte structuri, mai specifice se introduc în procesul completării lexiconului dacă apare necesitatea de a codifica unele concepte specifice ale limbii particulare.

Figura 4. Descrierea rolurilor semantice ale elementelor lexiconului


SIMPLE semantic network
Aceste trei tipuri servesc pentru optimizarea stocării informaţiei semantice şi sintactice în lexicoanele Simple. În loc de dublare multiplă a rolurilor semantice ale cuvintelor în fiecare Semantic Unit, toate rolurile posibile sunt stocate în Semantic Types şi Semantic Units conţin doar referinţe la rolurile corespunzătoare. Relaţiile între Semantic Units şi Semantic Types sunt exemplificate în figura 4. Exemplul dat cu cuvîntul ala (italian), aripa a fost descris mai sus. Patru sensuri ale cuvîntului dat sunt reprezentate cu Semantic Units care în rîndul său sunt descrise prin legături cu Semantic Types. Semantic Types sunt reprezetate în ovaluri şi descriu Qualia roluri. Respectiv, SemU cu sensul „partea a avionului” are patru legături cu cele patru Qualia roluri:

Formal (Isa) – part

Agentive - fabricat

Constitutive (Is a part of) - avion

Telic (Is used for) – zbor

În mod similar este realizată şi descrierea legăturilor sintactico-semantice pentru unităţile lexicale. Cadre (şabloane) sintactico-semantice sunt stocate în Templates şi Semantic Units au legături cu cadrele corespunzătoare.

Astfel, entităţile formale sunt interconnectate într-o reţea semantică care apovizionează lexemele cu informaţia necesară şi în acelaşi timp evită repetarea şabloanelor identice. Caracteristica aceasta a structurii lexicoanelor în SIMPLE este una din optimizările cruciale.

La fel, în scopul unificării lexicoanelor create pentru toate limbile-participante este utilizat setul „conceptelor de bază” definit în cadrul proiectului EuroWordNet (aproximativ 800 concepte de la nivelul de vîrf al ontologiei). Toate 12 lexicoane limbilor-participante sunt conectate la setul acesta ce asigură legătura între acestea prin EuroWordNet Interlingual Index. Astfel, fiecare Semantic Unit are o legătură cu un concept din ontologia sus-menţionată.

Astfel, informaţia într-un Semantic Unit reprezentată prin legături cu Semantic Types şi Templates ataşată la un sens al cuvîntului este prezentată în figurile 5 şi 6.
SIMPLE sample entries

Figura 5. Reprezentarea elementului lexiconului Simple (substantiv).


În figura 5 este prezentată descrierea cuvîntului “violin” (vioara). SEMU_ID este identificatorul unităţii semantice date. POS (Part Of Speech) descrie partea de vorbire a cuvîntului dat, şi anume – N (Noun) substantiv. GLOSS (glossary) dă o explicaţie scurtă a sensului cuvîntului dat. SEMANTIC_TYPE este legătura cu ontologia de bază. În cazul dat conceptul “violin” este conectat cu conceptul mai general “instrument”. DOMAIN este o clasificare suplimentară care specifică că instrumentul dat este din domeniul muzicii. La urmă sunt reprezentate Qualia roluri aplicabile pentru conceptul dat. În cazul exemplificat sunt descrise trei roluri: FORMAL_ROLE, CONSTITUTIVE_ROLE şi TELIC_ROLE. Se observă, că CONSTITUTIVE_ROLE şi TELIC_ROLE sunt descrise prin subroluri. CONSTITUTIVE_ROLE constă din has_a_part: string (a avea ca o parte: strună) şi made_of: wood (făcut din: lemn). Respectiv, TELIC_ROLE constă din used_for: play (utilizat pentru: a cînta) şi used_by: violinist (utilizat de: viorist).


Figura 5. Reprezentarea elementului lexiconului Simple (verb).


Figura 6 conţine exemplu de descriere a verbului. Ca şi în exemplu precedent există SEMU_ID, POS: V (verb), GLOSS – descrerea sensului (a percepe în mod intenţionat ceva cu ochii), SEMANTIC_TYPE care este legătura cu ontologia de bază. Verbul, însă, conţine şi alte tipuri de descrieri, şi anume: EVENT_TYPE: process (tipul evenimentului: proces) şi PRED_REPRESENTATION ce este reprezentarea structurii cadrului semantic al predicatului format de verbul dat. În cazul dat cadrul semantic este format din două argumente: subiectul şi complementul direct al propoziţiei. Pentru agrumentele date sunt reprezentate restricţii semantice prin conceptele ontologiei. Primul argument Arg0 (subiectul) trebuie să fie însufleţit (animate), al doilea argument Arg1 (complement direct) este o entitate (entity).

Astfel, SIMPLE conţine structuri sintactico-semantice ce sunt dedicate înţelegerii corecte a textului. Aceste structuri constă din trei niveluri: (1) nivel sintactic (în lexicon creat în cadrul proiectului PAROLE); (2) nivelul predicatului în SemU ce descriu verbe cu structurile argumentelor lor; (3) nivel de corespondenţă la care argumentele sunt conectate la poziţiile sintactice; aici este posibil de creat un set nelimitat de larg de constrîngeri (restricţii semantice sau tematice) pentru reprezentarea legăturilor complexe.


SIMPLE semantic frames

Figura 7. Legăturile semantice între cuvinte.
Alt tip de informaţie codificată în formă de relaţii semantice sunt relaţii între diferite părţi de vorbire care reprezintă noţiuni semantic foarte apropiate sau noţiuni similare. Spre exemplu, a coace(verb) – coptură(substantiv) – copt(adjectiv). Pentru căpturarea relaţiei acestea sunt create relaţii de aşa numită nominalizare. Nominalizarea este actul de creare a substantivului din verb cu păstrarea sensului lui de acţiune sau stare. Spre exemplu, „rectorul a vizitat şedinţa facultăţii” - „vizita rectorului”; „parlamentarii au discutat adoptarea hotărîrii” – „discutarea adoptării hotărîrii”; „hotărîrea a fost adoptată” – „adoptarea hotărîrii”. Nominalizarea are o răspîndire largă în textele moderne ce necesită creare a metodelor de analiză adecvată a grupurilor nominale cu substantivele date. Reprezentarea nominalizărilor în SIMPLE este un caz interesant de interacţiunile dintre modulele lui. De exemplu, SemUs de verb distruge” şi a substantivului derivat distrugere” sunt încadrate la acelaşi nivel predicativ, adică ele au acelaşi predicat abstract (în cazul dat, PREDDESTROY) şi aceiaşi structură de argumente. Prin urmare, SIMPLE permite de capturat cu uşurinţă similitudine semantică dintre verbe şi substantive derivate (de exemplu, restricţiile selectionale de argumente sunt la fel pentru verb şi sunstantiv derivat), şi în acelaşi timp, pentru a descrie diferenţele lor în relaţii sintactice.

Figurele 7 şi 8 demonstrează în mod grafic aceste relaţii. În figura 7 sunt demonstrate relaţii între verbul „employ” (angaja) şi nominalizările lui posibile: „employment” – (angajare), „employer” – (angajator), „employee” – (angajat). Toate SemU ce descriu cuvintele date au legătură cu cadrul predicatului abstract „PREDemploy” care are două argumente. În descrierea sintactică argumentele acestea sunt subiectul şi complement direct al propoziţiei ce sunt ataşate la prdicatu dat. În descrierea semantică ele sunt prezentate ca AGENT (acela care execută acţiunea) şi PATIENT (acela asupra căreia acţiunea dată este executată). Pentru argumentele date sunt create restricţii semantice (tematice), şi anume, ambii trebuie să fiu oameni (HUMAN). În figura 8 sunt prezentate particularităţile limbii. În limba italiană cuvîntul „comprendere” are două sensuri: „a înţelege” (to understand) şi „a include” (to include). Un sens poate fi nominalizat cu cuvîntul „comprensione” pe când altul – nu. Respectiv, SemU substantivului are legătură cu cadrul predicatului ce descrie sensul de a înţelege şi nu poate avea legătură cu cadrul ce descrie sensul de a include.



Figura 7. Legăturile semantice între cuvinte.
Este deja bine cunoscut faptul că pentru rezolvarea problemelor actuale de prelucrare a limbajului natural (Information Extraction, Word Sense Disambiguation, NP Recognition, etc.) este necesar de a căptura sensul bogat al grupurilor nominale în text. Textele reale conţin o mulţime de aşa numite nominalizări care deseori au o structură complicată. Spre exemplu, grupul nominal Vizita persoanelor de afacere din Italia la fabrica de conserve din Calaraşi din 25 mai 2003. reprezintă un eveniment întreg. În cazul exemplului dat rezolvarea problemei înţelegerii sensului se bazează pe rezolvarea problemei ataşării corecte a grupurilor prepoziţionale în text. Problema aceasta este actuală pentru majoritatea limbilor europene. În exemplul precedent propoziţia conţine 6 prepoziţii, respectiv, 6 grupuri prepoziţionale: de afacere; din Italia; la fabrica; de conserve; din Calaraşi; din 25 mai 2003. În cazul dat este necesar de definit că „de afacere” se ataşează la „persoanelor”, „din Italia” la fel se ataşează la „persoanelor” dar nu la „afacere”, „la fabrica” se ataşează la „Vizita”, şi aşa mai departe. Astfel, observăm, că problema ataşării nu este deloc simplă pentru un sistem de interpretare a limbii. SIMPLE propune metoda de rezolvare a problemei date în baza Qualia rolurilor a elementelor combinaţiei. De exemplu, combinaţia „persoanele de afacere” este formată prin ataşarea conceptelor „persoane” şi „afacere” din cauza că Qualia roluri conceptelor date sunt compatibile. La fel se procedează şi cu „fabrica de conserve”; rolul Telic a conceptului „fabrica” se combină cu rolul Agentiv a conceptului „conservă”.

Utilizarea analizei şi comparării Qualia rolurior sensurilor cuvintelor polisemantice ajută la rezolvarea problemei ambiguităţii cuvintelor. Compararea Qualia rolurilor este foarte eficientă în cazul omonimelor, de exemplu, cuvîntul „bank”, omonimele bine cunoscute: „organizaţia financiară” şi „malul rîului”. Qualia rolurile pentru noţiunile date sunt absolut diferite, analiza lor şi compararea cu contextul ca regulă permite dezambiguizarea detectarea sensului corect. Mai complicată este situaţia cu polisemia. În multe cazuri sensurile sunt destul de apropiate şi se deosebesc cu greu. Un set de ambiguităţi frecvente sunt descrise în aşa numite „relaţii polisemantice comune” (regular polysemous relation) care sunt comune pentru limbile europene. De exemplu, cuvintele care descriu o organizaţie ca regulă se folosesc şi pentru a numi locul, clădirea unde se află organizaţia dată. Comparaţi: „Liceul „Ion Creangă” a participat în concurs şi a luat locul întîi”, „Liceul „Ion Creangă” se află lîngă Universitatea Tehnică”, „Universitatea Tehnică a Moldovei a fost fondată în anul 1964”. Într-a doilea exemplu la liceu şi la universitate se adreasează anume ca la clădiri care sunt situate aproape una de alta. Altă ambiguitate comună este ambiguitatea legată de mîncare. De exemplu, cuvintele „găină”, „porc”, „peşte” şi multe alte pot să aibă sensul felurior de mîncare sau sensul animalelor, cuvintele „răsărită”, „porumb”, „vişine” pot fi plante sau produceor alimentare. Respectiv, astfel de polisemie comună este descrisă în SIMPLE ca relaţia între SemU respective. De exemplu, BuildingInstitution (1>,2>) este relaţia între SemU 1> ca cădirea şcolii (Building) şi SemU 2> ca o instituţie de învăţămînt (Institution). Relaţia BuildingInstitution este o relaţie comună pentru numeroase cuvinte ce descriu organizaţii, şi este creată în SIMPLE pentru a descrie astfel de ambiguitate.

În concluzie se poate de spus că SIMPLE este un proiect grandios cu scopul ambiţios de a crea un set complet şi  exhaustiv de resurse lexicale ce pot fi utilizate în orice sistem de prelucrare a limbajului natural. Unul din scopurile proiectului dat este de a unifica modul de reprezentare a resurseor lingvistice pentru limbile europene. Alt scop ambiţios este de a rezolva problema semanticii. Pentru rezolvarea problemei date a fost creată o reţea semantică dintr-un număr larg de relaţii semantice între cuvintele lexiconului. Reţeaua dată include relaţiile cu ontologia de bază, clasificarea pe domenii, descrierea Qualia rolurilor şi relaţii sintactico-semantice cu cadrele sintactico-semantice şi restricţii semantice (tematice). Reţeaua dată modelează legăturile semantice între concepte ce sunt stocate în creierul omului. Însă avantajul lexiconului acesta este şi deyavantajul lui. Oricare sistem ce intenţionează să utilizeze lexiconul dat cu toate legăturile lui trebuie sa aibă un algoritm sofisticat pentri analiza adecvată a tuturor legăturilor pentru fiecare cuvînt al textului şi combinarea lor adecvată. Problema creării algoritmelor de aşa mod pînă cînd nu este rezolvată, sistemele moderne nu reuşesc să analizeze toate sensurile şi toate relaţiile semantice ale cuvintelor dintr-un text codificate în lexiconul SIMPLE.


Yüklə 371,54 Kb.

Dostları ilə paylaş:
1   2   3   4   5




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin