Encyclopedia



Yüklə 371,54 Kb.
səhifə3/5
tarix07.09.2018
ölçüsü371,54 Kb.
#79597
1   2   3   4   5

Adjectivele in WordNet.
Adjectivele, ca regulă, au funcţia de modificatori. Aceiaşi funcţie pot avea și substantivele (Mozart symphony – simfonia lui Mozart) sau verbele (broken chair – scaun stricat), deseori grupele întregi de cuvinte (chair by the window – scaunul de lîngă fereastră). Însă, totuşi, în majoritatea cazurilor modificatori sunt adjectivele.

Figura 2. Legături semantice între substantivele în WordNet.


Adjectivele în WordNet se impart în patru grupe. Două grupe mari formează adjectivele descriptive si relaţionale. Adjectivele descriptive ca regulă au antonim sau cuvinte antonimice dupa sens si gradul de comparaţie. Spre exemplu, frumos, mare, cinstit. Adjectivul frumos are grad de comparaţie: frumos, foarte frumos, cel mai frumos şi antonimul: urât. Adjective relaţionale sunt în majoritatea cazurilor create din substantive sau verbe. Spre exemlu, patrat, construit. Alte două grupe sunt mici, și anume un grup aparte formează adjectivele de culoare care sunt considerate un caz specific. A patra categorie este formată dintr-un grup mic de adjective care au fost numite „reference-modifying”, ce înseamnă că aceste adjective schimbă sensul substantivului pe care-l modifică. De exemplu, former prezident – fostul președinte nu este președinte la momentul dat, possible earthquake – cutremur de pămînt posibil, poate să nu mai fie deloc.

Adjectivele descriptive formează cea mai mare clasă de adjective. Adjectivul descriptiv descrie oarecare atribut al obiectului. Descrerea logică în cazu dat poate fi „X este Adj”, unde X este o entitate și A este un atribut a lui X, care este descris de adjectivul Adj. În forma matematică: A(X)=Adj. Spre exemplu, Valiza este grea. Aici Valiza este X și are un atribut – greutate, care este descris de adjectiv grea. Greutatea ( Valiza ) = Grea. Alt exemplu: Problema este uşoară. Atributul problemei este Complexitatea. Complexitatea(Problema) = uşoară.

Sinonimia între adjective este prezentată destul de larg. În setul de sinonime se observă un cuvânt - nucleu, care reprezintă noţiunea şi cuvintele care denotează diferite variaţiuni ale noţiunii acestea. Spre exemplu: cuvântul wat reprezintă noţiunea umed. Sinonimele lui sunt watery, damp, moist, humid, soggy (apos, jilav, purulent, igrasios, ud).

Relaţie de bază în afară de sinonimie este antonimia. Antonimia este relaţia lexicală, adica relaţia între cuvinte individuale, dar nu între sensuri, şi ridică un set de probleme. Spre exemplu, cuvintele heavy, weighty, ponderous sunt sinonime. Dar antonim pentru heavy este light, pentru weighty este weightless şi pentru ponderous nu există nici un antonim.

Deci, antonimia nu poate fi stabilită între sinseturi, numai între cuvinte individuale. Cele mai evidente cazuri de antonimie sunt cuvintele cu prefixe in- im- ir- un- . Ca rezultat, în WordNet sunt prezentate 2 tipuri de relaţii – sinonimie sau similaritate şi antonimie directa. Cuvintele care nu au antonime directe obţin antonime indirecte prin relaţii X -> similar -> Y -> antonim -> Z. De exemplu, ponderous -> similar -> heavy -> antonim -> light. Aşadar, cuvîntul ponderous are antonim indirect, cuvîntul cu sensul opus light.

Relația de hiperonimie – hiponimie între adjective nu poate fi stabilită, astfel între adjective nu există relaţie ierarhică ca între substantive.

Ca rezultat al investigaţiilor adjectivelor a fost creată structura bipolară dintr-o pereche de antonime directe, fiecare cu sinonimele săi care este prezentată în figura 3. Evident că astfel de structuri sunt posibile doar pentru adjectivele descriptive care au antonim.

Adjective relaţionale practic nu au grad de comparaţie şi antonime. Spre exemplu, adjectivele muzical, criminal, englez, nuclear sunt relaţionale. Ele ca regulă nu pot fi predicative şi seamană cu modificatori substantivale. Sunt interesante sensurile unor adjective. Dacă comparăm copil muzical, instrument muzical şi concert muzical sensul adjectivului muzical este diferit, noțiunea ce unește toate sensurile acestea fiind muzica.

Adjectivele relaţionale sunt organizate în sinseturi cu referinţă la substantivul corespunzător. Spre exemplu, sinsetul {stellar, astral, sideral, noun.object:star } se referă la substantivul star.



Polisemie Adjectivele sunt destul de polisemantice şi sensul lor depinde mult de substantivele, pe care le modifica. De exmplu, adjectivul fresh își scimbă nuanțe de sens în dependență de substantiv: fresh idea, fresh bread, fresh news, fresh water, fresh air, etc. Unii lingvişti consideră că toate sensurile acestea sunt diferite, alții propun o altă teorie ce spune că adjectivul are un sens, dar cu substantive diferite apar diferite interpretări ale sensului dat. În WordNet este prezentat primul punct de vedere că adjectivele sunt polisemantice şi că substantivele pe care ele le modifică ajută la determinarea sensurilor lor.

Contribuţia adjectivelor în pereche adjectiv-substantiv este secundară şi cea mai optimală variantă este crearea legăturilor între substantive şi adjective. Şi adjectivele şi substantivele sunt organizate in aşa mod, ca să facă legăturile acestea cît mai simple. Legăturile acestea sunt create numai într-o direcţie: de la adjectiv la substantiv.



Reference-modifying adjectives. Adjectivele acestea formeaza o clasă din cîteva zeci de cuvinte aşa ca fostul, aşa-zis, viitor, simulat, asumat, presupus, potenţial, virtual. Dacă adjectivele relaţionale modifică noţiunile, dând lor o caracteristică adjectivele acestea schimbă sensul obiectului pe care îl modifică. Președinte potenţial nu este președinte propriu-zis, el este numai candidat și poate nu va fi președinte nici o dată. Ele deseori au functia adverbelor şi ca regulă nu pot folosite predicativ. Spre exemplu, putem spune fostul preşedinte, dar nu putem presedintele este fostul. Această deosebire este marcată în WordNet. Adjectivele de tipul acesta au antonime directe sau cuvintele cu sensul opus.

Figura 3. Legături semantice între adjectivele în WordNet.


Adjectivele de culoare formează o clasă aparte, ele au grad de comparaţie dar, practic, nu au antonime (în afară de white-black, light-dark). Cuvintele, care descriu culoarea pot fi atât substantive cât şi adjective. Este interesantă observaţia că numărul adjectivelor de culoare în limbă creşte în dependenţă de dezvoltarea artei sau industriei (producerii vopselelor și mărfii de diferite culori) care are nevoe de o terminologie corespunzătoare.
Verbele în WordNet
Verbele sunt considerate ca cea mai importantă parte de vorbire din punct de vedere sintactic şi al structurii propoziţiei. Fiecare propoziţie engleză trebuie să conţină cel puţin un verb, pe cînd substantivele nu sunt atît de necesare. Este deja o tradiție de creat modele ale structurii propoziţiei în jurul verbului ca nucleu sintactic şi semantic. Exemple de teorii care consideră verbul centrul logic al propoziției sunt: teoria cazurilor cu rolurile tematice ale substantivelor în jurul predicatului, şabloane sintactice ale verbelor cu restricţii semantice, și altele. Prin urmare, verbul este cea mai dificilă parte de vorbire din punct de vedere al analizei ei.

În pofida faptului că fiecare propoziţie engleză necesită cel puţin un verb, numărul total de verbe în limba engleză este mai mic decît al substantivelor. Spre exemplu, dicţionarul englez Collins English Dictionary conţine 43635 substantive şi numai 14190 verbe. Cum atunci verbele realizeză toate sensurile necesare în limbă? Verbele sunt cu mult mai polisemantice decât substantivele. Sensul verbelor se schimba în dependenţă de subiectul care apare în propoziţie. Altă metodă de a crea sensul nou a verbului sunt așa numite pospozition, prepoziții care se plaseză după verb. De exemplu: look at, look for, look up, look after, toate au sensurile sale. Verbele cel mai frecvent folosite (have, be, run, make, set, go, take, get) sunt şi cele mai polisemantice. În scopul definirii sensurilor diferite ale verbelor sunt prevăzute legăturile cu substantivele corespunzătoare. Spre exemplu, pentru verbul run: run the streets, run from one’s word, running to form, running for the city council, ran aground on a sandbank, shuttle runs daily, news run ş.a.; în fiecare combinaţie verbul are alt sens.



Sinonimia nu este prezentă între verbele engleze, sunt practic numai câteva sinonime adevărate. Unele verbe cu acelaşi sens nu pot înlocui unul pe altul din cauza că au diferite domenii de utilizare. Spre exemplu, verbele buy şi purchase. Ca regulă subiectul şi obiectul acestor verbe sunt diferite. De exemplu, în propoziţia A housewife bought some carrots verbul purchase nu este potrivit. Reieșind din definiția sinonimelor acceptată de autorii WordNet-ului, dacă cuvintele nu pot înlocui unul pe altul într-un context, ele nu pot fi considerate sinonime.

La fel ca și pentru adjective pentru verbe este problematic de a stabili relații de hiperonimie-hiponimie sau holonimie-meronimie. Astfel a fost nevoie de căutat alte tipuri de reații între verbe.

În scopul unificării reprezentării sensului mulţi cercetători au lucrat asupra problemei clasificării verbelor şi sensurilor lor. S-au executat mai multe încercări de clasificare prin descompunerea sensurilor verbelor ce a obținut denumirea semantica decompoziţională. Ideea de bază în clasificarea dată este de a descompune sensurile acțiunilor descrise de verbe în niște acțiuni elementare, acțiuni de bază. Au fost propuse diferite tipuri de clasificări ale predicatelor în propoziţie, prin urmare şi a sensurilor verbelor corespunzătoare. De exemplu au fost propuse aşa tipuri abstracte de predicate: EVENIMENT, ACŢIUNE, STARE, MANIERĂ şi altele.

Altă metodă de clasificare a verbelor numită semantica relaţională diferă de cea decompoziţională prin următoarele concepte:



    • Teoria dată foloseşte cuvinte reale dar nu concepte abstracte în calitate de elemente de bază;

    • Relaţiile între cuvintele limbii au diferite denumiri ce le descriu.

Însă analiza relaţională conţine şi unele concepte de decompoziţie. Unul din predicatele abstracte CAUSE este considerat ca relaţie între verbe, de exemplu, show-see (show este cauza pentru see) O altă abstracţie MANNER este codificată în WordNet ca relaţia numită troponymy. De exemplu, verbele slip-snore(a dormi – a sforăi).

Adepţii teoriei decompoziţiei presupun că oamenii au în memorie unele abstracţii generale ca MIŞCAREA, SCHIMBAREA, CAUZA, STAREA şi altele în jurul cărora sunt grupate verbele apropiate după sens. Autorii WordNet-ului s-au bazat pe semantica relaţională în clasificarea verbelor. În WordNet verbele move, go, change din cauza sensului lor general sunt considerate cuvintele iniţiale (unique beginners). Alte verbe sunt grupate în jurul lor.

Autorii WordNetului au stabilit lexical ENTAILMENT ca relaţia de bază între verbe. În limba română această relație se traduce ca moştenirea lexicală sau includerea. Definiţia moştenirii lexicale este următoarea: clauza P este moştenitorul clauzei Q atunci şi numai atunci când nu există situaţie cînd P este adevărat şi Q este fals. De exemplu, verbul swallow este moştenitorul verbului eat. Relaţia această este asimetrică. Dacă între unele verbe relaţia aceasta este simetrică ele sunt sinonime. De exemplu, She bought something.= She purchased something. Alt exemplu este swallow=gulp (a înghiţi). Această relaţie poate fi compărată cu holonimia-meronimia. De exemplu, fenomenul de a visa este o parte a fenomenului de a dormi. Însă în multe cazuri astfel de relații nu sunt stabilite atît de clar ca între substantive. Unele activităţi denotate de verbe pot fi descompuse în subactivităţi, dar activităţile acestea rar sunt descrise cu un verb. De exemplu, buy include pick out, negotiate, pay. Activităţile, ca regulă au nişte parametri temporali. Ca regulă, relația de încludere între verbe subînțelege relația temporală între evenimente descrise de verbele date. Unele subactivităţi ocupă o parte de timp din activitatea principală (ca în exemplul precedent), altele se efectuează paralel, de exemplu a merge – a păşi.

Cum a mai fost menționat mai sus, relația de hiperonimie-hiponimie între verbe nu există în aşa formă ca între substantive. Modificaţia relaţiei acestea între verbe este relaţia de troponimie (TROPONYMY), de la cuvântul grecesc tropos - manieră. Relaţia aceasta poate fi descrisă în următorul mod: A face V2 înseamnă a face V1 într-o manieră. De exemplu, a şopti înseamnă a vorbi în şoaptă, a recita înseamnă a vorbi în voce tare, pronunțată, a bîlbîi înseamnă a vorbi neclar, nedeslușit și împiedicat. Toate cuvintele acestea sunt troponime cuvîntului a vorbi. De fapt, troponimia este o variantă de includere sau moştenire care co-există în timp. Ca regulă, V1 este un verb mai general decât V2.



Taxonomia verbelor. După cum s-a observat din descrierea anterioară, verbele nu pot fi organizate într-un arbore ca substantivele. Se poate de spus, de exemplu ambling is a kind of walking dar această nu este aceeaşi relaţie, ca şi între substantive. Unele verbe care pot fi grupate în structuri similare cu un arbore formeaza mai degrabă ceva in formă de tufari deformate unde numărul de nivele nu depăşeşte 4. În fiecare tufar există un verb principal cu sensul mai general (move, go, be, get) şi un set de verbe ataşate la el. Este observată regula că cu cât mai departe de la verbul principal se află cuvântul în hierarhie, cu atât mai puţine substantive pot fi ataşate la el. De exemplu, move este un verb mai general, jump reprezintă un tip de mișcare (a sări), alte verbe hop , leap , spring, skip reprezintă tipuri diferite de sărituri și sunt utilizate în diferite contexte.

Antonimia între verbe. Relaţia de opoziţie între verbe este foartă importantă. Ca şi în cazul adjectivelor, există antonime directă (fall-rise) şi cuvintele opuse după sens (fall-ascend). Pe când antonimele sunt marcate, majoritatea relaţiilor de opoziţie nu sunt notate în WordNet, numai cele mai evidente.

Relaţia de cauză include două concepte: cauzativă (CAUSE) şi rezultativă (BACKWARD PRESUPPOSITION). De exemplu, give este cauza lui have, iar have în rîndul său este rezultatul lui give. WordNet conţine relaţii cauzative şi rezultative mai mult între grupuri de cuvinte, decât între cuvinte individuale. Relaţia de cauză este un tip specific de moştenire (includere). Definiția relației date este următoare: dacă V1 este cauză pentru V2, înseamnă că V1 include V2. Includerea de tipul acesta, ca regulă, nu este temporală, adică, cauza şi rezultatul se întâmplă nu în aceiaşi perioadă de timp dar consecutiv. Relația aceasta însă are nuanțe. De exemplu, relația a căuta – a găsi este o relație de cauză, însă a căuta nu rezultă neapărat în a găsi, iar a găsi nu neapărat este rezultatul lui a căuta.

Ca rezultat sunt clasificate patru tipuri de moştenire (includere) care sunt prezentate în figura dată:


Figura 4. Legături semantice între verbele în WordNet.

Sintaxa şi semantica verbelor. Verbele au fost cercetate din punct de vedere al structurilor sintactice care sunt influenţate de semantica lor. De fapt, WordNet nu a fost creat pentru prezentarea informaţiei sintactice dar cercetările au arătat că structurile sintactice au o legătură semnificativă cu semantica lor. Din cauza aceasta autorii WordNet-ului au creat un set de cadre sintactice la care sunt create referințe de la verbele din sinseturi. În urmare sunt prezentate unele exemple de structuri sintactice în formă de propoziții:
102 They %s their earnings this year exemplu: spent

103 Their earnings %s this year exemplu: increased

140 They want to %s the prisoners exemplu: free

141 They want to %s the doors exemplu: shut

142 The doors %s exemplu: close

33 They %s the food to the people exemplu: offer

34 They %s the people the food exemplu: offer

37 The men %s the bookshelves exemplu: repair

137 They %s to move exemplu: agreed

138 They %s moving exemplu: started

Ca rezultat al cercetării verbelor acestea au fost împărţite după sens în 15 fişiere:


  1. Verbs of Bodily Functions and Care

  2. Verbs of Change

  3. Verbs of Communication

  4. Competition Verbs

  5. Consumption Verbs

  6. Contact Verbs

  7. Cognition Verbs

  8. Creation Verbs

  9. Motion Verbs

  10. Emotion or Psych Verbs

  11. Stative Verbs

  12. Perception Verbs

  13. Verbs of Possession

  14. Verbs of Social Interaction

  15. Weather Verbs


Utltizarea WordNet-ului
WordNet a fost criticat pentru faptul că în lexicon este codificată doar o mică parte din totalul informației despre concepte. Informaţia generală despre obiectele descrise nu este prezentată. De exemplu, nu sunt codificate funcțiile obiectelor, mărimea lor, localizarea, și multe alte caracteristici. Toată informația dată prezintă, de fapt, cunoştinţele generale, nu şi cele lingvistice. Autorii WordNet-ului răspund că ei au avut intenția de a crea un dicționar, lexicon şi nu o bază de cunoștințe. Problema este mai globală, fiindcă şi dictionarele explicative nu conţin o mulţime de informaţie despre cuvintele, pe care le descriu. De exemplu, nu se descrie cum arată obiectul definit, ce părţi are, care sunt cuvintele legate de obiectul acesta, care sunt funcţiile lui, care sunt diferite modificări ale obiectului dat.

Însă, trebuie de menționat că din momentul anunțării WordNet a devenit cel mai intens utilizat resurs în domeniul lingvisticii computaționale și procesării limbajului natural. Avantajele lexiconului ce facilitau utilizarea lui sunt:



    • Volumul lui imens; WordNet conține majoritatea cuvintelor limbii engleze, ce permite incadrarea lui în sisteme de analiză a textelor pe scară largă.

    • Accesibilitatea. Din momentul lansării și pînă acum WordNet este accesibil on-line, el poate fi descărcat fără orice plată și fără înregistrare.

    • Simplitatea lui. În pofida criticii relațiilor semantice limitate între cuvinte, anume numărul de relații restrîns permite navigarea ușoară prin sinseturile și prelucrarea cuvintelor utilizînd algoritmi comparativ simple.

Astfel, WordNet este un exemplu de cea mai reușită resursă semantică în domeniul lingvisticii computaționale și prelucrării imbajului natural. Lucrul cu WordNet continuă; în 2006 a fost ansată versiunea 3.0 a bazei de date ce conține 155,287 cuvinte organizate în 117,659 sinseturi.

WordNet este cel mai mult utilizat în dezambiguizarea sensurilor cuvintelor. În rezolvarea problemei date cuvintele din sinseturi se compară cu contextul cuvîntului ambiguu și se alege acest sens (sinset) al cuvîntului care este mai similar cu contextul dat. Problema care apare în cazul dat este granularitatea sensurilor cuvintelor prezentate în WordNet. Pentru rezolvarea problemei date în multe cazuri sensurile similare sunt unite, astfel minimizînd numărul sinseturilor și clarificînd sensurile lor.

Alt domeniu unde este utilizat WordNet este regăsirea informației. În 1998 în baza WordNet-ului a fost creat un program de dezambiguizare a sensurilor cuvintelor. Acest program mai tîrziu a fost intens utilizat în regăsirea informației în combinație cu motoarele de căutare Yahoo, Google, Ask! și altele.

O metodă de utilizare a WordNet-ului care a fost folosită intens este calculul similarității semantice între cuvinte. Similaritatea semantică între două cuvinte se calculează ca distanța măsurată în arcuri grafului ce reprezintă structura arborescentă între substantive. De exemplu, cuvîntul mouse apare în două sinseturi: cu sensul de animal și cu sensul de dispozitiv al calculatorului. Similaritatea între cuvîntul cat și mouse în sensul de animal este mai mare decit similaritatea între același cuvînt cat și sensul cuvîntului mouse ca dispozitiv fiindcă cat și mouse în primul sens sunt holonime cuvîntului animal, pe cînd de la cat ca animal pînă la mouse ca dispozitiv trebuie de parcurs aproape tot arborele.

În baza WordNet-ului au fost create diferite extensii, de exemplu, WordNet Domains – un set de etichete de domenii cu care sunt marcate toate sinseturile ce aparțin domeniului dat. De exemplu, eticheta şcoala marcheaza învățător și elev din subarbore persoana, manuale, note, tabla, creta, clasa și alte obiecte ce sunt din domeniul dat. O parte din WordNet Domains este WordNet-Affect. WordNet-Affect este un set de etichete ce marchează cuvintele care exprimă sentimentele. Etichetele sunt, de exemplu, bucurie, frica, mirare şi altele. Această parte a WordNet-ului este utilizată pentru analiza sentimentelor în text.
SIMPLE
Noţiuni generale
SIMPLE este un proiect global european în cadrul programului Language Engineering Programme şi are drept scop crearea lexicoanelor semantice pentru douăsprezece limbi europene (Catalană, Daneză, Olandeză, Engleză, Finlandeză, Franceză, Germană, Greacă, Italiană, Portugeză, Spaniolă, Suedeză) în baza unui model comun cu codificarea caracteristicilor semantice folosind cadre semantice de subcategorizare.

LE-SIMPLE urmează după proiectul LE-PAROLE (1998). LE-PAROLE avea drept scop crearea setului de resurse armonizate pentru limbile europene. În cadrul proiectului au fost colectate corpusuri reprezentative pentru 15 limbi. Fiecare corpus avea volumul cel puţin 20 milioane de cuvinte şi conţinea diferite tipuri de texte. Corpusuri au fost codificate şi marcate în corespondenţă cu stadardul adoptat CES (Corpus Encoding Standard). O parte din fiecare corpus (în jur de 250 000 cuvinte) este marcată cu informaţia morfo-sintactică. Paralel cu crearea corpusurilor au fost create lexicoanele limbilor date. Lexicoanele au fost parţial extrase din corpus şi conţin fiecare cel puţin 20 000 unităţi. Fiecare unitate a lexicoanlor a fost descrisă foarte detaliat. Descrierea unităţii lexiconului include informaţia morfologică şi sintactică. Mai detaliat, informația morfologică include: forma scrisă a cuvîntului, toate formele flexionare a lui, partea de vorbire și caracteristicile respective părții date de vorbire, derivările posibile ale cuvîntului dat și altă informație morfologică. Informația sintactică include: relații gramaticale posibile ale cuvîntului dat cu alte cuvinte, cadre sintactice respective, diateza și alternările lexicale, pronominalizarea cuvîntului dat, restricții sintactice, expresii idiomatice cu cuvîntul dat și altă informație ce se referă la legături sintactice ale cuvîntului dat. Codificarea lexicoanelor este total unoformă şi corespunde standardelor EAGLES. Instrumentul utilizat pentru codificarea informaţiei în resursele create este limbajul de marcare XML. Toate resursele create şi în special lexicoanele au fost create luînd în vedere crearea ulterioară a legăturilor între unităţile lexicoanelor şi elaborarea unei surse multilingve.

SIMPLE este prevăzut ca etapa următoare după proiectul LE-PAROLE, proiectul acesta crează resurse semantice în baza resurselor create de LE-PAROLE. În același mod uniform pentru toate limbile încadrate în proiect sunt create descrieri semantice ale unităților lexicoanelor. Mai mult de 10 000 de cuvinte din lexicoanele date sunt dotate cu descrieri semantice. O atenței deosebită este atrasă substantivelor, verbelor și adjectivelor pentru care au fost codificate următoarele caracteristici semantice: tipul semantic, domeniul și conceptul ontologiei la care este conectat cuvîntul dat, cadrul sintactico-semantic în cadrul propoziției, tipuri semantice ale elementelor cadrului (opțional).

Una din condițiile de bază pentru crearea resurselor semantice ale limbilor participante este uniformitatea formatelor datelor codificate. Lexicoanele semantice sunt create luând în vedere legăturile între limbile date, şi anume, unitățile lor sunt conectate la o ontlolgie unică fundamentală şi un set comun de cadre semantice. Conceptele de bază identificate în EuroWordNet (în jur de 800 sensuri ontologiei de vârf) au fost folosite pentru crearea ontologiei comune. Lexicon pentru fiecare limbă a fost creat independent, insă informația semantică a fost descrisă strict conform standardului unic adoptat în cadrul proiectului. Legăturile între lexicoanele create sunt efectuate prin intermediu conceptelor ontologiei comune dezvoltate în baza WordNet-ului englez și parțial în baza ontologiei create în cadrul proiectului EuroWordNet. Setul conceptelor de bază prin care este realizată legătura între lexicoanele create este numit InterLingualIndex (ILI).

În calitate de bază teoretică pentru descrierea informației semantice în cadrul unităților lexiconului este luată și adaptată teoria lexiconului generativ a lui James Pustejovsky. Îndeosebi, unitățile lexiconului sunt descrise semantic în baza setului de caracteristici semantice extrase din Qualia Structure, ce este o parte importantă a teoriei lui Pustejovsky.


Yüklə 371,54 Kb.

Dostları ilə paylaş:
1   2   3   4   5




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin