Facultatea de Științe Economice și Gestiunea Afacerilor



Yüklə 26,69 Kb.
tarix22.01.2018
ölçüsü26,69 Kb.

Facultatea de Științe Economice și Gestiunea Afacerilor

Str. Teodor Mihali nr. 58-60

Cluj-Napoca, RO-400951

Tel.: 0264-41.86.52-5

Fax: 0264-41.25.70

econ@econ.ubbcluj.ro

www.econ.ubbcluj.ro


Universitatea Babeş-Bolyai

Departamentul

Informatică Economică

Îmbogăţirea semantică a grafurilor Linked Data cu cunoştinţe reprezentate prin modele diagramatice cu specific de domeniu


- Rezumatul tezei de abilitare -
Candidat:

Robert Andrei BUCHMANN



Cluj Napoca

2016

Abstract

Un facilitator esenţial al paradigmei Linked Data (Äuer et al., 2014) (Heath şi Bizer, 2011) este posibilitatea de a extrage grafuri de date din sistemele moştenite, cu ajutorul unei game variate de adaptoare şi convertoare RDF – spre exemplu: D2RQ pentru baze de date relaţionale (D2RQ, 2015), XLWrap pentru foi de calcul Excel (Langegger şi Wöß, 2009). Astfel de abordări ţintesc spre eliminarea "frontierelor" dintre depozitele de date ale întreprinderilor, deschizându-le spre dezideratul de conectare inter-organizaţională şi interogare federativă, în vederea consolidării unor reţele de date distribuite, un "Web al datelor" grefat peste actualul "Web al documentelor".

O sursă insuficient exploatată în acest sens este structura inerentă de graf a modelelor conceptuale diagramatice - o categorie de cunoştinţe structurate care pot îmbogăţi grafurile Linked Data cu o semantică mai bogată decât ceea ce se poate extrage din, spre exemplu, structura unor tabele, în special atunci când modelele sunt create cu un limbaj de modelare vizuală ce a fost proiectat pentru un anume specific de domeniu în mod agil, raportat la cerinţe de modelare concrete. Prezenta teză propune această abordare în ce priveşte îmbogăţirea Linked Data, şi în acest scop prezintă fundamentele teoretice, deciziile de proiectare şi aplicabilitatea (atât existentă cât şi vizionară) unui convertor de modele diagramatice în RDF, dezvoltat în scop demonstrativ pentru mediul de metamodelare ADOxx (BOC, 2015a), dar adaptabil şi pentru alte platforme, datorită unor caracteristici legate de de flexibilitate şi multi-abstractizare semantică. Argumentaţia acestei teze este generalizată dincolo de contextul implementării iniţiale, conducând spre propunerea unei viziuni inovatoare: sistemele informatice model-aware, senzitive la informaţie descrisă prin modele conceptuale diagramatice.

Progresul recent în ingineria sistemelor informatice a scos la lumină o distincţie importantă între sistemele data-aware, senzitive la structura unei baze de date, şi sistemele process-aware, senzitive la descrieri ale unor proceduri de lucru (van der Aalst, 2009). Sistemele de al doilea tip sunt menite să suporte executarea de procese de lucru în acord cu cunoştinţe (de natură procedurală) prescrise şi exprimate în formă diagramatică, ca modele de procese. Caracteristica distinctivă între cele două generaţii de sisteme informatice este tipul de model conceptual care guvernează execuţia sistemului: (i) sistemele data-aware se bazează pe schema unei baze de date, care de regulă e implementarea unui model entitate-relaţie; (ii) sistemele process-aware se bazează pe modele ale unor procese de lucru/de afaceri serializate într-un format procesabil de către maşini, de tip XML - spre exemplu: BPEL (OASIS, 2015) sau XPDL (WfMC, 2015). Teza de faţă subsumează ambele clase de sisteme unei categorii aici propuse de sisteme model-aware, şi în acest scop apelează la framework-ul "Agile Modelling Method Engineering" (Karagiannis, 2015) ca metodologie de dezvoltare a unor limbaje şi instrumente de modelare ghidate de cerinţe de modelare cu specific de domeniu. Aceste cerinţe provin de regulă din două surse: (i) direct din nevoi design-time legate de utilizarea limbajului de modelare solicitat (spre exemplu, cerinţe de suport decizional ori de simulare bazată pe modele), respectiv (ii) propagate indirect din cerinţe pentru sisteme run-time care într-un fel sau altul sunt influenţate de informaţia descrisă prin modele (Buchmann et al., 2013) (Buchmann şi Karagiannis, 2015b).

Structura de graf care se poate identifica în mod recurent la modelele diagramatice, dar şi în metamodelele ce le guvernează, poate fi expusă în forma unui complement semantic care astfel va extinde datele back-end consumate de un sistem informatic în timpul execuţiei. În consecinţă, funcţionalitatea sistemului poate deveni senzitivă la diagrame de tipuri arbitrare, create cu limbaje de modelare proiectate pentru un domeniu specific (favorizând astfel familiaritatea şi specificitatea în detrimentul reutilizabilităţii între domenii diferite, spre deosebire de cazul limbajelor de modelare cu adresabilitate generică precum UML). Instrumentarul tehnologic adoptat în această lucrare pentru a canaliza cunoştinţele exprimate în formă diagramatică aparţin paradigmei Linked Data: e vorba de standardele pentru reprezentarea datelor conectate - RDF (W3C, 2015c) şi pentru accesarea acestora – interogări SPARQL (W3C, 2015a), protocoale precum Graph Store (W3C, 2015b).

Valoarea propunerii nu e neapărat legată de limbaje de modelare standard (convertoare RDF ale unor tipuri de diagrame UML sunt disponibile de mai multă vreme (TopQuadrant, 2015)). Mai degrabă, valoarea propusă derivă din limbaje de modelare cu care se exprimă semantică cu specific de domeniu, relevantă într-un context de aplicare limitat (într-o singură întreprindere, într-un anumit tip de scenariu etc.). Astfel de limbaje satisfac în mod agil cerinţe de modelare focalizate pe scenarii specifice, după cum se va arăta în teză – pe de o parte printr-un exemplu demonstrativ teoretic şi concis care să faciliteze înţelegerea, pe de altă parte prin câteva exemple derivate dintr-un proiect de cercetare europeană în care autorul a aplicat şi rafinat contribuţia prezentei teze.

Pentru a atinge obiectivele, teza de faţă foloseşte fundamente din disciplina metamodelării, unde simbolurile grafice folosite în diagrame trebuie ancorate în abstracţiuni procesabile de către maşini (metamodele şi meta-metamodele). În mod uzual, metamodelarea lucrează cu o separaţie rigidă între diferite straturi de abstractizare: modele, metamodele şi meta-metamodele, vezi şi arhitectura MetaObject Facility pe care se bazează UML (OMG, 2015). Framework-ul pentru descrierea resurselor (RDF) este adoptat în lucrarea de faţă pentru a capta informaţia de pe toate straturile de abstractizare menţionate într-o reprezentare uniformă, ce poate fi interogată în mod uniform, conducând spre un potenţial "Web al datelor şi modelelor" ce oferă o bogăţie semantică semnificativă chiar în absenţa ontologiilor. Pentru a stimula emergenţa unei comunităţi de cercetare în acest sens, o serie de cazuri de utilizare vizionare sunt aici discutate: conectarea între modele şi date, conectarea între modele de diferite tipuri, transformarea de modele prin rescriere de grafuri, extinderea vocabularelor Linked Data cu informaţie din modele.

Teza prezintă contribuţii ştiinţifice dezvoltate de candidat pe parcursul ultimilor 5 ani, perioadă în care interesele sale s-au concentrat pe interoperabilitatea între paradigma Semantic Web şi cea a modelării conceptuale, pe terenul de aplicare al sistemelor informatice semantice pentru întreprinderi. Această preocupare a fost iniţiată după obţinerea titlului de doctor, pe parcursul a două proiecte de cercetare CNCSIS câştigate prin competiţie naţională, fiind apoi consolidată prin participarea pe în proiectul european de cercetare FP7 ComVantage (ComVantage, 2015) (OMILab, 2015), în calitate cercetător la Universitatea Viena.

Teza de doctorat a candidatului a fost realizată în domeniul interoperabilităţii sintactice şi a potenţialului oferit în acest sens de tehnologiile XML, la începutul anilor 2000. Preocupările post-doctorale au evoluat natural spre următorul nivel, al interoperabilităţii semantice şi a potenţialului oferit de spaţiul tehnologic numit Semantic Web. La acestea se adaugă experienţa în metamodelare dobândită în timpul stagiului de cercetare de la Universitatea Viena (în grupul de cercetare Knowledge Engineering), care a inspirat îmbinarea interesului pentru Semantic Web cu facilitatorii conceptuali şi tehnologici oferiţi de disciplina metamodelării, rezultatele convergând în final în lucrarea de faţă.

Această teză este construită pe baza publicaţiilor autorului, anumite părţi ale sale fiind diseminate de candidat la evenimente prestigioase şi în contextul unor proiecte de cercetare ce au oferit cazuri de utilizare relevante evaluării contribuţiei. Principalele publicaţii ce diseminează contribuţia acestei teze sunt:

Primele idei ale autorului în direcţia semantizării sistemelor moştenite a fost publicată la prestigioasa conferinţă BIS (Buchmann et al. 2011) şi extinse pentru publicare în revistă, în contextul unui scenariu pentru e-guvernare (Buchmann şi Meza, 2012). Dezideratul semantizării a fost apoi transferat spre propunerea tezei de faţă de a converti informaţia din diagrame grafice în RDF - în primă fază ca o propunere conceptuală publicată în (Buchmann şi Karagiannis, 2013), apoi aplicată pentru domeniul specific al mentenanţei mobile într-o publicaţie prezentată la prestigioasa conferinţă HICSS în Hawaii, SUA (Buchmann, 2014). Detaliile formale şi evaluări bazate pe cazuri de utilizare au fost publicate în reviste ISI cu factor de impact: revista "Requirements Engineering" – un articol concentrat pe aplicarea propunerii în proiectul de cercetare ComVantage (Buchmann şi Karagiannis, 2015c) - respectiv revista "Information Systems" – un articol concentrat pe formalizarea propunerii prin hipergrafuri şi specularea oportunităţilor deschise de o potenţială paradigmă Linked Open Models (Karagiannis şi Buchmann, 2016). Alte aspecte cheie, legate de şabloanele de transformare a diagramelor, au fost prezentate în Singapore la KES 2015 (Buchmann şi Karagiannis, 2015a). Propunerea a fost promovată şi la conferinţe de metamodelare orientate spre practicieni, spre exemplu PoEM 2015 (Buchmann şi Karagiannis, 2015b).

Contribuţia are valoare globală dincolo de obiectivele proiectelor de cercetare în care a fost dezvoltată şi dincolo de cazurile de utilizare ce sunt detaliate în această teză. Gradul de generalitate şi extrapolări privind posibile extensii ale contribuţiei sunt discutate în teză în mod punctual, în legătură cu unele oportunităţi vizionare de dezvoltare. Rezultatele îmbogăţesc paradigma Linked Data şi paradigma modelării conceptuale propunând o punte pragmatică între Web-ul datelor şi cunoştinţele externalizate în formă grafică cu ajutorul instrumentelor de modelare pentru întreprinderi. Direcţiile şi oportunităţile viitoare de dezvoltare includ interoperabilitatea între ontologii şi metamodele, respectiv modelarea ontologiilor formale cu instrumente de modelare diagramatică cu specific de domeniu şi înaltă utilizabilitate. În acest sens, autorul speră că această teză şi publicaţiile pe care se bazează vor inspira comunitatea ştiinţifică înspre consolidarea unui "Web al modelelor diagramatice" care să îmbogăţească la nivel semantic acel "Web al datelor distribuite" promovat în ultimii ani prin paradigma Linked Data.



Bibliografie selectivă (referită în rezumat)

*** (2015) D2RQ – official website. http://d2rq.org. Accesat 1 Oct 2015

Äuer S, Bryl V, Tramp S (eds.) (2014) Linked Open Data – Creating Knowledge Out of Interlinked Data. Springer, Heidelberg

BOC GmbH (2015a). ADOxx – official website. https://www.adoxx.org/live/home. Accesat 1 Oct 2015



Buchmann R A (2014) Conceptual modeling for mobile maintenance: The ComVantage Case. In Sprague R (ed.) Proceedings of the 47th Hawaii International Conference on Systems Sciences (HICSS 2014), Hawaii, USA, IEEE, p 3390-3399

Buchmann R A, Karagiannis D (2015a) Pattern-based Transformation of Diagrammatic Conceptual Models for Semantic Enrichment in the Web of Data. In: Ding L, Pang C, Kew L M, Jain L C, Howlett R J (eds.), Proceedings of the 19th Conf. on Knowledge-Based and Intelligent Information & Engineering Systems (KES 2015), Singapore, Procedia Computer Science 60, Elsevier, p 150-159

Buchmann R A, Karagiannis D (2015b) Agile Modelling Method Engineering: Lessons Learned in the ComVantage Project. In: Ralyte J, Espana S, Pastor O (eds.) Proceedings of the 8th IFIP WG 8.1 Conf. on the Practice of Enterprise Modelling (PoEM 2015), Valencia, Spain, LNBIP 235, Springer, p 356-373

Buchmann R A, Karagiannis D (2015c): Modelling Mobile App Requirements for Semantic Traceability, J. Requirements Eng, DOI 10.1007/s00766-015-0235-1, Springer.

Buchmann R A, Karagiannis D, Visic N (2013) Requirements definition for domain specific modelling languages: the Comvantage case. In Kobylinski A, Sobczak A (eds.) Proceedings of the 12th Int. Conf. on Business Informatics Research (BIR 2013), Warszaw, Poland, Springer, p 19-33

Buchmann R A, Meza R (2012) Towards the Semantic e-Government. Transylvanian Review of Administrative Sciences 35E, 33-47

Buchmann R A, Meza R, Pulcher D (2011) An Approach to the Semantization of ERP Systems. In: Abramowicz W. (ed.) Proceedings of the 14th Int. Conf. on Business Information Systems (BIS 2011), Poznan, Poland, LNBIP 87, Springer, p. 218-229

Buchmann R, Karagiannis D (2013) Modelling Collaborative-Driven Supply Chains: The ComVantage Method. In: Bakhtadze N, Chernyshov K, Dolgui A, Lototsky V (eds.) Proceedings of the IFAC Symposium on Manufacturing Modelling, Management, and Control (MIM 2013), St. Petersburg, Russia, vol. 7, part 1, Elsevier, p. 567-572

ComVantage Consortium (2015) Project public deliverables, http://www.comvantage.eu/results-publications/public-deriverables. Accesat 1 Oct 2015

Heath T, Bizer C (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Morgan & Claypool, San Rafael, USA

Karagiannis D (2015) Agile Modeling Method Engineering. In: Proceedings the 19th Panhellenic Conf. on Informatics (PCI 2015), Athens, Greece, ACM, p. 5-10

Karagiannis D, Buchmann R A (2016) Linked Open Models: Extending Linked Open Data with Conceptual Model Information. Information Systems 56, 174-197

Langegger A, Wöß W (2009) XLWrap – Querying and Integrating Arbitrary Spreadsheets with SPARQL, In: Bernstein A, Karger D R, Heath T, Feigenbaum L, Maynard D, Motta E, Thirunarayan K (eds.), Proceedings of the 8th Int. Semantic Web Conf. (ISWC 2009) Washington DC, USA, LNCS 5823, Springer, p 359-374

OASIS (2015) BPEL - the official website. https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=wsbpel. Accesat 1 Oct 2015

OMG (2015) The UML Resource Page. http://www.uml.org. Accesat 1 Oct 2015

OMILab – the Open Model Initiative Laboratory (2015) ComVantage modelling prototype and resources, http://www.omilab.org/web/comvantage/home. Accesat 1 Oct 2015

TopQuadrant (2015) TopBraid Composer – official website. http://www.topquadrant.com/tools/ide-topbraid-composer-maestro-edition/. Accesat 1 Oct 2015

van der Aalst W M P (2009) Process-aware informations systems: lessons to be learned from process mining. In: Jensen L, van der Aalst W M P (eds.) Transactions on Petri Nets and Other Models of Concurrency II, LNCS 5460, Springer, p.1-26

W3C (2015a) The SPARQL Query Language specification. http://www.w3.org/TR/sparql11-query/. Accesat 1 Oct 2015

W3C (2015b) The SPARQL Graph Store HTTP Protocol specification. http://www.w3.org/TR/sparql11-http-rdf-update. Accesat 1 Oct 2015

W3C (2015c) RDF 1.1 Concepts and Abstract Syntax, http://www.w3.org/TR/rdf11-concepts. Accesat 1 Oct 2015



WfMC (2015) XPDL - the official website. http://www.xpdl.org. Accesat 1 Oct 2015

Yüklə 26,69 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2020
rəhbərliyinə müraciət

    Ana səhifə