Introducere în subiectul datelor deschise (open data) suport de curs


Publicarea seturilor de date prin intermediul unui API online



Yüklə 160,46 Kb.
səhifə2/3
tarix03.04.2018
ölçüsü160,46 Kb.
#46357
1   2   3

3.2. Publicarea seturilor de date prin intermediul unui API online
Publicarea datelor se poate face și prin intermediul unui API (Application Programming Interface) online.
Pentru instituțiile/organizațiile care pun la dispoziție seturi de date prin intermediul unui API online, beneficiul este că pot furniza întotdeauna cele mai recente date utilizatorilor, în unele cazuri chiar în timp real. Dezavantajul este că furnizarea acestui serviciu de API online înseamnă costuri materiale și necesită expertiză tehnică mai avansată decât furnizarea unor fișiere care conțin seturi de date.
Pentru utilizatori care sunt și dezvoltatori de software această alternativă poate fi foarte convenabilă pentru că datele folosite sunt totdeauna cele mai recente. Pe de altă parte, publicarea datelor doar prin intermediul unui API online nu este suficientă din punct de vedere al accesului en-gros la date. De exemplu, dacă un utilizator ar dori să analizeze întregul set de date, acesta ar trebui să folosească un instrument software pentru a descărca întregul set de date, instrument care s-ar putea să nu existe, fie să creeze acest instrument, ceea ce nu este întotdeauna fezabil ținând cont ca dezvoltatorii de software sunt doar un subset al întregii mulțimi de utilizatori al unui set de date. Din aceste motive, instituțiile/organizațiile care pun la dispoziție seturi de date prin intermediul unui API online o fac ca un serviciu suplimentar publicării seturilor de date folosind fișiere.
Un exemplu autohton de instituție care oferă accesul deschis la date prin intermediul unui API este Ministerul Justiției30, care oferă astfel acces la datele despre dosare, părți și ședințe de judecată.


  1. Politici și legislație de la nivel european și în România

Pentru a avea o privire de ansamblu la nivel european iar apoi la nivelul României, trebuie înțeleasă evoluția graduală de la Informațiile din Sectorul Public la Datele Deschise. Europa a pornit pe drumul valorificării informațiilor produse de instituțiile sale și cele publice ale statelor membre odată cu deschiderea pe care a oferit-o strategia pe zece ani a Uniunii Europene Europa 2020. Multe dintre recomandările actuale privind accesul și reutilizarea informațiilor din sectorul public, pot fi identificate chiar și într-o recomandare a Organizației pentru Cooperare și Dezvoltare Economică (OECD) în aprilie 2008 (http://www.oecd.org/dataoecd/41/52/44384673.pdf).


În primăvara anului 2010, este lansată Strategia pe 10 ani a Uniunii Europene: „Europa 2020”. Una dintre cele șapte inițiative-pilot ale Strategiei Europa 2020 este Agenda digitală pentru Europa iar mai târziu, în toamna aceluiași an, doamna Vicepreședinte a Comisiei Europene Neelie Kroes „spunea DA datelor deschise” (în contextul îndemnului pentru reutilizarea informațiilor din sectorul public). Un cadru firesc de evoluție l-a constituit Agenda Digitală pentru Europa.
Agenda Digitală pentru Europa este documentul care deschide cel mai mult subiectul datelor deschise cu o puternică focalizare pe generarea de valoare prin reutilizarea unor date specifice produse de administrațiile publice, date rezultate din proiecte de cercetare finanțate din buget, cărți în format digital existente în biblioteci și care se află dincolo de perioada de protecție a drepturilor de autor, etc.
„Datele Deschise se referă la ideea că anumite date ar trebui să fie liber disponibile pentru utilizare și reutilizare.” (Agenda Digitală pentru Europa, http://ec.europa.eu/digital-agenda/public-sector-information-raw-data-new-services-and-products).
Ce reprezintă datele deschise pentru CE?
„[...] informații geografice, statistici, date meteorologice, date provenind de la proiectele de cercetare finanțate public și cărțile digitizate din biblioteci". O altă reprezentare poate fi oferită ca și valoare calculată a beneficiilor: „câștigurile economice totale din deschiderea acestei resurse ar putea urca până la 40 de milioane de euro în UE.” spune „Open data: An engine for innovation, growth and transparent governance”31.
Un alt moment important pentru politicile europene privind Datele Deschise este Carta pentru Date Deschise a grupului G8 (18 iunie, 2013), care afirm că „întreaga lume asistă la creșterea unei mișcări globale mijlocită de tehnologie, de media socială fiind alimentată de informație [...] datele deschise stau în inima acestei mișcări globale”.
Principiile mari pentru care documentul militează sunt:


  • Date Deschise prin definiție,

  • Calitate și cantitate,

  • Utilizabile de toată lumea,

  • Difuzare de date pentru o mai bună guvernare,

  • Difuzare de date pentru inovare

Principiul 1 recunoaște faptul că ceea ce se înțelege prin „date guvernamentale” are o percepție foarte largă, dar sunt emise de organismele administrative și guvernamentale. Un accent este pus pe recunoașterea aspectelor ce țin de proprietate intelectuală cât și de informațiile cu un caracter special, recunoscându-se faptul că nu toate datele pot fi publicate.


Principiul a doilea recunoaște bogăția „informațiilor” care pot face interesul cetățenilor, dar și nevoia de timp pentru a pregăti date de înaltă calitate. Angajamentul G8 dincolo de aspectele privind publicarea datelor, introduce aspectele care privesc descrierea datelor, procesarea acestora, cât și momentul de publicare care să permită un feedback, care, la rândul său să conducă la revizuiri.

Al treilea principiu spune că datele vor fi puse la dispoziția celor interesați fără taxe și fără impedimente administrative sau de natură birocratică. Acesta este și punctul în care se menționează faptul că datele vor fi puse la dispoziție în formate deschise.


Principiul patru are în vedere asigurarea transparenței privind colecțiile de date, standardele și procesele de publicare prin documentarea acestora online.

Cel de-al cincilea principiu implică o zonă de educație în ceea ce privește datele deschise urmată de încurajarea celor care doresc exploatarea. Aici apare mențiunea că pentru cei care doresc inovarea domeniului, datele vor fi puse la dispoziție și în formate citibile de mașină.


Directiva 98 din 2003 este primul text cu valoare juridică care adresează problematica exploatării informațiilor din sectorul public țintind să „stabilească un set minim de reguli care să guverneze reutilizarea”.
În motivație, textul Directivei aduce în discuție potențialele beneficii pe care le-ar aduce valorificarea informațiilor din sectorul public dacă ar exista o „minimă armonizare a regulilor la nivel național și a practicilor privind reutilizarea”. Ținta vizată „stabilirea un set minim de reguli care să guverneze reutilizarea”.
Tot acest act definește ce este un „document” - „orice reprezentare a unor acte, fapte sau informații și orice compilație ale acestora” „indiferent de mediul de stocare” „în orice format sau limbă”. Sunt menționate și regulile minime privind taxarea și sunt menționate chiar și instituțiile a căror documente nu intră sub incidența acestei directive. O parte dintre aspectele menționate au fost modificate ulterior prin noua Directivă din 2013.
În Articolul 2, aliniatul 2 este definit documentul însuși.
„Prin «document» se înțelege:

(a) orice conținut indiferent de mediu (scris pe hârtie sau stocat în format electronic sau ca fonograme, înregistrare vizuală sau audio-vizuală);

(b) oricare parte a acestui conținut”
Decizia Comisiei Europene din 12 decembrie 2011 privind reutilizarea documentelor Comisiei 2011/833/EU

„Decizia determină condițiile privind reutilizarea documentelor deținute de Comisie sau de Oficiul pentru Publicații al Uniunii Europene în numele său cu scopul de a înlesni o mai largă reutilizare a informației [...]”.

Comisia Europeană face un pas suplimentar propunând construcția unui „portal de date ca un unic punct de acces la documentele disponibile pentru reutilizare”. Acesta va conține și documentele disponibile produse de Joint Research Centre. Acestă Decizie o înlocuiește pe cea privind Euratom: 291 din 2006.

În Articolul 3, aliniatul 1 este oferită o definire a documentului identică cu cea existentă în Directiva 98 din 2003.

„Prin «document» se înțelege:

(a) orice conținut indiferent de mediu (scris pe hârtie sau stocat în format electronic sau ca fonograme, înregistrare vizuală sau audio-vizuală);

(b) oricare parte a acestui conținut”.

Aportul important al deciziei este stabilirea unei terminologii necesare creării premizelor pentru un adevărat portal de date european. Astfel, rând pe rând sunt introduși termenii de „prelucrare automată” (machine readable), „date structurate” (structured data) și portal. Această nouă terminologie a fost utilizată și în modificarea Directivei 98 cu 37 din 2013 - vezi articolul 5. Tot acest document introduce și un concept nou și important: licențierea deschisă prin definirea unei „licențe deschise”.


Directiva 2013/37/UE pentru modificarea Directivei 2003/98/EC privind reutilizarea informațiilor din sectorul public
Documentul:

  • Propune un număr minim de reguli pentru a pune la dispoziție informația produsă de instituțiile publice și agențiile guvernamentale.

  • Specifică drepturile persoanelor fizice și juridice privitor la reutilizare.

  • Recomandă distribuirea prin mijloace electronice.

Directiva a intrat în vigoare la 31 decembrie 2003 și se focalizează pe reutilizarea informației. Până în 2008 Statele Membre au raportat implementarea în propriile sisteme legislative a obligațiilor pe care Directiva le prevede.


Revizuirea Directivei în 2013 are ca scop direct stimularea utilizării Informațiilor din Sectorul Public în procesele de business și într-o manieră unitară la nivelul pieței comunitare.

Unul dintre cele mai spinoase aspecte în ceea ce privește reutilizarea îl constituie licențierea seturilor de date. Este de menționat faptul că articolul 8 permite statelor membre să-și aleagă PSI-urile care să poată fi puse la dispoziție fără nicio condiție, fie că se află în Domeniul Public, fie că sunt exceptate de la aplicarea drepturilor de autor.


Un aspect important ține de monitorizare. Articolul 13, paragraful 2: „o dată la trei ani, statele membre prezintă Comisiei un raport privind informațiile din sectorul public disponibile în vederea reutilizării, condițiile în care sunt puse la dispoziție respectivele informații și practicile în materie de căi de atac. Pe baza respectivului raport, care se face public, statele membre întreprind o revizuire a punerii în aplicare a articolului 6, în special în ceea ce privește impunerea de taxe superioare costului marginal”.

Există o pagină dedicată implementării directivei în statele memebre accesibilă la https://ec.europa.eu/digital-agenda/en/implementation-public-sector-information-directive-member-states. Pentru a vedea mai clar situația la nivel european, proiectul ePSIplatform a elaborat o tabelă comparativă prin care a agregat indicatori privind adoptarea datelor deschise și a Informațiilor din Sectorul Public la nivel european (http://www.epsiplatform.eu/content/european-psi-scoreboard).


Există șapte aspecte pe baza cărora s-a făcut evaluarea reutilizării informațiilor din sectorul public: implementarea Directivei; practică de reutilizare; formats; taxare; aranjamente de exclusivitate; informații din sectorul public local; evenimente și activități. O țară poate acumula 100 de puncte pentru fiecare dintre aceste aspecte dintr-un total de 700. Considerând aceste informații România se poziționează pe undeva pe la mijloc:




Comunicarea „Orientări privind licențele standard recomandate, seturile de date și taxarea reutilizării documentelor” apărută în iulie 2014 se constituie ca un adevărat ghid în ceea ce privește implementarea Directivei PSI 37 din 2013.
Este important de menționat faptul că „directiva nu se aplică documentelor asupra cărora părți terțe dețin drepturi de proprietate intelectuală” și „nu impune utilizarea licențelor formale”. Este menționat faptul că se pot elabora licențe naționale dacă este necesar, preferată fiind totuși utilizarea unei licențe global acceptată cum este CCO versiunea 4.0. Sunt menționate chiar seturile de date care prezintă importanță:


Categorie

Exemple seturi de date

Date geospațiale

Coduri poștale, hărți naționale și regionale (planuri cadastrale, hărți topografice, marine, ale frontierelor administrative etc.)

Observarea Pământului și mediu

Date spațiale și in situ (monitorizarea condițiilor meteorologice, a calității terenurilor și a apei, a consumului de energie, a nivelurilor emisiilor etc.)

Date privind transporturile

Orarele transportului public (toate modurile de transport) la nivel național, regional și local, informații privind lucrările rutiere, traficul etc.

Statistici

Date statistice naționale, regionale și locale, însoțite de principalii indicatori demografici și economici (PIB, vârstă, stare de sănătate, nivelul șomajului, venituri, educație etc.)

Întreprinderi

Registrul comerțului și registrul întreprinderilor (listele întreprinderilor înregistrate, informații privind forma de proprietate și modul de gestionare, identificatorii înregistrării, bilanțuri financiare etc.)

Documentul orientează și în ceea ce privește felul în care ar trebui publicate seturile de date cu un accent pe formatul de date deschise (acestea sunt specificate clar), pe metadate, fiind menționate și câteva repere privind vocabularele iar acolo unde este posibil cei care gestionează seturile de date sunt îndemnați să expună public o interfață de programare a aplicațiilor - API.


O altă perspectivă asupra depozitelor de date de această dată ne este oferită de http://datacatalogs.org/ - o listă completă a cataloagelor de date deschise din întreaga lume.


Încă un detaliu important angajat de textul document este cel legat de costuri care pot fi considerate a fi eligibile. Există trei categorii de costuri: întocmirea datelor, distribuția datelor și vânzarea și promovarea sau furnizarea de servicii cu valoare adăugate. Aceste categorii de costuri sunt comparate cu ceea ce directiva înțelege a fi costuri marginale. Concluzia este să singurul cost care se apropie de costul marginal este cel care privește larga distribuție a seturilor de date.
Directiva a fost transpusă și în sistemul legislativ românesc prin adoptarea Legii 109 privind reutilizarea informaţiilor din instituţiile publice din 25 aprilie 2007 care a fost modificată prin Legea nr. 213 din 24 octombrie 2008. Legea transpune Directiva nr. 98 din 2003 privind reutilizarea informațiilor din sectorul public, publicată în Jurnalul Oficial al Uniunii Europene nr. L345/31 decembrie 2003.

Legea definește termenii (instituție publică, document, reutilizare, scop comercial, terț) și stabilește termele la care instituțiile trebuie să răspundă solicitanților. Ceea ce legea revizuită spune privind modul de organizare administrativ este că trebuie să existe un departament „desemnat”, care să fie calificat în a răspunde celor interesați iar acesta nu sunt obligate să facă eforturi suplimentare pentru a rezolva cererea. Documentele (iar aici merită subliniat termenul folosit de legiuitor, nefiind menționate datele) „sunt puse la dispoziția solicitantului în forma deținută”.

Instituțiile publice pot acorda drepturi de exclusivitate (vor fi public afișate - transparență) „numai dacă un astfel de drept este necesar desfășurării unui serviciu public”, dar cu re-examinarea periodică a acestora cel puțin o dată la trei ani.
Nu putem vorbi despre accesul liber la informații și în special la cel provenite din instituțiile publice fără a supune atenției și Legea 544 din 2001 privind liberul acces la informațiile de interes public. Această lege este instrumentul prin care este reglementat „accesul liber și neîngrădit la orice informații de interes public”.

Ca și în cazul legii 109, sarcinile privind aplicarea legii cad în activitatea compartimentului de informare și relații publice și la fel legiuitorul se referă la documente, nu explicit la date. Este de reținut că prin această lege încă din 2011 avem un principiu fundamental: „accesul liber și neîngrădit”. Legiuitorul pune accentul pe documente și nu pe informațiile pe care acestea le conțin.


Un alt document care are o importanță deosebită pentru evoluția practicilor privind datele deschise este Hotărârea nr. 215 din 20 martie 2012 privind Strategia Națională Anticorupție.

Acesta este un document cu adevărat important pentru promovarea Datelor Deschise și alinierea la Inițiativa Parteneriat pentru o Guvernare Deschisă (lansat oficial în 2011) este Strategia Națională Anticorupție. Obiectivul specific 2 face parte din setul de „măsuri specifice pentru creșterea gradului de integritate și transparență în domenii/sectoare prioritare” și vizează „creșterea transparenței instituționale prin sporirea gradului de disponibilitate a datelor publice deschise (open data) puse la dispoziție de către autoritățile publice”. România este semnatară din 2012 a Parteneriatului. Parte a eforturilor de împlinire a angajamentelor o constituie și măsurile privind creșterea transparenței. Documentul Strategiei Naționale Anticorupție este și cel care include definirea datelor publice deschise întărind prevederile Legii 109.

În Raportul Anual privind stadiul implementării Strategiei Naționale Anticorupție 2012 - 201532 datele deschise sunt prezentate prin prisma eforturilor depuse de Departamentul pentru Servicii Online și Design, în cadrul Cancelariei Primului ministru. „Această structură a preluat coordonarea implementării angajamentelor asumate de România în cadrul Parteneriatului pentru o Guvernare Deschisă”. Merită menționat cel mai vizibil serviciu: data.gov.ro, un portal dedicat seturilor de date adunate din administrație.
Pentru a extinde și mai mult sfera de cercetare este necesară prezentarea unor proiecte europene care prin studii au lămurit mai multe aspecte pe care accesul, reutilizarea și valorificarea datelor deschise pe care le expune.
Open Data Support este un proiect al DG Connect al Comisiei Europene menit să îmbunătățească vizibilitatea și ușurința în accesarea seturilor de date publicate în portalurile de date deschise de la nivel local și național pentru a mări gradul de reutilizare în interiorul și în afara granițelor. Open Data Support este o inițiativă pan-europeană care îi are în vedere pe cei care publică date și care sunt avansați, dar și celor care abia încep.
Open Data Support este finanțat prin SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Contract No. 30-CE-0530965/00-17).
Open Data Support oferă:


  • Date și modalități de pregătire a metadatelor; servicii de editare și publicare

  • Servicii de instruire în zona datelor deschise (interconectare)

  • Servicii de consultanță pentru servicii și pentru IT

Portalul pentru Date Deschise al Uniunii Europene este un punct unic de acces pentru datele emise de instituțiile din Uniunea Europeană. Aceste date sunt libere pentru utilizare în scopuri comerciale sau nu.


Portalul pentru Date Deschise este condus de Oficiul pentru Publicații al Uniunii Europene ca implementare a politicii privind datele deschise la nivel european. Implementarea este în sarcina Directoratului general pentru Rețele de Comunicare, Conținut și Tehnologie al Comisiei Europene.

Portalul are expus celor interesați și un punct de acces33 (triple store) către datele deschise interconectate. Portalul de Date Deschise al UE se poate accesa și utilizând API-ul de tip REST. API-ul vă oferă toate funcționalitățile de bază ale portalului. Informațiile obținute pot fi folosite de coduri externe care solicită portalul API.

Pentru uz programatic, API-ul este disponibil la următoarea adresă URL: http://open-data.europa.eu/data/api/
ePSIplatform este inițiativa Comisiei Europene prin Directoratul general CONNECT care are drept obiectiv promovarea unei piețe destinate reutilizării Informațiilor din Sectorul Public și a Datelor Deschise în întreaga Europă.

În portalul accesibil la http://www.epsiplatform.eu veți putea găsi noutățile, studii legale privind reutilizarea Informațiilor din Sectorul Public, bune practici și exemple de produse și servicii dezvoltate din reutilizarea datelor deschise și toate evenimentele care se desfășoară pe continent.


LAPSI (Legal Aspects of Public Sector Information) 2.0 este o rețea tematică dezvoltată de Comisia Europeană care a avut drept scop identificarea obstacolelor din calea accesului și a reutilizării Informației din Sectorul Public. Ceea ce a făcut în doi ani rețeaua este să colecteze exemple de bune practici privind licențierea deschisă, întărirea legislației și pentru a găsi un echilibru între drepturile de protecție intelectuală, protecția datelor și datele deschise.
HOMER Project - Harmonising Open Data in the Mediterranean through better access and Reuse of public sector information34.
HOMER este un proiect strategic focalizat pe problematica Datelor Deschise în contextul valorificării Informațiilor din Sectorul Public.


  1. Introducere în domeniul geospațial. Definirea termenilor utilizați în documentul de față

În cele ce urmează vom defini o serie de termeni specifici pe care îi considerăm fundamentali în domeniul geospațial și pe care îi vom utiliza în documentul de față.


Harta este o reprezentare grafică în plan orizontal a suprafeței Pământului sau altor planete (totală sau parțială), generalizată și micșorată conform unei anumite scări de proporție și întocmită pe baza unei proiecții cartografice. Există o multitudine de tipuri de hărți, împărțite fie în funcție de scară (scară mică, scară mare - detaliere a informației), de ce anume reprezintă (hartă turistică, geologică), de tipul de proiecție cartografică folosită șamd.
Proiecție cartografică reprezintă un procedeu matematic prin care suprafața curbă a Pâmântului este reprezentată în plan. (exemple în figura XXX) Tipul de proiecție cartografică determină categoriile de erori pe care le vom avea pe hartă, cât și dimensiunea și localizarea acestora.  Selecția unei proiecții cartografice în defavoarea alteia, se realizează în funcție de scara hărții pe care o vom realiza, de ce anume vom reprezenta, de poziția geografică a suprafeței proiectată șamd.

Figura XXX. Forma conturului României în funcție de proiecțiile cartografice utilizate
Scara reprezintă raportul dintre dimensiunea unui obiect pe hartă și corespondentul său în lumea reală.
Georeferentiere reprezintă procesul invers al proiectării suprafeței plane pe suprafața curbă. (Figura XXX)

Figura XXX. Exemplificarea procedeului de georeferențiere a unei hărți


Yüklə 160,46 Kb.

Dostları ilə paylaş:
1   2   3




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin