ACADEMIA DE STUDII ECONOMICE
Facultatea de Cibernetica Statistica si Informatica Economica
Informatica PowerCenter
Vacarus Mariana
Grupa 1071
Cuprins
Cuprins 2
Introducere 3
Despre Informatica si PowerCenter 3
Arhitectura Informatica PowerCenter 4
Integrarea datelor in Informatica PowerCenter 7
7
Concluzii 8
Bibliografie 8
9
Introducere
Pentru a aduce un plus de valoare prin eficientizarea operatiunilor si proceselor complexe existente intr-o companie, cele mai multe dintre ele apeleaza la solutii de BI.
O soluţie BI promite maximizarea performantelor oricarei afaceri, prin rezolvarea problemelor complexe care apar intr-o companie, cum ar fi migrarea de pe sistemele vechi, cazuri de aplicare consolidate si sincronizarea datelor in sisteme operationale multiple.
Aceste solutii parcurg o serie de etape bine individualizate precum : modelarea si proiectarea, extragerea datelor, transferul si încărcarea datelor, agregarea datelor, managementul metadatelor, integrarea intrumentelor de analiză si administrarea depozitului de date.
Folosirea datelor din si in sisteme operationale multiple, este un proces complex de integrarea a datelor, care presupune si pastrarea coerentei si corectitudinii lor. Aceste lucru se realizeaza prin implementarea unei tehnologii ETL (Extract Transform and Load).
Extragerea datelor este un proces ce presupune intelegerea, analiza si, eventual, curatarea datelor provenite de la diversele surse de date. Transformarea presupune verificarea amanuntita a datelor, in sensul acuratetii si relevantei lor, si apoi modificarea lor in conformitate cu cerintele de business din cadrul companiei. Partea de incarcare implica atribuirea unor caracteristici cheie si salvarea lor in depozitele de date.
Dintre cele mai cunoscute ETL-uri amintim: Ab Inition, DataStage, Informatica PowerCenter, SQL Server Integration Services, BusinessObjects Data Integrator, Data Transformation Services,Talend.
Despre Informatica si PowerCenter
Informatica este un instrument care sprijina toate etapele procesului de extragere, transformare și încărcare. Astazi Informatica este, de asemenea, utilizat ca un instrument de integrare.
Informatica este un instrument usor de utilizat. Are o interfata vizuala simpla, asemanatoare formelor din Visual Basic. Trebuie doar să glisati si sa fixati obiecte diferite (cunoscut sub numele de transformari) si sa proiectati fluxuri de lucru pentru procesul de extragere, transformare si incarcare a datelor. Aceste diagrame de flux de proces sunt cunoscute ca mapari. Odată ce maparea este realizata, acesta poate fi programata să ruleze atunci când este necesar. Pe fundal serverul Informatica are grijă la preluarea datelor de la sursa, transformarile necesare, și incărcarea la sistemele/bazele de date.
Informatica poate comunica cu toate sursele de date majore (mainframe / RDBMS / Fișierele de tip Flat/ XML / VSM / SAP, etc), poate muta / transforma datele între ele. Se pot muta volume mari de date într-un mod foarte eficient, de multe ori mai bine decât chiar programele pentru mutari specific de date. Se poate accelera efectuarea tranzactiilor (actualizări mari în bucăți mici, pentru a evita blocarea pe termen lung și completarea jurnalul tranzacțional). Acesta poate aduna în mod eficient datele din două surse distincte de date (chiar si un fisier XML poate fi unit cu un tabel relational).
Informatica are capacitatea de a integra în mod eficient surse de date eterogene si sa converteasca datele aflate in forma bruta în informații utile.
Informatica ofera un set complet de instrumente integrate create pe o platforma unica si unificata, bazata pe SOA (service-oriented architecture). Aceasta platforma consta in acces universal la date si un set comun de servicii.
Servind ca baza pentru toate proiectele de integrare a datelor, Platforma Informatica permite organizatiilor IT initierea procesul de ETL practic de la orice sistem de afaceri, in orice format. Ca parte a Platformei Informatica, Informatica PowerCenter oferă robuste si capacitati ETL usor de utilizat, care permit dezvoltarea și implementarea de date departamentale si depozite de date. În plus, capacitătile ETL faciliteaza refolosirea de la un proiect la altul.
Produsul a fost imbunatatit prin integrarea unor instrumente aditionale, folosite pentru raportarea statusului de procesare a datelor, regulile de business aplicate si calitatea datelor inainte si dupa prelucrare.
Arhitectura Informatica PowerCenter
Informatica PowerCenter folosește o arhitectura client-server care contine mai multe componente, descrise in termeni generali mai jos, si ilustrat în figura 1.
- Domeniul Informatica (Informatica domain) - Unitatea primara pentru gestionarea si administrarea serviciilor în PowerCenter.
- Nodul (Node) - O reprezentare logică a unei mașini într-un domeniu. Nodul care găzduieste domeniul este poarta de acces principala pentru domeniu.
- Serviciile Informatica (Informatica Services) - un serviciu Windows care porneste Service Manager pe un nod.
- Managerul de servicii (Service Manager) - incepe si conduce serviciile de aplicatii pe o masină într-un domeniu.
- Servicii de integrare (Integration Services) - Citeste fluxul de informatii de lucru de la depozitul PowerCenter, si ruleaza sesiuni si fluxuri de lucru care extrag, transforma si incarca datele.
- Servicii de depozitare (Repository Service) - gestioneaza conexiunile de la depozitul PowerCenter.
- Informatica Administrator - o aplicatie web pentru gestionarea domeniul Informatica, securitatea PowerCenter, si depozitului PowerCenter.
- Baza de date pentru configurarea domeniului Informatica (Informatica domain configuration database) - stocheaza informatia (metadate), referitoare la configurația din domeniul Informatica.
- Depozit PowerCenter (PowerCenter repository) - stochează informatia (metadate) necesara pentru extragerea, transformarea si incarcarea datelor. Se afla intr-o baza de date relationala.
- Clientul PowerCenter (PowerCenter Client) - consta in :
- Designer – permite definirea surselor si a destinatiilor (obiectivelor) si crearea de mapari cu instructiunile de transformare, pentru utilizarea acestora in fluxurile de lucru
- Managerul fluxurilor de lucru (Workflow Manager) – permite crearea programarea si rularea fluxurilor de lucru
- Monitorul fluxurilor de lucru (Workflow Monitor) – permite monitorizarea programarilor si rularii fluxurilor de lucru
- Managerul despozitului (Repository Manager) – permite administrarea depozitului PowerCenter – acorda permisiuni utilizatorilor si gruputilor de utilizatori, si vizualizarea metadatelor existente in depozit.
Produsul ETL de la Informatica, cunoscut sub numele de Informatica Power Center este format din 3 componente principale.
1. Informatica PowerCenter Client - acestea sunt instrumente de dezvoltare instalate de dezvoltatorul final. Aceste instrumente permit dezvoltatorului urmatoarele:
-
definirea procesului de transformare, cunoscut sub numele de mapare. (Designer)
-
definirea proprietăților run-time pentru o mapare, cunoscut sub numele de sesiuni (Workflow Manager)
-
monitorizarea executiei sesiunilor (Workflow Monitor)
-
gestiunea depozitului, util pentru administratori (Repository Manager)
-
raportarea metadatelor (Metadata Reporter)
2. Informatica PowerCenter Repository- depozitul este inima instrumentelor produse de Informatica. Depozitul este un fel de inventar de date în care toate datele legate de mapari, surse, obiective, etc sunt păstrate. Acesta este locul în care sunt stocate toate metadatele pentru aplicația dumneavoastră. Toate instrumentele de client și Informatica Server preia datele de la depozit. Informatica client si server, fara depozit este același ca si un PC fara memorie / hard disc, care are capacitatea de a prelucra datele, dar nu are date de procesat.
3. Informatica PowerCenter Server - serverul este locul, unde toate executiile au loc. Server face conexiunile fizice cu sursele / obiectivele, preia date, aplica transformarile mentionate în mapare si incarca date in sistemul tinta.
Figura 1 - Arhitectura Informatica PowerCenter
Integrarea datelor in Informatica PowerCenter
In mometul in care workflow-ul se porneste din PowerCenter Workflow Manager, se lanseaza in executie si Serviciul de Integrare care comunica prin TCP/IP cu cele 2 componente Manager-ul si Monitorul pentru a vedea cursul flow-ului și ce anume trebuie să se execute apoi accesează repository-ul pentru a prelua metadatele prin drivere native. Odata ce avem datele despre date, putem sa preluam si datele efective de surse atat prin drivere native cat si prin diverite ODBC-uri. Iar apoi, avand datele se fac transformarile de business asupra lor asa cum sunt definite in sesiunile si workflow-urile create in Designer, ca in final sa se realizeze integrarea datelor prin încarcarea acestora in targeturile specifice.
Cu ajutorul consolei bazată Web se realizeaza si logarea clientilor pentru a primi cererile de la acestia.
Informatica PowerCenter oferă posibilitatea de integrare a datelor de la o multitudine de targeturi precum si preluarea acestora dintr-o multitudine de surse.
Astfel, pe partea de surse avem :
Standard: RDBMS, Flat Files, XML, ODBC
Aplicații: SAP R/3, SAP BW, PeopleSoft, Siebel, JD Edwards, i2
EAI: MQ Series, Tibco, JMS, Web Services
Legacy: Mainframes (DB2, VSAM, IMS, IDMS, Adabas)AS400 (DB2, Flat File)
Remote sources
Target-urile în care se pot încărca datele sunt în principal aceleași:
Standard: RDBMS, Flat Files, XML, ODBC
Aplicații: SAP R/3, SAP BW, PeopleSoft, Siebel, JD Edwards, i2
EAI: MQ Series, Tibco, JMS, Web Services
Legacy: Mainframes (DB2)AS400 (DB2)
Remote targets
Ca si baze de date amintim : DB2, MySql Servr, Sybase, Teradata, Informix.
Spre deosebire de alte ETL-ri, Informatica PowerCenter ofera suport pe partea de DataWarehousing, adica existe obiecte care se muleaza perfect pe notiunile de tabele de fapte, de dimensiuni, cub, schema stea, fulg de zapada, etc
Astfel cu ajutorul unui ODBC se pot integra date in orice depozit de date, chiar si in Nettezza.
Informatica PowerCenter are, de asemenea, interfete si cu Cobol pentru preluarea si incarcarea de date, precum si cu Cognos pentru realizarea de analize si raportare.
Concluzii
Informatica PowerCenter este un software de integrare de date foarte complex care asigură un grad mare de flexibilitate și scalabilitate. Din pacate nu este open-source, insa este foare rapid si se poate scala pe sisteme mari, poate conecta un numar variat de sisteme, poate realiza cu usurinta trecerea de la un sistem mai vechi la unul performant, fara pierderi de date, pastrandu-si acurateatea si corectitudinea.
Pentru sistemele mici, insa este recomandata folosirea altor instrumente ETL, deoarece Informatica PowerCenter este foarte mare, foarte complexa si costisitoare.
Atunci cand companiile trebuie sa aleaga o solutie de integrare a datelor care sa se potriveasca cel mai bine cerintelor de business, acestia sunt pusi intr-o situatie destul de dificila datorita varietatii firmelor care furnizeaza astfel de produse. Raspunzand la intrebarile cele mai frecvente legate de sistemul de integrare al datelor, as putea spune ca PowerCenter se afla in topul preferintelor.
Astfel, PowerCenter este preferat inaintea altor solutii de integrare a datelor deoarece:
-
realizeaza migrarea datelor de la cap la coada
-
diferitele faze ale metodologiei produsului creeaza specifice formate de livrare pentru migrare
-
explicarea pas cu pas a explicarii unor proiecte de integrare anterioare (exista numeroase tutoriale si documentatii pentru diversele versiuni ale produsuli)
-
raportand resursele folosite pentru migrarea datelor si pretului produsului, reiese o abordare corecta din punct de vedere a politicii de pret
Bibliografie -
http://www.informatica.com
-
http://www.etltools.net/informatica.html
-
http://etl-tools.info/informatica/components.html
-
http://informatica.techtiks.com
-
http://www.bitool.net/software/powercenter.html
-
http://www.informaticans.com/blog/201/informatica-power-center-architecture/
-
http://docs.acl.com/ax/310/index.jsp?topic=/com.acl.ax.datasource.help/AX_Datasource/c_informatica_powercenter_architecture.html
-
http://www.techopedia.com/definition/25983/informatica-powercenter
-
http://www.relational.gr/ro/products/representations/informatica/
Dostları ilə paylaş: |