Auto-similaritatea traficului in internet

Zgomotul gaussian fractionar (FGN)

Yüklə 345,52 Kb.

səhifə	3/6
tarix	11.01.2019
ölçüsü	345,52 Kb.
	#94745

1 2 3 4 5 6

Zgomotul gaussian fractionar (FGN) : X(t),

se numeste zgomot gaussian fractionar cu parametrul H daca X(t) este procesul increment al FBM cu pareametrul H.

Conform definitiei H-sssi, FBM este miscare browniana iar FGN zgomot gaussian fractionar daca si numai daca H=0.5. Astfel, X(t), devine complet necorelat.

In cazul proceselor gaussiene, auto-similaritatea distributionala si auto-similaritatea de ordinul doi sunt echivalente.

Pentru a justifica de ce distributiile cu coada lunga sunt considerate cauza dependentei de raza lunga a traficului de retea, se prezinta in cele ce urmeaza procese de input cu timpi de activitate probabilistici, care se demonstreaza ca genereaza dependenta de raza lunga daca si numai daca fac parte dintr-o distributie cu coada lunga.

Ca modele se folosesc modelul on/off definit de Willinger si o varianta a modelului definita de Likhanov.

Modelul on/off considera N surse independente de trafic X_i(t), cu unde fiecare este un proces de reinoire a recompensei de tip 0/1 cu perioade on si off de tip i.i.d.

X_i(t) ia valori 1 (on) sau 0 (off) pe parcursul unor intervale de timp alternante si care nu se suprapun si care poarta numele de perioade on/off. Astfel avem un tren de pachete, adica de perioade on.

Figura 6. Exemplu de model on/off.

Fie traficul agregat la momentul de timp t.

Se considera procesul cumulativ Y_N(Tt) definit ca:

(30)

unde T>0 este un factor de scala explicit incorporat.

Y_N(Tt) masoara volumul total de trafic pana la momentul Tt.

Se noteaza cu variabila aleatoare care descrie durata perioadelor on si variabila aleatoare asociata cu durata perioadelor off.

Unde si c>0 este o constanta. In ceea ce priveste , aceasta poate fi distribuita fie dupa o lege cu coada lunga fie dupa o lege cu coada scurta dar cu dispersie finita.

Y_N(Tt) se comporta statistic ca

(31)

pentru T, N mari unde si B_H(t) este FBM cu parametrul H iar C>0 este o cantitate care depinde doar de distributiile si .

Y_N(Tt) se comporta asimptotic deci ca o miscare browniana fractionara ce fluctueaza in jurul atunci cand este normalizata in mod corespunzator. Acesta prezinta dependenta de raza lunga () daca , adica daca distributia lui este de tip coada lunga. Daca niciuna din distributiile variabilelor sau este de tip coada lunga, atunci Y_N(Tt) prezinta dependenta de tip coada scurta. Chiar daca este distribuita dupa o lege de tip coada lunga, dar nu, Y_N(Tt) tot va prezenta o distributie de tip coada lunga. Acest caz nu este insa de interes deoarece in modelarea traficului conteaza perioadele on.

Un alt model de sursa se obtine daca se considera fiecare sursa ca emitand un singur tren de pachete, in rest fiind inactiva. Astfel, o singura sursa on/off in modelul on/off poate fi construita astfel incat sa reprezinte comportamentul de output al unui host din retea, care poate deservi mai multe conexiuni TCP in timp ce in cazul trenului singular de pachete, sursa corespunde unei singure conexiuni de tip TCP ce transporta un stream de bytes ca de exemplu un fisier.

Fiecarei surse ii asociem un interval de timp , , unde X_i(t)=1 daca si 0 in rest. Se presupune ca, sunt i.i.d si t_i este determinat de catre un proces Poissoncare indica cate conexiuni noi ajung la momentul t.

masoara cate conexiuni noi sunt active la momentul t. Alternativ, X(t) poate fi vazut ca rata de trafic agregat emis la momentul t.

Influenta distributiei cu coada lunga asupra dependentei de raza lunga poate fi observata studiand sistemul de cozi M/G/.

O coada de tip M/G/se defineste ca fiind un proces server ocupat unde sosirile conexiunilor sunt distribuite Poisson si fiecare conexiune este deservita de catre un server- exista un numar infinit de servere- cu un timp general de deservire. Astfel, la fiecare moment de timp numaram cate servere sunt ocupate cu servirea cererilor. Daca timpii de deservire distribuiti i.i.d sunt dati de , , atunci se poate observa ca procesul server ocupat din coada M/G/ corespunde ratei de trafic agregat X(t) din modelul Poisson cu o singura perioada on.

Daca este distribuit cu coada lunga cu indexul cozii , atunci X(t), este asimptotic auto-similar de ordinul doi cu parametrul .

Se poate arata ca FBM se produce in mod natural ca proces limita daca se dimensioneaza rata sosirilor Poisson si timpii de deservire. Sistemul M/G/folosit pentru modelarea traficului de retea s-a dovedit a fi util in analiza comportamentului cozilor carora li se furnizeaza input cu dependenta de raza lunga.
Este important de mentionat ca distributiile de tip coada lunga nu genereaza neaparat dependenta de raza lunga in traficul agregat. Beran a aratat ca agregarea infinita a surselor cu dependenta de raza scurta- surse heterogene de tip on/off cu timpi on/off exponentiali- poate produce dependenta de raza lunga in cazul unei calibrari adecvate. Agregarile finite ale surselor cu dependenta de raza mica nu pot produce dependenta de raza lunga.
2.4 Domenii de cercetare

Cercetarile asupra traficului auto-similar se pot clasifica in patru domenii. In prima categorie intra modelarea traficului pe baza masuratorilor.

Astfel esantioane de trafic sunt colectate din diverse retele existente fizic in internet si sunt analizate pentru a detecta, identifica si cuantifica caracteristicile traficului. Masuratorile au aratat invarianta rafalelor traficului la scalarea in timp (auto-similaritate) atat in retele de tip LAN cat si WAN, atat in retele bazate pe protocol IP cat si in retele de tip ATM, atat in retele formate din medii de transmisie din cupru cat si in retele formate din medii de transmisie de fibra optica.

Analiza se face si din punct de vedere statistic. Validitatea unei tehnici de estimare este legata de procesul sau procesele care au generat datele. Astfel, un esantion de date a caror provenienta este necunoscuta nu poate fi atribuit unui anumit model de sursa sau proces si sunt necesare metode statistice de investigare pentru a stabili daca datele provin sau nu dintr-un anumit proces, model. Modelarea traficului bazata pe masuratori a dus la introducerea unei clase noi de modele, procesele auto-similare, modele folosite pentru traficul de retea.

Din punct de vedere practic, foarte multe din tehnicile statistice folosite pentru stabilirea gradului de auto-similaritate sau dependenta de raza lunga (spre exemplu estimarea parametrului Hurst) sunt robuste. Datorita naturii lor, predominant euristice, aceste tehnici sunt usor de folosit si aplicat dar rezultatele obtinute sunt dificil de interpretat. Introducerea abordarilor bazate pe wavelet pentru analiza traficului reprezinta un pas important pentru dezvoltarea unor tehnici cu acuratete sporita care au sensibilitate crescuta la procedeul de scalare, putandu-se astfel discerne mai bine intre diferitele modele propuse. Deoarece wavelet-urile au proprietatea de localizare a unui semnal in spatiu si timp, ele au facut posibila detectarea, identificarea si descrierea comportamentului multifractal al scalarii (de exemplu un comportament al scalarii neuniform in timp care se manifesta in cazul traficului TCP masurat).
In a doua categorie se incadreaza modelarile fizice care incearca sa explice cauzele auto-similaritatii in cazul traficului in internet, bazandu-se pe mecanisme de retea si proprietati ale sistemelor distribuite stabilite empiric, care impreuna genereaza rafalele auto-similare ale traficului in internet in punctele de multiplexare ale nivelului de retea. Modelarea fizica are ca scop gasirea de modele pentru traficul de retea care se leaga de mecanismul fizic prin care traficul de retea este generat intr-o retea reala, care sa fie capabile sa explice fenomenele observate empiric (auto-similaritatea) si care eventual sa releve noi proprietati ale traficului de retea.

Un prim tip de cauza care produce trafic auto-similar se datoreaza sosirii pachetelor de la o singura sursa, ca de exemplu VBR (variable rate video). MPEG-ul de exemplu, manifesta variabilitatea la rezolutii multiple in timp, variabilitate care se pune pe seama variatiei duratei dintre schimbarile succesive ale scenelor. Video-ul VBR poate fi aproximat prin modele de trafic de raza scurta.

A doua cauza (cauza structurala) poate fi atribuita unei proprietati empirice a sistemelor distribuite si anume distributia cu coada lunga a marimii fisierelor sau obiectelor. O variabila aleatoare care asculta de o distributie cu coada lunga poata produce o gama larga de valori diferite de probabilitate neneglijabila.

Daca host-urile schimba intre ele fisiere ale caror dimensiuni asculta de o distributie cu coada lunga, atunci traficul de retea rezultat este auto-similar in punctele de multiplexare ale nivelului de retea. Aceasta cauza este robusta in sensul ca este valabila pentru o gama larga de protocoale de transport cum ar fi TCP si UDP.

Sistemul de fisiere UNIX are o distributie cu coada lunga. Acelasi tip de distributie o prezinta si obiectele web. Obiectele cu distributie cu coada lunga transportate de protocoale de tip TCP si UDP genereaza rafale auto-similare in punctele de multiplexare.

Modelul on/off propus de catre Willinger et al. arata ca superpozitia unui numar mare de surse on/off cu perioade on si/sau off distribuite dupa o lege cu coada lunga duce la auto-similaritate in procesul agregat- un process de tip zgomot fractional Gaussian- a carui dependenta de raza lunga este determinata de distributia cu coada lunga a perioadelor on sau off. Agregarea spatiala este esentiala pentru inducerea dependentei de raza lunga, este responsabila pentru proprietatea gaussiana a traficului agregat prin aplicarea Teoremei limita centrala. Agregarea spatiala este relevanta pentru descrierea traficului de retea multiplexat. Una din slabiciunile acestui model este presupunerea surselor on/off ca fiind independente. Acest lucru s-a urmarit studiand influenta dependentei intre sursele multiple cuplate la routere bottleneck ce partajeaza resurse cand fluxurile sunt guvernate de protocoale ce implementeaza controlul congestiei prin feedback (ca de exemplu TCP la nivelul de transport). Cuplarea acestor surse nu influenteaza semnificativ dependenta de raza lunga. Modelul on/off este capabil sa genereze atat zgomot fractionar gaussian cat si un tip de auto-similaritate si dependenta de raza lunga numita auto-similaritate asimptotica de ordinul 2 (un singur proces cu perioade on/off distribuite dupa o lege cu coada lunga), acestea fiind doua din cele mai folosite modele auto-similare folosite pentru trafic in analiza performantei.

Legatura intre masuratori si modelarea fizica releva faptul ca nivelul de aplicatie are proprietatea de a pastra distributia cu coada lunga a marimii fisierelor, proprietate pastrata de catre stiva de protocol si tradus prin perioade ocupate distribuite aproximativ dupa o lege cu coada lunga la nivelul de retea. Spatiile dintre pachete in cadrel aceleiasi sesiuni a fost catalogat ca avand propria variabilitate.

A treia categorie de cercetari se refera la modele matematice ale traficului de raza lunga in sensul teoriei cozilor. Prin investigarea comportamentului cozilor care primesc la input date cu dependenta de raza lunga se pot deduce caracteristici si limitari de performanta. Caracteristicile de performanta sunt cu totul diferite de cele prezentate in cazul unui input de tip Markov.

Distribuita lungimii cozii in sisteme cu buffer infinit are o coada ce descreste mai incet decat exponential (subexponential) in contrast cu inputul cu dependenta de raza scurta a carui descrestere este exponentiala.

In functie de modelul ales pentru coada, inputul cu dependenta de raza lunga poate da nastere la un comportament de descrestere al distributiilor lungimii cozii de tip Weibull sau polinomial.

Scopul acestor analize a cozilor cu input non-markovian este de a vedea influenta asupra performantelor sistemului. Distributia lungimii cozii releva faptul ca bufferul ca strategie de alocare a resurselor, devine ineficient cand traficul de intrare este auto-similar, in sensul ca este afectata inegal intarzierea la nivelul cozii in paralel cu un castig in reducerea ratei de pachete pierdute. Aceasta a dus la propunerea unor buffere de capacitate mica si la marirea benzii ca strategii de alocare a resurselor. Daca capacitatea bufferului este mica, atunci probabilitatea de intarziere sau de aglomerare este mai mica. Cu cat capacitatea bufferului este mai mica, cu atat creste importanta corelatiilor de raza-mica in determinarea ocuparii bufferului. Aceste corelatii se dovedesc a fi importante in ceeea ce priveste imbunatatirea ratei de pierdere a pachetelor.

Un dezavantaj major al sistemelor bazate pe cozi este ca acestea au natura asimptotica. Studiile de natura empirica cauta sa gaseasca o compatibilitate intre rezultatele asimptotice si sistemele cu buffere finite.

Figura 6 ilustreaza dependenta dintre lungimea cozii si capacitatea bufferului cand un router bottleneck are ca input trafic auto-similar cu grade variate de dependenta de raza lunga dar cu aceeasi intensitate a traficului. aproape de 1 inseamna dependenta de raza-lunga puternica iaraproape de 2 se traduce prin dependenta de raza lunga slaba. Cand structura corelatiei de raza lunga e slaba, capacitatea bufferului de 60kB este suficienta pentru a face fata la variabilitatea inputului. Mai mult decat atat ocuparea medie a bufferului ramane su 5kB. Cand structura corelatiei de raza lunga e puternica, cresterea in capacitate a bufferului este insotita de o crestere corespunzatoare in gradul de ocupare a bufferului cu limita capacitatii bufferului pentru care lungimea medie a cozii se satureaza mult mai mare.

Figura 7. Lungimea medie a cozii in functie marimea bufferului in functie de gradul de dependenta de raza lunga.
In cazul analizelor de performanta se recomanda a se pune accent atat pe masuratorile performantelor de ordinul 1- ca de exemplu rata de pierdere a pachetelor- cat si pe masuratorile asupra performantelor de ordinul 2 –dispersia pierderii de pachete cunoscuta sub denumirea de jitter- deoarece acestea prezinta interes pentru multimedia. Doua procese care descriu pierderi pot avea statisticile de ordinul 1 identice dar unul din ele prezinta o dispersie mai mare decat celalalt in cazul perioadelor concentrate de pierdere de pachete- cum este cazul traficului auto-similar- si asta poate influenta negativ eficacitatea corectiei de erori la nivelul forwardarii pachetelor, corectie folosita in tehnicile de asigurare a calitatii serviciilor (QoS) pentru traficul in timp real. Un alt aspect care trebuie avut in vedere se refera la evaluarea performantelor in regim tranzitoriu, performante importante in practica cand convergenta catre comportamentul stabil pe termen lung este prea lenta pentru a fi de ajutor in proiectare.

Cele mai multe rezultate obtinute in cazul sistemelor bazate pe cozi cu input de raza-lunga sunt pentru sisteme in bucla deschisa care ignora chestiunile legate de control prin feedback prezente in mediile actuale de retea (de exemplu TCP). Feedbackul poate influenta si determina forma traficului care ajunge in cozi astfel incat trebuie luat in considerare efectul sau.

A patra categorie de cercetari se refera la controlul traficului auto-similar. Se disting doua subcategorii : alocarea resurselor si dimensionarea. Problema estimarii cantitative a utilitatii unei unitati de resursa adtitionala cum ar fi largimea de banda sau capacitatea bufferului se bazeaza pe analiza cozilor cu input auto-similar.

De asemenea sunt importante si sunt studiile asupra multiplexarii statistice ce utilizeaza largimea de banda efectiva. Aceste studii releva cat de eficient pot fi utilizate aceste resurse cand sunt partajate de mai multe fluxuri. Dimensiunea bufferelor trebuie sa fie mica si banda alocata mare. In cazul unui buffer de dimensiune mica corelatiile de raza mica afecteaza caracteristicile performantelor de ordinul 1.

Din punctul de vedere al controlului congestiei in sisteme cu multiscalare in timp se incearca sa exploateze structura de corelatie care exista intre diferitele scalari in timp in cazul traficului auto-similar. Dependenta de raza lunga ofera posibilitatea de utilizare a corelatiei in cazul unor scalari mari in timp pentru exploatarea predictibilitatii si astfel se poate usura controlul congestiei.

Problema care apare in in proiectarea mecanismelor de control care permit folosirea structurii corelatiei in cazul unor scalari mari in timp implica doua neajunsuri:

1) structura corelatiei exista la scari de timp cu un ordin sau mai multe de marime mai mari decat bucla de feedback

2) informatia extrasa este imprecisa datorita naturii sale probabilistice.

Aceasta structura a corelatiei poate fi utilizata pentru a creste simtitor castigurile performantei si a cerintelor QoS precum si pentru controlul redundantelor. Importanta este si problema produsului intarziere-largime de banda in cazul retelelor de banda larga care face controlul traficului prin feedback ineficient in cazul RTT (round-trip times). Controlul congestiei ofera posibilitatea de compensare a incertitudinii care izvoraste din controlul feedbackului outdatat, compensare realizata de structura predictibilitatii prezenta la intervale de timp care depasesc RTT sau bucla de feedback (secunda in comparatie cu milisecunde).

Un aspect important al controlului traficului il prezinta predictia duratei conexiunii. Rezultatele modelarilor fizice demonstreaza faptul ca aceste conexiuni sau fluxurile asculta de o distribuite cu coada lunga in ceea ce priveste durata lor in timp sau durata lor de viata si aceasta informatie poate fi exploatata pentru controlul traficului. Coada lunga implica faptul ca majoritatea conexiunilor au o durata mica de viata dar la volumul de trafic contribuie cateva fluxuri care au o durata mare de viata. Conform Legii lui Amdahl este importanta studierea influentei acestor fluxuri daca numarul lor este mic. O forma a Legii lui Amdahl afirma ca pentru a imbunatatii performanta unui sistem, functionarea sa in raport cu cele mai intalnite stari ale sale trebuie eficientizata. Castigul in termeni de performanta este limitat de functionarea sistemului. Idea folosirii duratei conexiunilor a fost introdusa prima oara in contextul echilibrarii incarcarii in sisteme distribuite in care procesele UNIX au fost demonstrate ca avand timpi de viata ce asculta de o distributie cu coada lunga. Prin contrast cu repartitiile exponentiale care nu permit predictia, distributiile cu coada lunga implica folosirea predictiei- o conexiune a carei durata masurata depaseste un anumit prag are o probabilitate mare de a persista in viitor. Aceasta informatie poate fi folosita pentru distribuirea incarcarii. Se incurajeaza distinctia intre fluxurile cu durata mare de viata si fluxurile cu durata mica astfel incat update-urile in tabela de rutare sa fie influentate mai mult de fluxurile cu durata mare. Aceasta mareste stabilitatea sistemului in defavoarea efectelor transiente declansate de fluxurile scurte. In general, informatia asupra duratei conexiunii poate fi oferita direct din informatia disponibila la nivelul de aplicatie-spre exemplu un server Web cand deserveste o cerere http, poate discerne marimea obiectului in cauza si aceasta informatie este facuta disponibila nivelelor inferioare de decizie pentru stabilirea tipului de control folosit : in bucla deschisa (pentru fluxuri cu durata mica de viata) sau in bucla inchisa (pentru fluxuri cu durata mare de viata).

3. Modelarea traficului. Folosirea transformarilor wavelet pentru analiza, estimarea si sinteza datelor de scalare.
3.1 Introducere

Una din problemele existente o reprezinta importanta fenomenului de scalare a traficului in domeniul retelisticii. In ceea ce priveste modelarea traficului, caracteristica de scalare trebuie inclusa in modele ca una din trasaturile fundamentale. Prin urmare, scalarea are implicatii imediate in alegerea claselor de modele de trafic si in consecinta-prin alegerea unei anumite clase- va influenta estimarea parametrilor modelului. Estimarea este necesara pentru verificarea initiala a modelului, pentru proceduri de optimizare si pentru monitorizarea traficului.

Modelarea traficului nu se face izolat ci in contextul unor criterii de performanta. In functie de metrica aleasa din punct de vedere al performantei si de modelul retelei, influenta scalarii traficului va varia. Spre exemplu, in cazul anumitor cozi cu buffer infinit, daca la intrarea acestora se afla date proventite de la surse de tip on/off caracetrizate de do dependenta de raza lunga, distributia stationara a cozii va avea medie infinita (rezultat necalsic). Pentru eliminarea acestui inconveniente se folosesc buffere finite deoarece un buffer finit nu poate contine infinit de multe date. Dependenta de raza lunga a streamului de intrare influenteaza puternic pierderile de overflow dar nu poate mari semnificativ intarzierile conditionate ale pachetelor nepierdute, intarzieri legate de lungimea bufferului. Importanta fenomenului de scalare in trafic este dependenta de context.

Probleme vitale sunt detectia, identificarea si masurarea comportamentului de scalare. Acestea nu pot fi ignorate chiar daca obiectivul urmarit sunt anumite criterii de performanta care nu sunt in mod direct legate de scalare deoarece scalarea introduce proprietati statistice neclasice ce afecteaza estimarea tuturor parametrilor si nu doar a celor legati de scalare. Aceasta afecteaza capabilitatile de predictie a modelelor de performanta si deci utilitatea lor in practica.

Se impune astfel o detectie de acuratete a scalarii. Prin detectia prezentei sau a absentei scalarii se decide daca datele trebuie analizate folosind statistica obisnuita, traditionala sau folosind tehnici speciale de statistica care iau in considerare prezenta scalarii. Este important de asemena sa se faca distinctia intre particularitatile datorate nestationaritatilor care cauzeaza aparitia scalarii si intre comportamentul tipic de scalare. Identificarea este necesara deoarece exista mai multe tipuri de scalare ce prezinta interpretari si implicatii diferite in alegerea modelului. Odata determinat un anumit tip de scalare, se cere determinarea cu precizie a parametrilor care il caracterizeaza. Acesti parametrii vor controla proprietatile statistice ale estimatilor tuturor celorlalte marimi cum ar fi parametrii necesari in modelarea traficului sau in metrica serviciilor de asigurare a calitatii.

Pentru exemplificarea celor de mai sus, se considera un proces de ordinul 2 X(t), stationar, a carui medie se doreste a fi estimata dintr-un set de date de lungime n. Pentru aceasta se considera estimatorul de medie. Rezultatul classic afirma ca pentru n suficient de mare, media esantionului asculta de o distribuite normala. Media estimatorului de medie este iar dispersia , unde este dispersia variabilei X. in cazul in care X prezinta o dependenta cu raza lunga, media experimentala este asimptotic normal distribuita catre media . Dispersia este data insa de unde si sunt parametrii care desciu o dependenta de raza lunga. Aceasta expresie arata ca dispersia estimatorului de medie descreste cu marimea esantionului n cu o rata de descrestere mai mica decat cea clasica. Astfel, stabilirea unor intervale de incredere pe baza unor premise statistice clasice duce la erori serioase, neluandu-se in discutie dependenta de raza lunga.

3.2 Avantajele metodelor bazate pe wavelet

Folosirea metodelor de analiza wavelet pentru detectia, identificare a si masurarea scalarii este avantajoasa deoarece acestea poseda un grad de invarianta la scalare, spre deosebire de alte metode. Un avantaj cheie este acela ca tipuri destul de diferite de scalare pot fi analizate cu aceeasi tehnica si cu acelasi set de simulari. Estimatorii semiparametrici ai parametrilor de scalare care rezulta din aceast metoda au propietati excelente- medie neglijabila si dispersie mica- si in multe cazuri ofera rezultate mai bune prin comparatie cu solutiile parametrice.

Avantajele computationale bazate pe folosirea transformatei wavelet discrete (DWT) sunt substantiale si permit analiza de date de dimensiune variabila nu in ultimul rand exista si avantaje legate de robustetea metodei.

Un alt aspect important legat de studiile de modelare si performanta vizeaza generarea seriilor temporale folosite pentru utilizarea acestora in simulari. Asemenea simulari pot fi mari consumatoare de timp pentru procese cu memorie semnificativa unde istoria exercita o influenta puternica asupra prezentului, anuland valabilitatea aproximarilor simple bazate pe trunchiere. Din acest punct de vedere, utilizarea wavelets pentru generarea datelor ofera avantaje clare.

3.3 Ce este wavelet?

3.3.1 Transformarea wavelet in continuu

Descompunerea wavelet in continuu consta dintr-o colectie de coeficienti:

(32)

ce compara (prin intermediul produselor interne) semnalul X ce se doreste a fi analizat cu un set de functii analizoare:

(33)

Acest set de functii analizoare se construieste pornind de la un pattern de referinta care poarta denumirea de wavelet mama, prin actiunea unui operator de shiftare in timp precum si un operator de dilatare (de schimbare de scala) .

este ales astfel incat domeniul sau este limitat atat in timp cat si in frecventa.

consista dintr-o mica unda definita pe un suport care e aproape limitat in timp si are majoritatea energieisale concentrate intr-o banda limitata de frecventa. Deoarece atat suportul in timp cat si banda de frecventa nu pot si ambele finite, se fixeaza un interval in care acestea sunt efectiv limitate. Operatorul de shiftare in timp face posibila selectarea momentului de timp in jurul caruia se doreste a fi analizat semnalul. Operatorul de dilatare defineste scara de timp (sau in mod corespunzator gama de frecvente) in care sa se faca observarea.

Marimea se numeste scalograma si se interpreteaza ca continutul de energie al lui X in jurul momentului de timp t intr-o gama data de frecvente controlata de a. In afara bunei localizari atat in timp cat si in frecventa, waveletul mama trebuie sa satisfaca conditia de admisibilitate a carei forma slaba este:

(34)

Care arata ca este o functie oscilatoare trece banda, adica un wavelet.

Waveleturile folosite in general in practica sunt Haar, Daubeechies si Meyer.

Pe baza conditiei de admisibilitate, transformarea este inversabila:

(35)

Unde este o constanta ce depinde de . Aceasta formula de reconstructie in termenii unei integrale ponderate de waveleturi (care se comporta ca atomi elementari) localizati in jurul anumitor momente de timp si in jurul anumitor frecvente, constituind deci o cuanta de informatie in planul timp-frecventa.

Deoarece transformarea wavelet reprezinta intr-un plan (spatiu 2D) informatia continuta intr-un semnal (spatiu 1D), este o transformare redundanta ceea ce inseamna ca coeficienti invecinati in planul timp au in comun o anumita cantitate de informatie. Teoria matematica analiza multi-rezolutie (MRA) dovedeste ca este posibil sa se esantioneze la limita planul timp, adica sa se pastreze din setul doar un set discret de coeficienti si in paralel sa se retina intreaga informatie a lui X. Aceasta procedura defineste transformarea wavelet discreta (DWT).
3.3.2 Analiza multirezolutie si transformarea wavelet discreta

Analiza multirezolutie consta dintr-o colectie de subspatii incluse unul in celalalt care satisfac urmatoarele proprietati:

Setul de functii de scalare shiftate formeaza o baza Riesz, adica sunt liniar independente in V₀ dar nu sunt neaparat ortogonale si nici nu sunt neaparat d lungime unitate.

Analiza multirezolutie implica proiectarea succesiva a semnalului X pentru a fi studiat in fiecare din subspatiile V_j.

(36)

Datorita proprietatii 2, approx_j este o aproximatie mai slaba a lui X decat approx_j-1. Pentru , toata informatia este extrasa din semnal.

Idea MRA-ului este deci de a studia un semnal prin examinarea aproximatiilor sale de diverse grade si rezolutii, prin anularea din ce in ce a mai multor frecvente inalte sau detalii din el.

Informatia care este extrasa la trecerea intre aproximatii se numeste detaliu:

(37)
MRA arata ca semnalele detaliu pot fi obtinute direct din proiectii ale lui X pe o colectie de subspatii numite subspatii wavelet. Exceptand cazul in care X apartine lui V_0,selectarea spatiului V₀ implica o pierdere inevitabila de informatie. Acest lucru este echivalent cu criteriul lui Nyquist pentru respectarea caruia trebuie facuta o filtare trece-jos. Prin varierea lui j se decide daca mai multa sau mai putina informatie se insereaza in detalii.

Functia wavelet mama trebuie sa satisfaca relatia :

Dandu-se o functie de scalare

si un wavelet mama

, transformarea discreta wavelet (DWT) consta din colectia de coeficienti :

(38)

Acesti coeficienti se definesc prin intermediul produselor interne ale lui X cu doua seturi de functii :

(39)

In studiul proceselor de scalare, urmatoarele doua caracteristici ale transformarii wavelet joaca un rol cheie :

1. baza wavelet este construita din operatorul de dilatare , astfel incat familia analizatoare prezinta prezinta o invarianta la scalare.

2. are un numar de de momente de anulare.

k=0,1,2,…N-1.

Valoarea lui N poate fi aleasa prin selectarea waveletului mama corespunzator. Transformata Fourier a lui satisface , .

Pentru calculul transformarii wavelet discrete se foloseste algoritmul piramidal rapid. Acest algoritm are o complexitate mai mica decat cele folosite pentru calculul FFT, o complexitate liniara. Acest algoritm este usor de implementat on-line si in timp real in retelele de mare viteza si astfel o estimare a parametrului de scalare bazata pe wavelet online este foarte usor de facut si eficienta.
3.4 Transformarea wavelet a proceselor de scalare

Comportamentul de invarianta la scalare poate fi definit prin faptul ca toate scarile de timp au aceeasi importanta.

Teoria wavelet a fost dezvoltata initial pentru procese de tip determinist cu energie finita, insa s-a demonstrat ca aceasta transformare poate fi aplicata si proceselor stochastice.

Pentru procesele de ordinul doi care ne intereseaza aici, se stie ca transformarea wavelet este un camp aleator de ordinul 2 cu conditia ca functia de scalare si functia mama sa satisfaca anumite conditii legate de structura de covariatie. Se presupune ca functiile de scalare si waveleturile descresc cel putin exponential in domeniul timp astfel incat statistica de ordinul doi a transformarii wavelet sa existe pentru procesele aleatoare discutate aici.

Exponenti multipli, procese multifractale. Exista clase de procese de scalare care nu pot fi descrise de catre un singur exponent de scalare si care necesita o colectie sau chiar un numar infinit de exponenti.

Se presupune un proces ale carui proprietati de scalare locale nu sunt descrise statistic de catre un parametru h. Daca procesul este auto-similar in mod determinist, acest parametru este constant. Pentru procesele multifractale, h este dependent de timp. Una din consecinte este aceea ca regularitatea locala nu mai este uniforma ci depinde de timp. In cazul miscarii browniene multifractale, h este o functie continua de t.

Flandrin si Goncalves au aratat ca evolutia in timp a lui h poate fi descrisa prin analiza coeficientilor transformatei wavelet continue la scari mici : . (40)

O alta clasa de procese de scalare cu natura multifractala este aceea pentru care h depinde nu numai de timp ci si de , unde reprezinta un element al spatiulu de probabilitati care caracterizeaza procesul. Deoarece variatia in timp a lui h devine prea complicat de urmarit, se prefera investigarea statistica a lui h. Acest lucru se poate face prin intermediul spectrului multifractal Hausdorff D(h) care consista din dimensiunea Hausdorff a setului de puncte pentru care . Acelasi spectru multifractal se obtine pentru toate realizarile lui astfel incat este un invariant folositor in descrierea proprietatilor de scalare ale procesului. Legatura intre multifractali sau waveleturi este aceea ca incrementii implicati in studiul regularitatii locale al unei traiectorii oarecare pot fi vazuti ca exemple simple de coeficienti wavelet. Astfel s- a propus inlocuirea acestora cu coeficienti wavelet in functiile de partitie : .

3.4.1 Estimarea scalarii

3.4.1.1 Generalitati

Un instrument de analiza il constituie diagrama logscale. Prin contrast fata de problematicul comportament statistic in domeniul timp, datorat dependentei de raza lunga a nestationaritatii sau fractalitatii procesului original X(t), in domeniul wavelet avem de a face doar cu procesele stationare, cu dependenta de raza scurta, pentru fiecare j. Datorita conditiei de admisibilitate a waveletului mama, aceste procese au toate media nula. Stationaritatea permite posibilitatea medierii in timp in cadrul fiecarui proces pentru reducerea variabilitatii. Dependenta de raza scurta face ca aceste statistici sa aiba dispersie mica.

(41)

Unde n_j este numarul de coeficienti la octava j disponibili pentru analiza. Variabila aleatoare este un estimator neparametric, nedeplasat al dispersiei procesului . Din cauza dependentei de raza curta, descreste cu si este eficienta asimptotic (de dispersie minima). Variabila poate fi gandita ca un mod aproape optimal de a concentra grosul comportamentului de ordinal doi al lui X la octava j. Pentru a analiza dependenta de ordinal doi a lui X(t), trebuie studiata dependenta lui in functie de j. exista o dependenta de tip putere intre dispersia proceselor la fiecare scala si j, fiind estimatele acestei functii. Astfel, exponentul de scalare poate fi extras din panta graficului in functie de j.

Definitie: diagrama logscale (de ordinul 2) consista din dependenta

in functie de j, impreuna cu intervalele de confidenta ale lui y_j.

Yüklə 345,52 Kb.

Dostları ilə paylaş:

1 2 3 4 5 6