3.2.Serii de timp
O serie de timp este o secvență de puncte de date, de obicei măsurate la intervale egale de timp. Seriile de timp apar în mod natural în multe situații reale [15]. De exemplu:
-
Economie: cifrele lunare pentru somaj, numărul de internări în spitale, etc.
-
Finante: valorile zilnice ale cursului de schimb, valorile prețurilor acțiunilor cotate la bursă, etc.
-
Mediu: cantitatea zilnică de precipitații, valorile zilnice pentru calitatea aerului din atmosferă, etc.
-
Medicină: activitatea undelor cerebrale la fiecare 2-8 secunde.
Previzionarea seriilor de timp constă în folosirea unui model care prezice valori în viitor, bazându-se pe valorile înregistrate în trecut. Aceste modele iau în considerare faptul că evenimentele luate de-a lungul timpului sunt corelate într-un anumit fel sau au un caracter periodic.
Vom menționa cele mai importante măsuri de evaluare a unui model predictiv de regresie. Fie că avem: p – vectorul valorilor prezise, a – vectorul valorilor așteptate, n – numărul de instanțe.
Mean Squared Error. Este o formulă foarte utilizată pentru măsurarea erorii unui model de regresie. Are dezavantajul ca poate fi comparată doar între modele care au eroarea masurată în aceeași unitate de masură.
Root Mean Squared Error. Este rădăcina pătrată a formulei de mai sus.
Relative Squared Error. Este o formulă care poate fi folosită pentru a compara două modele pentru care erorile sunt măsurate în unități de măsură diferite [16].
Mean Absolute Error. Valoarea formulei are aceeași unitate de masură ca și eroarea modelului. Poate fi folosită doar pentru a compara modele care au aceeași unitate de măsură pentru eroare [16].
Relative Absolute Error. O formulă care poate fi folosită pentru a compara modele care au unități de măsura diferite pentru erori [16].
Capitolul 4. Studiu de caz: Previziunea vremii folosind tehnici de învățare automată
În acest capitol vom prezenta problema previzionării temperaturii atmosferice folosind algoritmi dezvoltați în domeniul inteligenței artificiale. Există metode tradiționale pentru a construi modele care dau rezultate bune pentru previzionarea indicatorilor meteorologici. Însă în acest studiu de caz ne propunem să investigăm utilitatea tehnicilor de învățare automată pentru predicții ale vremii. Dacă presupunem că temperatura în viitorul apropiat depinde de valorile indicatorilor atmosferici din trecutul imediat, se poate deriva o metodă care să învețe din datele din trecut și care să construiască un model care să dea estimări apropiate ale temperaturii în perioada imediat următoare, pentru o anumită locație. Tehnicile de învățare automată folosite în acest studiu sunt: rețele neuronale, programare genetică și mașini cu suport vectorial. Pentru a cerceta acest subiect, au fost realizate trei tipuri de experimente, pentru care sunt indicate și rezultatele obținute. Se prezintă și o scurtă analiză a rezultatelor, comparându-le cu cele obținute în studii similare.
4.1.Aspecte generale
Previziunea vremii este definită ca fiind aplicarea științei și a tehnologiei pentru prezicerea stării atmosferei pentru o anumită locație. Oamenii au încercat să prezică vremea informal de milenii și formal din secolul al XIX-lea [17]. Prognozele meteo sunt făcute colectând date cantitative despre starea curentă a atmosferei și folosind descoperiri științifice despre procesele atmosferice pentru a estima cum va evolua atmosfera.
Predicția stării vremii este un proces complex și o problemă dificilă pentru cercetători. Aceasta necesită expertiză în diverse domenii științifice și tehnologice. Însă prognozele meteo sunt esențiale pentru anumite activități. Acestea include: monitorizarea climatică, detecția secetei, prezicerea situațiilor critice, planificarea în agricultură, planificarea în producerea de energie regenerabilă, industria acvatică și multe altele.
Tradițional, estimările pentru temperatura din viitorul apropiat sunt făcute cu ajutorul modelării numerice a observațiilor și a datelor obținute de la senzori și radare. Ca o alternativă, această lucrare propune o abordare diferită, bazată pe tehnici de învățare automată.
Acest studiu de caz urmăreste să investigheze folosirea rețelelor neuronale artificiale, a programării genetice și a mașinilor cu suport vectorial pentru a construi modele care să prezică temperatura pentru o anumită locație și care sunt antrenate cu exemple de date care să descrie starea vremii în trecut, pentru locația respectivă.
În această secțiune vom prezenta problema previzionării vremii, explicând în același timp motivația studierii acestei teme.
4.2.1.Context
Ideile fundamentale ale prognozii numerice a stării vremii și a modelării climatice au fost dezvoltate cu un secol în urmă, cu mult înaintea apariției primului calculator electronic. Dar erau căteva obstacole majore care trebuiau trecute pentru ca predicția numerică să fie pusă în practică [18].
O mai bună înțelegere a dinamicii atmosferei a permis dezvoltarea unor sisteme simplificate de ecuații; observațiile regulate ale atmosferei făcute de radiosonde și, mai apoi, datele venite de la sateliți au oferit condițiile inițiale; mai apoi, au fost dezvoltate și schemele stabile cu diferențe finite. Toate acestea și calculatoarele electronice puternice au oferit o modalitate practică de a efectua calcule complexe necesare pentru a prezice schimbările meteorologice [18].
Odată cu dezvoltarea inteligenței artificiale și a învățării automate, este natural să cercetăm posibilitatea construirii unor programe pe calculator care nu au algoritmi predefiniți pentru a genera predicții, ci învață din datele disponibile și își adaptează modelul în concordanță cu noile exemple de date procesate.
Este adevărat cu specialiștii de domeniu încă nu au descoperit modalități de a face calculatoarele să învețe la fel de bine cum o fac oamenii. Cu toate acestea, există algoritmi inventați relativ recent care sunt eficienți pentru anumite tipuri de probleme de învățare și o înțelegere teoretică a conceptului de învățare a inceput să se formeze. În ultimii ani, au fost dezvoltate numeroase programe de calculator care demonstrează tehnici eficiente de învățare și au aparut diverse aplicații comerciale care pun în practica aceste concepte și care au fost folosite cu succes [3].
4.2.2.Motivație
Daca ne uităm la problema previzionării vremii ca la o încercare de a identifica relații între date și de a le folosi pentru a face predicții, atunci o putem vedea ca o problemă de analiză a unei serii de timp, pentru că încercăm să construim un model care să prezică valori din viitor, bazându-ne pe valorile observate anterior. Și este cunoscut faptul că tehnicile de învățare automată sunt potrivite pentru a studia serii de timp [19].
Așadar, scopul nostru este de a implementa și a testa programe care să folosească învățarea automată, și anume: rețele neuronale, programarea genetică și mașini cu suport vectorial pentru a prezice vremea. Programele vor procesa un set de date cu valori din trecut pentru indicatori meteorologici, pentru o anumită locație, cu scopul de a antrena un model care să fie capabil să genereze estimări destul de bune pentru valorile viitoare ale indicatorilor doriți.
Mai exact, în acest studiu de caz, ne propunem să studiem posibilitatea previzionării temperaturii medii pentru o zi următoare, folosind ca date de intrare pentru model valorile unor indicatori meteorologici din zilele precedente. Indicatorii care vor fi considerați sunt: temperatura medie, temperatura maximă, temperatura minimă, punctul de rouă, viteza vântului și cantitatea de precipitații.
Dostları ilə paylaş: |