Universitatea babeş-bolyai cluj-napoca



Yüklə 385,79 Kb.
səhifə3/11
tarix26.10.2017
ölçüsü385,79 Kb.
#13385
1   2   3   4   5   6   7   8   9   10   11

1.2.Învățarea automată

1.2.1.Ce este învățarea automată?


Învăţarea automată (machine learning, ML), unul din sub-domeniile de bază ale inteligenţei artificiale, se preocupă cu dezvoltarea de algoritmi şi metode ce permit unui sistem informatic să înveţe date, reguli sau algoritmi. Învăţarea automată presupune în primul rând identificarea şi implementarea unei modalităţi cât mai eficiente de a reprezenta informaţii, în sensul facilitării căutării, reorganizării şi modificării lor. Alegerea modului de a reprezenta aceste date ţine atât de concepţia generală asupra modului de rezolvare a problemei, cât şi de caracteristicile datelor cu care se lucrează [2, 3].

Învăţarea nu se poate face pe baza unui set foarte mare de cunoştinţe, atât din cauza costurilor mari presupuse de acumularea unor baze de informaţii mari cât şi din cauza complexităţii memorării şi prelucrării unui volum mare de informaţii. În acelaşi timp însă, învăţarea trebuie să ducă la formularea de suficiente “reguli” atât cât să permită rezolvarea unor probleme dintr-un spaţiu mai larg decât cel pe baza căruia s-a făcut învăţarea. Adică, învăţarea trebuie să îmbunătăţească performanţa unui sistem nu doar în rezolvarea repetată a unui acelaşi set de probleme, ci şi în rezolvarea unor probleme noi. Acest lucru presupune o generalizare a unei metode de rezolvare pentru a acoperi un număr cât mai mare de instanţe posibile, dar şi păstrarea unei specializări suficiente pentru a fi identificate corect instanţele acceptate. Aceasta se poate face fie inductiv, generalizând o problemă plecând de la un set de exemple, fie deductiv, plecând de la o bază de cunoştinţe suficiente asupra universului problemei şi extrăgând date şi reguli esenţiale. Pentru a putea face acest lucru, un algoritm de învăţare trebuie să fie capabil să selecteze acele elemente semnificative pentru rezolvarea unei instanţe viitoare a problemei. Aceasta alegere se face pe baza unor criterii de selecţie numite diagonale inductive.

O altă componentă esenţială a unui algoritm de învăţare este metoda de verificare, o metodă capabilă să confirme dacă generalizările făcute sau regulile deduse se apropie mai mult de soluţia ideală decât starea anterioară a sistemului. Studiul învăţării automate a dus la descrierea a numeroase metode, variind după scop, date de antrenament, strategia de învăţare şi modalitatea de reprezentare a datelor [2].

Specificarea unei metode de învăţare automată presupune definirea următoarelor date:



  • scopul metodei şi baza de cunoştinţe necesară;

  • formalismul de reprezentare a datelor utilizate şi a celor învăţate;

  • un set de operaţii asupra datelor disponibile şi învăţate;

  • un spaţiu general al problemei în care se va specifica soluţia;

  • opţional, reguli euristice pentru căutarea în spaţiul problemei.


1.2.2.Clase de probleme de învățare automată


Algoritmii din ML pot fi clasificați după tipul de feedback pe care îl primește modelul după ce generează un rezultat. Acest criteriu determină trei clase de probleme: învățare supervizată, învățare nesupervizată și învățare prin intarire.

Învăţarea supervizată este un tip de învăţare inductivă ce pleacă de la un set de exemple de instanţe ale problemei şi formează o funcţie de evaluare (şablon) care să permită clasificarea (rezolvarea) unor instanţe noi [2]. Învăţarea este supervizată în sensul că setul de exemple este dat împreună cu clasificarea lor corectă. Aceste instanţe rezolvate se numesc instanţe de antrenament. Formal, setul de instanţe de antrenament este o mulţime de perechi atribut-valoare (x, f(x)), unde x este instanţa, iar f(x) - clasa căreia îi aparţine instanţa respectivă. Despre acest tip de probleme se va discuta pe larg în capitolul următor.

Învăţarea nesupervizată elimină complet necesitatea unor instanţe de antrenament, deci şi problemele legate de acestea. Scopul învăţării nesupervizate nu este definit anterior ca un concept ţintă, algoritmul fiind lăsat singur să identifice concepte posibile. În general, învăţarea nesupervizată presupune existenţa unor instanţe neclasificate, un set de reguli euristice pentru crearea de noi instanţe şi evaluarea unor concepte deduse, eventual un model general al spaţiului de cunoştinţe în care se găsesc aceste instanţe. Un algoritm de învăţare nesupervizată construieşte concepte pentru a clasifica instanţele, le evaluează şi le dezvoltă pe cele considerate “interesante” de regulile euristice. În general, concepte interesante sunt considerate cele care acoperă o parte din instanţe, dar nu pe toate. Astfel, invăţarea nesupervizată permite identificarea unor concepte complet noi plecând de la date cunoscute [2].

Învăţarea prin întarire se face fără ca algoritmul de învăţare să compare direct şablonul obţinut cu rezultatele corecte pentru exemplele de antrenament. În schimb, este implementată o modalitate de a “răsplăti” sau “pedepsi” sistemul în funcţie de cât de mult se apropie de rezultatul corect. Acest feedback este singura metodă a sistemului de învăţare de a se regla pentru îmbunătăţirea rezultatelor sale. Acest lucru face învăţarea prin întărire mai dificilă, căci sistemul nu mai primeşte informaţii directe despre cum şi cât să se corecteze, ci doar ştie dacă se apropie sau se depărtează de rezultatul optim. De asemenea, feedback-ul poate veni doar uneori, nu neapărat la fiecare schimbare în şablonul ipotetic, deci sistemul trebuie să aibă o modalitate de a direcţiona şi impulsiona singur schimbarea pentru îmbunătăţirea şablonului [2].

Există două tipuri de informaţie ce pot face parte din feedback-ul primit de sistem în cazul învățării prin întărire:



  • informaţie utilitară, prin care sistemul învaţă utilitatea unei anumite stări în care se află şi care permite sistemului să caute acele stări care maximizează şansa de a găși o soluţie optimă;

  • valoarea unei acţiuni, adică sistemul află potenţialul unei acţiuni de a fi sau nu utilă într-o anumită stare, practic potenţialul unei acţiuni de a apropia sistemul de găsirea unei soluţii optime. 



1.2.3.Aplicații ale învățării automate


Există multe aplicații cu algoritmi de ML folosite în practică și numărul acestora crește semnificativ în fiecare an. Este important de menționat că până în 1985 nu exista aproape nicio aplicație comercială care să folosească ML [4]. Vom menționa câteva domenii în care se aplică ML.

Recunoașterea vorbirii. Aproape toate aplicațiile comerciale curente pentru recunoașterea vorbirii folosesc ML într-o formă sau alta pentru antrenarea sistemului de recunoaștere. Motivul este simplu: acuratețea recunoașterii vorbirii este mai mare dacă sistemul este antrenat decât dacă este programat de mână.

Vederea artificială. Multe sisteme curente, de la cele de recunoaștere de fețe la cele care clasifică imagini microscopice de celule, sunt dezvoltate folosind ML. Una din aplicațiile vederii artificiale folosită la scară largă este sistemul folosit de Oficiul Poștal din SUA pentru sortarea automată a scrisorilor care conțin adrese scrise de mână. Mai mult de 85% din scrisorile scrise de mână în SUA sunt sortate automat, folosindu-se un algoritm de analiză a scrisului de mână antrenat prin ML cu un set de date foarte mare [4].

Controlul roboților. Tehnicile de ML au fost folosite cu succes în mai multe sisteme de roboți. De exemplu, un grup de cercetători au demonstrat folosirea ML pentru a obține strategii de control pentru un zbor stabil al unui elicopter și pentru acrobații cu elicopterul. De asemenea, competiția sponsorizată de DARPA pentru un robot care să conducă autonom mai mult de 100 de mile în deșert a fost câștigată de un robot care folosea ML pentru a-și dezvolta abilitatea de a detecta obiecte la distanță [4].

Cercetări în științe noi. Multe științe în care se lucrează cu un volum imens de date folosesc tehnici de ML pentru a facilita descoperirile științifice. Algoritmi din ML sunt folosiți pentru a învăța modele de descriere a genelor din celule, pentru a descoperi obiecte astronomice neobișnuite din setul imens de date colectat de Sloan Sky Survey, pentru a caracteriza modelele complexe de activare a părților creierului în scanerele fMRI [4].

Yüklə 385,79 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin