Inteligenţa Artificială studiază entităţile inteligente



Yüklə 220,58 Kb.
səhifə5/11
tarix02.03.2018
ölçüsü220,58 Kb.
#43645
1   2   3   4   5   6   7   8   9   10   11

Tipuri de agenţi:

Există numeroase tipuri de agenţi inteligenţi, în funcţie de informaţia făcută explicită şi folosită în procesul de decizie. Programele agent diferă prin modul în care iau în considerare percepţiile, acţiunile, scopurile şi mediul. Câteva clase de agenţi inteligenţi:




Agenţi bazaţi pe reflexe simple:
Un agent bazat pe reflexe simple (agent reflex) răspunde imediat la o secvenţă de intrare. Un agent reflex realizează o conexiune între situaţia curentă (percepută) şi o acţiune. Aceste conexiuni sunt memorate sub forma unor reguli de producţie sau reguli condiţie – acţiune.

Programul unui agent reflex este foarte simplu. El caută regula a cărei parte de condiţie se potriveşte cu situaţia curentă (cum este ea definită de percepţie) şi efectuează acţiunea asociată cu această regulă.


Agenţi care păstrează o imagine a lumii:
Un agent uman alege o anumită acţiune în funcţie de condiţiile exterioare şi de starea sa internă. În anumite situaţii un agent artificial trebuie să menţină o anumită informaţie asupra stării interne pentru a distinge între stări ale lumii care generează aceeaşi secvenţă perceptuală dar sunt în mod esenţial diferite (necesită acţiuni diferite).

Modificarea stării interne necesită ca programul agentului să includă două tipuri de informaţii(cunoştinţe):



  • informaţii despre felul cum lumea (universul, domeniul de competenţă al agentului) evoluează independent de agent

  • informaţii despre felul în care acţiunile agentului afectează lumea

Agentul este capabil să interpreteze o nouă secvenţă perceptuală (o nouă situaţie) în lumina cunoaşterii pe care o are despre lume (codificată în starea internă). El foloseşte informaţia despre cum evoluează lumea pentru a păstra o urmă a părţii nevăzute a lumii. Agentul trebuie să ştie în ce fel acţiunile sale interferează cu starea lumii.

Unui agent reflex i se pot asocia stări interne. În acest caz starea curentă se combină cu starea internă pentru a genera o nouă stare curentă. Acţiunea agentului se bazează pe căutarea unei reguli a cărei condiţie se potriveşte cu situaţia curentă aşa cum este definită de secvenţa perceptuală şi de starea internă. Apoi se efectuează acţiunea asociată cu această regulă.
Agenţi bazaţi pe scop:
Aceşti agenţi acţionează în sensul îndeplinirii scopului lor. Cunoaşterea stării curente a mediului nu este întotdeauna suficientă pentru a selecta o acţiune corectă. Uneori agentul are nevoie şi de o anumită informaţie asupra scopului, care descrie situaţiile ce sunt de dorit. Programul agentului poate combina această informaţie cu cea despre rezultatele acţiunilor sale pentru a alege acţiunile care permit atingerea ţelului propus.

Agenţi bazaţi pe utilitate:
Scopul nu este întotdeauna suficient pentru a genera cea mai bună strategie (sau comportare) a unui agent. Scopul realizează o distincţie casantă între stările favorabile şi cele nefavorabile. Asociind fiecărei stări o măsură a performanţei putem compara diferite stări, sau secvenţe de stări, din punctul de vedere al satisfiabilităţii sau utilităţii lor pentru agent.

Utilitatea este o funcţie U definită pe mulţimea S a stărilor cu valori în mulţimea numerelor reale:



U : S  R

Funcţia de utilitate permite luarea unor decizii raţionale în cazul scopurilor conflictuale. În cazul în care există mai multe scopuri, dar nici unul nu poate fi atins cu certitudine, funcţia de utilitate furnizează o metodă prin care probabilitatea de succes şi importanţa scopurilor nu pot fi comparate.

Putem admite că utilitatea unei stări măsoară gradul de satisfacţie pe care o are agentul dacă atinge starea respectivă. Prin urmare un agent bazat pe utilitate tinde să-şi maximizeze propria satisfacţie.

      1. Modelul general al unui agent care învaţă:

Un agent care învaţă poate fi împărţit în patru componente conceptuale. Distincţia cea mai importantă care trebuie făcută este între elementul de învăţare, care este responsabil de a face îmbunătăţiri, şi elementul de performanţă, care este responsabil de a selecta acţiuni externe. Elementul de performanţă este ceea ce până acum am considerat a fi întregul agent: primeşte percepţiile şi alege acţiunile. Elementul de învăţare vede cum se descurcă agentul şi stabileşte cum ar trebui modificat elementul de performanţă pentru a acţiona mai bine în viitor.






Fig.2.2.1 Modelul general al unui agent care învaţă
Criticul îi spune elementului de învăţare cât de bine se descurcă agentul. Criticul se foloseşte de un standard fix al performanţei. Acest lucru este necesar deoarece percepţiile nu dau nici o indicaţie despre succesul agentului. De exemplu, un program de şah poate primi o percepţie care indică faptul că i-a dat mat adversarului său, dar este nevoie de un standard al performanţei pentru a ştii dacă acesta este un lucru bun deoarece percepţia nu i-o spune. Este important ca standardul de performanţă să fie o măsură fixă aflată în exteriorul agentului, altfel agentul ar putea ajusta standardul de performanţă pentru ca acesta să arate că este bun comportamentul său.

Generatorul de probleme este responsabil de a sugera acţiuni care ar putea conduce la noi informaţii. Daca elementul de performanţă ar face totul, fără a fi întrebat generatorul de probleme, acesta ar alege acţiunile cele mai bune având în vedere ceea ce cunoaşte agentul la un moment dat. Dar dacă agentul ar explora puţin şi ar alege acţiuni suboptimale pe termen scurt, ar putea descoperi acţiuni mult mai bune pe termen lung. Treaba generatorului de probleme este de a sugera aceste acţiuni de explorare.

Să considerăm exemplul unui agent care este şofer de taxi. Elementul de performanţă este alcătuit din colecţia de cunoştinţe şi proceduri pe care le are agentul pentru a putea selecta acţiunile necesare conducerii maşinii (întoarcerea, accelerarea, frânarea, etc.). Agentul conduce maşina folosind acest element de performanţă. Elementul de învăţare formulează ţelurile, de exemplu, să înveţe cum se comportă maşina pe un drum umed. Criticul observă lumea şi trimite informaţiile la elementul de învăţare. De exemplu, dacă şoferul trece rapid de pe o bandă pe alta fără a semnaliza, criticul observă iritarea celorlalţi participanţi la trafic şi îi transmite aceste observaţii elementului de învăţare. Acesta formulează o regulă care spune că este greşită schimbarea benzii fără semnalizare şi elementul de performanţă se va modifica prin adăugarea acestei noi reguli. Din când în când generatorul de probleme dă agentului o sugestie. De exemplu: dacă este aglomerată strada, generatorul de probleme i-ar putea sugera agentului să încerce să meargă pe o stradă paralelă şi să vadă dacă nu cumva aceasta este mai rapidă decât calea aleasă iniţial.

Elementul de învăţare mai este responsabil şi de îmbunătăţirea eficienţei elementului de performanţă. De exemplu, dacă şoferului de taxi i se va cere să meargă pe o rută nouă, acesta îşi va consulta harta pentru a găsi drumul cel mai scurt. Când i se va solicita din nou acest traseu, şoferul nu va mai căuta pe hartă căci deja va cunoaşte acest traseu.


      1. Yüklə 220,58 Kb.

        Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin