UNITATEA 3. Paradigmele psihologiei cognitive. Paradigma clasic simbolică şi paradigma neoconexionistă
Obiective
|
27
|
Cunoștințe preliminarii
|
27
|
Resurse necesare și recomandări de studiu
|
27
|
Durată medie de parcurgere a unității
|
27
|
Paradigmele psihologiei cognitive. Paradigma clasică simbolică şi paradigma neoconexionistă
|
28
|
Rezumat
|
38
|
Cuvinte cheie
|
38
|
Teste de autoevaluare
|
38
|
Concluzii
|
39
|
Obiective
La sfârşitul acestei prelegeri, studentul va putea :
-
Să înţeleagă temele principale şi fundamentele psihologiei cognitive;
-
Să aibă o perspectivă nouă asupra sistemului cognitiv uman;
-
Să compare şi să înţeleagă diferenţele dintre cele două paradigme.
Cunoștințe preliminarii
Psihologie generală – mecanismele cognitive
Resurse necesare și recomandări de studiu
Resurse bibliografice obligatorii:
1. Miclea, M., (1997 sau 2000), Psihologie cognitivă, Polirom, Iaşi.
2. Zlate, M., (1999), Psihologia mecanismelor cognitive, Polirom, Iaşi.
Durata medie de parcurgere a unității de studiu
Este de 4 ore.
În psihologia cognitivă există astăzi două modele de explicare şi de raportare la sistemul cognitiv, numite paradigme (modelări): paradigma simbolică, numită şi clasică sau computaţională, şi paradigma (neo)conexionistă.
Paradigma simbolică, clasică sau computaţională
În funcţie de tipul reprezentărilor şi de modalităţile de tratare ale acestora putem identifica două paradigme în care se discută despre sistemul cognitiv: paradigma clasic-simbolică şi paradigma neoconexionistă.
Paradigma clasică simbolică a orientat dezvoltarea psihologiei cognitive, ca şi a ştiinţelor cognitive în general, fiind şi prima, din punct de vedere cronologic. Ea porneşte de la ideea că toate cunoştinţele şi stările de lucruri sunt reprezentate în sistemul cognitiv prin simboluri sau structuri simbolice.
Simbolurile sunt reprezentări care denotă obiecte sau stări de lucruri şi se supun unor reguli de combinare, au o “gramatică”, care nu mai ţine seama de cunoştinţele sau propoziţiile a căror simbolizare sunt. De exemplu, pq (p implică q sau dacă p, atunci q). La origine a fost o situaţie reală de cauzalitate pe care copilul a observat-o în realitate, daca aprindem becul, atunci se face lumină. Sistemul reprezintă sau simbolizează acest fapt în limbajul său propriu, să zicem că becul este p şi q este lumina (în cameră), iar implicaţia, care este o relaţie şi nu are sens fără termenii săi, este reprezentată prin săgeată. Dar dacă observăm, termenii pot fi înlocuiţi cu o infinitate de obiecte şi relaţia se păstrează. Aşa că această relaţie este transferabilă la o infinitate de situaţii. De mici, copiii pot extrapola această relaţie, imediat ce au „prins” înţelesul. Prin urmare, această teorie poate explica cum funcţionează mintea umană, ca structură simbolică şi funcţională. Abstractizarea şi raţiunea (procese psihice de înalt nivel) pot fi explicare ca manipulare de simboluri.
Pentru a putea opera cu cunoştinţele, calculatorul, ca şi creierul, trebuie ca mai întâi să le codeze în structuri simbolice. Newell şi Simon spun că sistemul cognitiv uman, cât şi calculatorul, sunt sisteme fizico-simbolice. Fizice, deoarece sunt instanţiate neurobiologic, şi simbolice deoarece, pentru a putea opera cu informaţia, sistemul o reprezintă în forma unor simboluri sau expresii simbolice care se agregă după nişte reguli sau funcţii.
Apariţia aceste teorii a fost susţinută de succesele înregistrate de formalizarea logicii, de apariţia gramaticilor generative şi a lingvisticii teoretice care au dus la ideea că sistemul psihic uman este un sistem de manipulare a simbolurilor.
Aplicarea paradigmei simbolice clasice a fost susţinută, în special, la explicarea proceselor cognitive centrale şi în primul rând la rezolvarea de probleme (stare iniţială, stare finală şi blocul de operatori, care premite trecerea de la starea iniţială la cea finală).
Cercetătorii care operează în această paradigmă urmăresc să creeze programe pe calculator care să mimeze sau să simuleze aspecte ale funcţionării cognitive umane pentru a înţelege cogniţia umană. Aceasta se numeşte computational modelling. Spre deosebire de ştiinţa computaţională cognitivă, inteligenţa artificială implică construrirea de sisteme care produc rezultate (răspunsuri) inteligente, dar procesul implicat în tratarea de informaţie poate să fie foarte diferit de cel folosit de oameni (vezi definiţia sistemului inteligent al lui A.Turing).
Începând cu acest model de explicare a sistemului cognitiv, putem vorbi despre metafora computerului cu privire la explicarea sistemului cognitiv uman.
Ea se numeşte “clasică” deoarece foloseşte idei dezvoltate în lucrările unor filosofi cum ar fi Leibniz, Descartes (raţionalismul continental) sau Hobbes, Locke, Hume (empirismul englez).
Arhitecturile cognitive (AC)
În cadrul realizării unei arhitecturi cognitive accentul cade pe intracţiunea dintre structuri.
Termenul de AC este împrumutat din inteligenţa artificială.
OBS. Termenul de inteligenţă artificială (eng. artificial intelligence) desemnează acea parte a tehnologiei informaţiei care se ocupă cu realizarea de structuri cognitive inteligente care nu au obligatoriu structură şi asemănare cu cele umane. Modelarea pe calculator (eng. computer modelling) este implementarea pe calculator a funcţiilor şi structurilor cognitive specific umane, pentru o mai bună înţelegere a lor.
AC sunt totalitatea mecanismelor, cognitiv impenetrabile (vezi Pylyshyn, 1984, 1990) necesare şi suficiente pentru realizarea unui comportament inteligent (deci sunt „comuter modelling”).
Sunt aspecte ale sistemului cogitiv care rămân în cea mai mare parte invariabile de la un subiect la altul, la tipuri de sarcini şi în timp.
La baza lor stau sistemele de producere şi regulile de producere (production systems and production rules): condiţionali şi sisteme de condiţionali de tipul „dacă...atunci”.
Newell şi Simon (1972) au fost primii care au relevat valoarea sistemelor de producere în rezolvarea de probleme.
Modelul ACT-R (Adaptative Control of Thought - Rational), pe care îl propunem în contiuare pentru analiză, este dezvoltat de J.R. Anderson între anii 1993 to 2008. Site-ul oficial: http://act-r.psy.cmu.edu/.
Este de inspiraţie computaţională şi dezvoltă un model general al funcţionării cognitive umane şi a rezolvării de probleme, în special.
Asumpţiile (presupoziţiile) majore ale teoriei ACT-R sunt:
1. Sistemul cognitiv are şase module care funcţionează relativ independent unul de celelalte.
2. Patru sunt importante pentru cogniţie şi pentru rezolvarea de probleme:
- modulul de recuperare: conţine indiciile sau cheile de accesare a informaţiilor. Este localizat în cortexul prefrontal inferior ventrolateral.
- modulul imagistic: transformă problema în reprezentare vizuală. Este situat în cortexul parietal posterior.
- Modulul scopului: urmăreşte intenţiile unui subiect şi controlează procesarea informaţiilor. Este localizat în cortexul cingulat anterior.
- Modulul procedural: utilizează regulile de producere, daca...atunci, pentru a determina care va fi următoarea acţiune întreprinsă. Se află în ganglionii bazali, în capătul nucleului caudal.
- Celelalte module sunt: modulul motor şi modulul vizual.
3. ariile cerebrale corespunzătoare celor patru module sunt activate în general de sarcini complexe, cu toate că fiecare este activată de factori realativi diferiţi.
4. fiecare modul are un buffer asociat lui, care conţine o cantitate limitată de informaţie.
5. cunoaşterea umană poate fi redusă la două tipuri de reprezentări: declarative şi procedurale.
Această arhitectură, implementată pe calculator, poate rula pe oricare calculator, adică poate rezolva probleme, dacă se descarcă codul-sursă şi calculatorul deţine limbajul Common Lisp.
Exemple de alte arhitecturi:
-
4CAPS, dezvoltat la Carnegie Mellon University sub coordonarea lui Marcel A. Just
-
ACT-R, dezvoltat de Carnegie Mellon University sub coordonarea lui John R. Anderson.
-
Apex dezvoltat de Michael Freed la NASA Ames Research Center.
-
CHREST, dezvoltat de FernandGobet la Brunel University şi de Peter C. Lane la University of Hertfordshire.
-
CLARION the cognitive architecture, dezvoltat de Ron Sun la Rensselaer Polytechnic Institute şi la University of Missouri.
-
Copycat, al lui Douglas Hofstadter şi Melanie Mitchell la Indiana University.
-
DUAL, dezvoltat de New Bulgarian University sub coordonarea lui BoichoKokinov.
-
EPIC, dezvoltat de David E. Kieras and David E. Meyer la University of Michigan.
-
FORR dezvoltat de Susan L. Epstein la The City University of New York.
-
GAIuS dezvoltat de Sevak Avakians.
-
CoJACK o arhitectură inspirată de ACT-R, JACK, un multi-sistem care adaugă o arhitectură cognitivă pentru a simula în mediul virtual comportamente asemănătoare cu cele umane.
-
PreAct, dezvoltat de Dr. Norm Geddes la ASI.
-
PRODIGY, al lui Veloso et al.
-
PRS 'Procedural Reasoning System', dezvoltat de Michael Georgeff şi Amy Lansky la SRI International.
-
Psi-Theory dezvoltat de Dietrich Dörner la Otto-Friedrich University în Bamberg, Germany.
-
R-CAST, dezvoltat de Pennsylvania State University.
-
Soar, dezvoltat de Allen Newell and John Laird la Carnegie Mellon University şi la the University of Michigan.
-
Society of mind and şi succesoarea sa Emotion machine dezvoltate de Marvin Minsky.
-
Subsumption architectures, dezvoltate de Rodney Brooks (încă se dezbate dacă sunt totuşi cognitive).
Paradigma (neo)conexionistă
Este cunoscută şi sub numele de paradigma procesărilor paralele distribuite sau de modelarea neuromimetică.
Porneşte de la ideea că activitatea cognitivă poate fi explicată pe baza unor modele de inspiraţie neuronală. Un sistem cognitiv este format dintr-o reţea de neuroni formali (simplificaţi).
Primele încercări de a pune în aplicare această idee au fost făcute în 1943 de Pitts si McCullogh. Rosenblatt (1958) a construit pe baza cercetărilor celor doi o reţea neuromimetică cu două niveluri numită perceptron.
În urma cercetărilor lui Minsky şi Papert (1969) care demonstrau incapacitatea reţelelor de tip perceptron de a calcula funcţii logice simple: “ca”, “de exemplu”, “sau” (exclusiv), dezvoltarea în această direcţie a fost abandonată.
În anii ’80 însă, McClelland şi Rumelhart publică lucrarea Parellel Distributed Processing: Exploration in the Microstructure of Cognition (1986) şi volumul 2, Psychological and Biological Models (1987). După această dată, renaşte conexionismul în forma pe care o cunoaştem astăzi, numită neoconexionism.
Spre deosebire de paradigma simbolică (ce considera cunoaşterea ca o manipulare de simboluri), conexionismul susţine că reprezentarea informaţiei în sistemul cognitiv este constă în activarea unor unităţi simple (neuromimi) pe baza unor patternuri şi valori de activare.
Prin urmare, sistemul cognitiv este o reţea (neuromimetică, adică imită reţeaua neuronală) în care informaţia circulă între unităţile de procesare nu sub formă de mesaje, ci sub formă de valori de activare; sub formă de scalari, nu de simboluri (D.A. Norman, 1986).
Reţelele neuromimetice
Neoconexionismul susţine o modelare a procesării la nivelul algoritmic-reprezentaţional (a se vedea cursul despre nivelurile de analiză ale sistemului cognitiv) printr-o reţea neuromimetică.
Informaţia este reprezentată la nivelul sistemului cognitiv uman prin valori şi patternuri de activare ale unor unităţi (neuromimi).
O reţea neuromimetică este formată din:
1. o mulţime de unităţi;
2. o stare de activare;
3. o regulă de activare;
4. o funcţie output;
5. un pattern de conexiuni între aceste unităţi;
6. reguli de învăţare;
7. un mediu (o ambianţă) în care operează reţeaua.
Să le luăm pe rând pentru a le explica.
Unităţile
Se numesc unităţi cognitive, neuroni formali sau noduri. Unităţile au caracteristici asemănătoare cu ale neuronilor: valoarea de activare şi asocierea într-o reţea. Valoarea de activare este notată printr-o cifră cuprinsă în intervalul -1, +1.
Într-o reţea sunt unităţi de input (receptează şi convertesc în valori de activare semnalele externe) şi unităţi de output (care transmit în mediu răspunsul reţelei). Acestea sunt unităţi vizibile pentru că pot fi accesate direct din mediul reţelei.
Între unităţile vizibile de input şi de output sunt interpuse unităţi care nu pot fi accesate decât prin intermediul acestora. Acestea se numesc unităţi ascunse.
Dacă o reţea este formată din unităţi vizibile (de input şi de output), atunci ea se numeşte binivelară. Dacă este formată atât din unităţi vizibile, cât şi din unităţi ascunse, reţeaua se numeşte multinivelară.
Neuromimii nu sunt interpretabili semantic, adică nu semnifică lucruri, concepte, fapte (aşa cum era în cazul simbolurilor). Spunem că reţelele neuromimetice sunt semantic-opace. La fel se întâmplă şi cu creierul, un neuron nu deţine un concept sau un obiect sau o stare. Reţeaua de neuroni cu totul poate deţine aşa ceva sau poate procesa un concept, o stare sau identifica un obiect, de aici şi sintagma procesări paralel-distribuite. Reţeaua procesează, nu doar un singur neuron / neuromim.
Dacă o atribuire a semnificaţiei este totuşi făcută (artificial, de către creatorul reţelei), putem distinge două tipuri de reţele:
1. Localizaţionaliste, se consideră că fiecare unitate este un concept. Aceasta este însă, o interpretare exterioară, ea nu este regăsită implicit în reţea.
2. Distributive, informaţia este distribuită pe interacţiunile dintre unităţi (de exemplu, un concept sau o propoziţie nu sunt reprezentate de o singură unitate, ci de patternul de conexiuni dintre mai multe unităţi ale reţelei). În acest caz, unităţile sunt neinterpretabile semantic.
Stările de activare
Acestea sunt valori care definesc starea unei unităţi la un moment dat. Sunt notate numeric, de la -1 la +1 (şi nu numai, pot fi alese şi alte intervale), astfel că o reţea conexionistă este o matrice de valori de activare (0.2, 0, 0,5).
Fiecare unitate are un rest de activare ca rezultat al stimulărilor trecute (întocmai ca un neuron). Acest rest de activare face ca o reţea neuomimetică să aibă ca o caracteristică intrinsecă un potenţial de urmă (întocmai ca o reţea neuronală), care face ca o unitate (un neuron) să răspundă mai rapid în cazul în care îi este solicitat un răspuns identic cu cel dintr-o fază anterioară.
Rata descreşterii stării de activare se numeşte rata degradării (decay rate), fiind o altă caracteristică intrinsecă a unei reţele neuromimetice, similară cu o reţea neuronală.
Regula de activare
Este o funcţie care stabileşte modul în care se modifică valoarea de activare a unităţilor dintr-o reţea. Modificarea valorii se face pe baza netinputului. Acesta este suma ponderată a valorilor de activare recepţionate. Procesul este similar cu cel petrecut în reţelele neuronale.
Funcţia output
Stabileşte relaţia dintre valoarea de activare a unei unităţi şi outputul pe care ea îl transmite altor unităţi. În cazul unei reţele conexioniste un programator poate stabili un prag al stării de activare sub care valoarea outputului este zero, iar deasupra acestui prag outputul este egal cu valoarea de activare. Găsim şi în acest caz similarităţi cu reţeaua neuronală.
Conexiunile
Nodurile, unităţile unei reţele sunt legate prin conexiuni. Când conexiunile sunt orientate într-o singură direcţie de la unităţile input spre unităţile output, reţeaua este unidimensională (feed-forward network). Dacă conexiunile sunt reciproce, reţeaua este interactivă.
Conexiunile, la fel ca în cazul cerierului, sunt excitative şi inhibitive.
Ele sunt excitative când ponderea este pozitivă 0i,j<1, unde W este ponderea, iar i şi j sunt două unităţi oarecare.
Conexiunile sunt inhibitive dacă ponderea este negativă.
Conexiunile sunt elemente importante ale reţelei conexioniste deoarece o unitate reprezintă ceva pentru reţea în funcţie de conexiunile pe care le are. Acestea îi oferă valoarea de activare.
Regulile de învăţare
Sunt algoritmi sau ecuaţii care guvernează ponderea conexiunilor dintr-o reţea. Modificarea tăriei conexiunilor se face în funcţie de regulile de învăţare. Regulile de învăţare sunt similare regulilor de manipulare a simbolurilor din paradigma clasică.
Menţionăm trei reguli de învăţare:
Regula lui Hebb
Ponderea unei conexiuni creşte dacă unităţile au o stare de activare de acelaşi semn (ambele pozitive sau ambele negative) şi scade dacă se află în stări de activare opuse.
Ponderea conexiunii dintre două unităţi se modifică în funcţie de produsul valorilor de activare. Proporţia cu care se va modifica ponderea conexiunii este modulată de rata învăţării (aceasta este stabilită de creatorul reţelei).
Prin urmare, avem relaţia:
Wu,i= lr · au · ai
Adică ponderea conexiunii de la unitatea i la unitatea u depinde de rata învăţării (lr) înmulţită cu valoarea de activare a unităţilor u şi i.
Regula delta (Widrow-Hoff)
Această regulă utilizează discrepanţa între outputul dezirabil (du) şi outputul actual (au).
Cu alte cuvinte, ponderea unei conexiuni se modifică cu atât mai mult cu cât eroarea (diferenţa) dintre outputul dezirabil şi outputul actual este mai mare.
Wu,i= lr(du – au)ai
Dacă du = au ponderea conexiunilor rămâne neschimbată. Înseamnă că reţeaua a dat răspunsul dorit.
Regula retropropagării erorii (delta generalizată)
Este o extindere a regulii delta la reţelele multinivelare. Eroarea dintre du şi au se propagă invers de la unităţile output spre unităţile ascunse şi spre unităţile de input.
Mai întâi se calculează ponderea pe care două unităţi au avut-o în propagarea erorii pe baza regulii delta, apoi se modifică tăria legăturii dintre ele după contribuţia pe care au avut-o la apariţia erorii.
Wu,h= lr delta au ah
Mediul sau ambianţa reţelei
Orice reţea conexionistă (ca şi orice reţea neuronală) este în legătură cu structuri mai generale, pot fi şi alte reţele, care o influenţează şi creează mediul reţelei.
Influenţa mediului apare într-un model conexionist sub forma unor biaşi (bias), adică a unor inputuri cu valori fixe şi independenţi de activitatea reţelei (de exemplu, gravitaţia, temeratura din încăpere, umiditatea, calitatea materialelor din care este construită, etc).
Concluzii:
Nu alegem, când explicăm cum funcţionează un sistem cognitiv, între una dintre paradigme.
Paradigma clasică ne oferă un model de funcţionare a unei reţele când vorbim despre procesarea la un nivel complex, central. Paradigma conexionistă ne oferă un model când vorbim de procesări la un nivel periferic.
Rezumat
Principalele metafore explicative prezente în psihologia cognitivă sunt: metafora calculatorului şi metafora creierului. Acestea sunt asociate cu două paradigme fundamentale: paradigma simbolică(numită şi clasic-simbolică) şi paradigma conexionistă (numită şi neo-conexionistă). Teza principală a paradigmei clasice-simbolice din psihologia cognitivă este aceea potrivit căreia cunoştinţele sunt reprezentate în sistemul cognitiv prin simboluri sau structuri simbolice. Conform metaforei calculatorului, sistemul cognitiv al oamenilor poate fi înţeles cel mai bine prin analogie cu un cadru de procesare a informaţiei. Paradigma (neo)conexionistă, cunoscută şi sub denumirea de paradigma procesărilor paralele distribuite (PDP) sau modelare neuronală porneşte de la ideea că activitatea cognitivă poate fi explicată pe baza unor modele de inspiraţie neuronală. Conform metaforei creierului, cogniţia umană este cel mai bine înţeleasă în termeni ai proprietăţilor creierului.
Cuvinte cheie
Paradigmele psihologie cognitive, paradigma clasic-simbolică, paradigma (neo)conexionistă, metafora creierului, metafora calculatorului, arhitecturi cognitive, simboluri, reţele neuromimetice.
Teste de autoevaluare
-
Redactaţi un eseu în care să comparaţi cele două paradigme din psihologia cognitivă (pp. 25-32).
-
Subliniaţi punctele slabe şi punctele tari ale fiecărei paradigme (pp.25-32).
-
Care sunt cele două metafore ale paradigmelor prezentate şi ce semnificaţie au ele? (pp. 25-32)
-
Din ce este alcătuită o reţea neuromimetică? (pp. 27-32)
-
Ce reprezintă „simbolul” pentru paradigma clasică? (p. 25)
Concluzii
Sunt câteva concepte şi teorii care guverneză peisajul psihologiei cognitive astăzi, cele două paradigme concurente disputându-şi supremaţia în demonstrarea faptului că asumpţiile lor sunt cele mai potrivite pentru a explica funcţionarea sistemului cognitiv uman.
Dostları ilə paylaş: |