Universitatea titu maiorescu


UNITATEA 4. Procesarea informaţiei vizuale



Yüklə 0,51 Mb.
səhifə5/11
tarix30.01.2018
ölçüsü0,51 Mb.
#41479
1   2   3   4   5   6   7   8   9   10   11

UNITATEA 4. Procesarea informaţiei vizuale




Obiective

41

Cunoștințe preliminarii

41

Resurse necesare și recomandări de studiu

41

Durată medie de parcurgere a unității

41

Procesarea vizuală

41

Rezumat

52

Cuvinte cheie

52

Teste de autoevaluare

52

Concluzii

53


Obiective

La sfârşitul acestei prelegeri, studentul va putea :



  • Să aibă o nouă perspectivă asupra analizatorului vizual;

  • Să înţeleagă modelarea pe calculator a proceselor cognitive;

  • Să fie familarizaţi cu teroriile recunoaşterii obiectelor.

Cunoștințe preliminarii

Psihologie generală – mecanismele cognitive



Resurse necesare și recomandări de studiu

Resurse bibliografice obligatorii:

1. Miclea, M., (1997 sau 2000), Psihologie cognitivă, Polirom, Iaşi.

2. Zlate, M., (1999), Psihologia mecanismelor cognitive, Polirom, Iaşi.



Durata medie de parcurgere a unității de studiu

Este de patru ore.

Începem prin a spune că aproape 50% din suprafaţa neocortexului este implicată în prelucrarea informaţiei vizuale. Prin urmare, majoritatea informaţiilor pe care le avem despre mediul extern sunt de natură vizuală. Aceasta arată importanţa pe care procesarea informaţiei vizuale în cadrul oricărei analize a sistemului cognitiv.

Modele dezvoltate în psihologia cognitivă pentru a explica acest tip de procesare trebuie să aibă atât plauzibilitate neuronală, cât şi eficienţă în implementarea lor în reţele non-umane.



Neurobiologia procesării vizuale

Numim un fenomen ca fiind vizibil atunci când emite unde electromagnetice cu lungimi de undă între 440 şi 810 milimicroni şi care provoacă o activitate fotochimică la nivelul receptorilor.

Lumina străbate mediile transparente ale ochiului şi ajunge la retină, care are cinci straturi celulare: receptori (celule cu conuri şi bastonaşe), celule orizontale, celule bipolare, celule amacrine şi ganglioni (aceştia se prelungesc în axoni care formează nervii optici).

Retina are o structură laticeală (de reţea), celulele nervoase sunt conectate pe orizontală de celule amacrine şi celulele orizontale, iar receptorii sunt conectaţi pe verticală de celulele bipolare, ganglionare şi de nervii optici.





Fig. 1. Structura retinei (sursa www.wikipedia.com)

Această structură arată că nu se vizează procesarea întregii informaţii vizuale, ci doar a celei semnificative. Se face o diferenţere şi o procesare segregată încă de la nivelul periferic al sistemului vizual.

Pe ansamblu, unei celule ganglionare îi revin 120-130 de receptori.

Informaţia este trimisă către nucleii geniculaţi laterali din talamus, apoi către cortexul vizual (striat) unde este analizată şi se produce recunoaşterea obiectului.



Câmp receptor, celulele on-off şi off-on

Zona de pe suprafaţa retinei care modifică activitatea celulei nervoase se numeşte câmp receptor. Aceasta se întâmplă deoarece unui ganglion îi corespund mai mulţi receptori şi el nu se activeză la stimularea unui singur punct de pe retină, ci la stimularea unei arii.

Este o noţiune funcţională, nu una biologică, adică nu există o formaţiune neuronală care să reprezinte câmpul receptor, aşa cum este retina, spre exemplu.

Celulele on-off sunt acelea care intensifică rata descărcărilor electrice (frecvenţa potenţialelor de acţiune) dacă stimulul luminos cade în centrul câmpului receptor şi scade activitatea celulei nervoase, dacă stimulul se află la periferia câmpului receptor.

În contrapartidă, celulele off-on au activitate maximă dacă în centrul câmpului lor vizual este un punct negru înconjurat de fascicule luminoase (de lumină).

Activitatea celor două tipuri de celule este insensibilă la stimularea uniformă a câmpului receptor datorită inhibiţiei laterale. Existenţa acestor tipuri de celule, care îşi au sediul în corpii geniculaţi laterali, poate fi probată prin teste neurofiziologice, cât şi prin metode psihofizice, cum ar fi grilajul Hermann-Hering.





Fig. 2 Grilajul lui Hermann (1870). Privirea grilajului produce iluzia unor pete cenuşii la intersecţia canalelor albe situate între careurile negre.

Detectorii de trăsături

Hubel şi Wiesel, doi autori care au făcut experimente privind procesarea vizuală, descriu trei tipuri de detectori de trăsături - features detectors (Hubel şi Wiesel, 1959): celule simple, celule complexe şi celule hipercomplexe.



Celulele simple detectează contururi, fante luminoase sau linii. Ele sunt hiperspecializate, încât recţionează decât la un singur tip de stimul (contururi, fante, linii). O singură celulă simplă însumează activitatea mai multor celule on-off şi off-on din nucleii geniculaţi.

Celulele simple sunt organizate somatotropic, adică o anumită regiune din cortexul vizual procesează informaţia dintr-o anumită zonă a câmpului vizual, ignorând stimulii dintr-o altă locaţie.



Celulele complexe: se află în ariile striate şi parastriate şi prelucrează informaţii cu un nivel mai mare de generalitate. Ele răspund la aceeaşi categorie de stimuli indiferent de zona în care se află în câmpul vizual. Decodifică şi stimulii în mişcare.

Celulele hipercomplexe: sunt de două tipuri. Primul tip detectează stimuli identici cu cei decodificaţi de celulele complexe, dar care au o anumită dimensiune. Al doilea tip detectează unghiuri. Acest tip este foarte selectiv, unele celule detectează doar unghiuri drepte, altele doar unghiuri ascuţite, etc.

Unele cercetări sugerează că ar exista celule hipercomplexe care detectează chiar şi forme de genul triunghiului, mâinii sau chiar feţei.

Este improbabil ca forme complexe precum feţele să fie detectate de o singură celulă. În cazul în care aceasta moare, dispare şi posibilitatea de a detecta anumite obiecte precum mâinile, feţele cunoscuţilor?

Hubel şi Wiesel sugerează o organizare ierarhică a celor trei tipuri de celule, dar nu oferă destule informaţii despre această aranjare ierarhică. Nu este exclus, însă ca toate cele trei tipuri de celule să funcţioneze în acelaşi timp şi nu transmiţându-şi unele altora informaţiile în trepte.



Procesarea informaţiei vizuale

Ne vom afla la nivelul computaţional, adică vom încerca să explicăm prin modele logico-matematice cum un input specific este calculat pentru a oferi un output specific.

Cu alte cuvinte, există o multitudine de algoritmi care să calculeze o funcţie şi o multitudine de sisteme fizice (de harduri) capabile să implementeze un algoritm.

Astfel, teoriile computaţionale care explică analiza vizuală a informaţiei sunt abstracte şi formalizate, ceea ce pare nenatural pentru psihologii tradiţionalişti.

La nivel computaţional se descriu două niveluri ale procesării: procesarea primară şi procesarea secundară a informaţiei.

Procesarea primară cuprinde prelucrări pre-atenţionale cu o durată de aproximativ 200 milisecunde. Au ca scop reprezentarea în sistemul cognitiv a caracteristicilor fizice ale stimului.

Aflăm unde este stimulul, dar nu şi ce este. Avem mecanismele de detectare a contururilor, a texturii, a mişcării, a culorii şi a dispunerii spaţiale.

Procesarea secundară vizează recunoaşterea obiectelor. Are ca input rezultatele procesării primare şi ca output imaginea tridimensională a unui obiect identificat.



David Marr (1982) oferă schema generală a procesării informaţiei vizuale. Stimulii vizuali sunt transpuşi într-o schiţă primară, care este supusă unui tratament modular prin care se stabileşte:

  • poziţia şi forma

  • textura

  • culoarea

  • distanţa şi adâncimea

  • dacă este în mişcare şi cum.



Fig. 3 Schema generală a procesării informaţiei vizuale (David Marr,1982)

În urma acestor procesări modulare realizate în paralel, se produce o imagine intermediară numită şi 2½D (ca să sugereze intermediaritatea ei între imaginea bidimensională de pe retină şi imaginea tridimensioanală).

După procesarea 2½ D şi pe baza inputului ei se realizează procesarea secundară, imaginea 3D şi recunoaşterea obiectului, procesarea secundară.

Procesării primare îi corespunde decât primele două niveluri (schema primară şi imaginea 2½D), iar imaginea 3D şi recunoaşterea aparţin procesării secundare.



Caracteristici ale procesărilor primare

1. Sunt organizate pe module, care funcţionează în paralel, sunt nepentrabile cognitiv şi non-inferenţiale (nu se pot descompune în secvenţe sau paşi din care putem vedea cum este tratată informaţia).

2. Sunt independente de natura stimulului. Vor procesa la fel indiferent ce procesează.

3. Au un caracter irepresibil, automat (deschidem ochii şi vedem, fie ca vrem fie că nu vrem; auzim sunetele fie că vrem, fie că nu vrem).

4. Depind de nişte asumpţii despre realitate (asumpţia rigidităţii – prespunem că nu trăim într-un univers pulsatoriu, asumpţia unicităţii – presupunem că nu trăim într-un univers transparent, astfel că unui punct de pe retină îi corespunde un singur punct din realitate, asumpţia continuităţii – presupunem că un punct din vecinătatea unui alt punct analizat are aceleaşi caracteristici cu punctul analizat). Nu este foarte clar demonstrat dacă aceste asumpţii sunt precablate (înnăscute) în sistemul cognitiv sau sunt învăţate.

Sistemul vizual face o reconstrucţie a stimulului proiectat pe retină printr-un set de mecanisme de tip modular, din care rezultă o imagine 2½D, o imagine intermediară, centrată pe subiect (adică depinde de poziţia în care se află subiectul în raport cu stimulul), pe baza căruia se realizează recunoaşterea obiectului şi imaginea 3D. Procesarea este de tip computaţional şi se pune problema validităţii sale ecologice (este ea în concordanţă cu ceea ce se întâmplă în cazul subiecţilor umani?).



Recunoaşterea obiectelor. Procesarea secundară

În explicarea recunoaşterii obiectelor sunt implicate o serie de teorii numite teoriile recunoaşterii de patternuri (structuri).

1. Teoria şabloanelor (template): în memoria de lungă durată sunt stocate şabloane ale unor structuri, tipare care sunt “potrivite” cu inputul vizual. Sunt implicate mai multe template-uri. Se realizează o reprezentare a trăsăturilor standard ale template-ului înainte de a căuta un anume template.

2. Teoria prototipurilor: se desfăşoară un proces de comparare şi de “potrivire” între inputul vizual şi reprezentantul mintal al unei clase de obiecte. Dacă obiectul nu este recunoscut, atunci se trece la compararea cu un alt prototip.

3. Teoria analizei de trăsături: trăsăturile cheie ale unui obiect sunt comparate cu informaţia deţinută deja în memorie (identificarea literei Z se face mult mai repede dacă este într-o serie cu litere cu trăsături rotunde, cu care să nu împărtăşească prea multe trăsături comune).

Reprezentanţi ai acestor teorii:

1. O.G. Selfridge (1959). El susţine că în recunoaşterea obiectelor sunt implicate patru stadii, organizate ierarhic, de recunoaştere a trăsăturilor (autorul foloseşte metafora demonilor). Obiectul este proiectat pe retină unde este procesat biologic – demonul imaginii (image demon). Trăsăturile acestei imagini sunt analizate şi comparate (liniile, unghiurile, etc.) de demonii de trăsături (feature demons). Componenetele sunt apoi recunoscute şi se construiesc structuri cu sens (demonii cognitivi – cognitive demons).

În final, patternul este recunoscut ca urmare a procesului de “potrivire”, demonul decident (demonii cognitivi propuneau mai multe interpretări).

Această teorie se numeşte Pandemonium din cauza faptului că se presupune că “demonii” produc un mare haos în timp ce strigă unii la alţii, fiecare fiind inamicul celuilalt.

Este o teorie a analizei de trăsături.





Fig 4 Pandemonium (Selfridge). O reprezentare

2. I. Biederman (1987). Porneşte de la teoria computaţională a lui Marr şi presupune că sunt 36 de părţi, de volume primitive, din care sunt compuse obiectele. Acestea se numesc geoni (geons – geometrical ions).



Fig 5 Modele de geoni



Fig 6 Modele de obiecte formate din geoni

Segmentarea obiectelor se face în zonele de concavitate. Trebuie să fie identificare proprietăţile invariante, adică dacă muchiile sunt drepte, convergente, paralele, simetrice sau curbe. Apoi acestea sunt comparate cu tiparele (template-urile) aflate în memorie. Aceasta înseamnă că obiectul poate fi recunoscut şi dacă nu este în totalitate văzut şi dacă este parţial reamintit.

Este denumită şi teoria recunoaşterii după componente (recognition by components).



Fig 7 Stadiile recunoaşterii obiectelor pe baza componentelor (după Miclea, 2003)

3. Modelarea conexionistă a recunoaşterii obiectelor (McClelland şi Rumelhart, 1981). Recunoaşterea obiectelor poate fi implementată atât pe reţele binevelare, cât şi pe reţele multinivelare. Calculul netimputului se face, însă diferit. O reţea conexionistă leagă patternul vizual de numele obiectului, care este codat în sistemul verbal. O reţea va recunoaşte un obiect atunci când produce numele obiectului în momentul când detectează componentele corespunzătoare acelui obiect.

Procesarea se face folosind comparaţia între outputul dezirabil şi outputul actual, trecând prin iteraţii sau epoci succesive până la obţinerea outputului dezirabil.

4. Teorii ale recunoaşterii feţelor (V. Bruce şi A. Young, 1986). Cei doi autori Bruce şi Young sunt cei care deschid cercetările pentru recunoaşterea acestui tip de obiecte. Modelul susţinut de ei implică opt componente: o descriere iniţială (codarea structurală), analiza expresiei, analiza felului de a vorbi, procesarea selectivă a informaţiilor (procesarea direcţionată), construirea informaţiilor despre feţe, identificarea de puncte nodale ale informaţiei despre persoana în cauză, asocierea cu numele persoanei, adăugarea oricărei informaţii relevante.

Alături de întrebările de cercetare care vizează funcţionarea mecanismului recunoaşterii ca atare, o altă sumă de întrebări vizează stabililirea componentelor înnăscute şi a celor dobândite în procesarea feţelor. Alte întrebări vizează modul în care sunt procesate feţele, analitic (pe componente) sau holistic (ca întreg).

Eysenck şi Keane (2000) sugerează că avem abordări diferite în funcţie de familiaritatea feţei de procesat. În recunoaşterea feţelor familiare sunt implicate codarea structurală, informaţiile personale şi numele, iar în recunoaştera feţelor nefamiliare sunt implicate codarea, analiza expresiei şi a vorbirii şi procesarea direcţionată, selectivă.



Rezumat

Cea mai mare parte a informaţiilor despre mediul încare trăim este obţinută prin intermediul văzului. Circa jumătate dinsuprafaţa neocortexului este implicată în procesarea informaţiei vizuale.

Procesarea informaţiei vizuale la nivel computaţional se împarte în două mari stadii: procesare primară şi procesare secundară.

Procesarea primară cuprinde prelucrările preatenţionale care au ca rezultat reprezentarea, în sistemul cognitiv, a caracteristicilor fizice ale stimulului. Ele realizează separarea stimulului de fond, ne arată unde anume este acesta, nu ce anume este. Procesarea secundară vizează mecanismele implicate în recunoaşterea figurii şi obiectelor. Ele au ca input rezultatele procesărilor primare şi ca output – imaginea tridimesională a unui obiect.



Cuvinte cheie

procesare vizuală primară, procesare vizuală secundară, teorii ale recunoaşterii obiectelor



Teste de autoevaluare

  1. Ce sunt celulele on-off şi celulele off-on?

  2. Ce înseamnă procesare primară a informaţiei şi care este importanţa acesteia pentru cogniţia vizuală?

  3. Alegeţi o teorie a recunoaşterii obiectelor şi arătaţi care sunt punctele slabe ale acelei teorii.

  4. Explicaţi schema generală a procesării informaţiei vizuale (David Marr). (p. 40)

  5. Care sunt asumpţiile care guvernează procesarea vizuală şi care este importanţa lor pentru modul de procesare a informaţiei vizuale? (p. 41)

Concluzii

Analizatorul vizual este unul dintre cei mai cercetaţi analizatori în psihologia cognitivă, multe dintre rezultatele ceecetărilor fiind implementate pe calculator (programe pentru detectarea contrurilor, dectarea texturii, recunoaşterea feţelor umane, etc.).




Yüklə 0,51 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin