Fidelitatea se referă la măsurarea lipsită de erori
Reflectă acurateţea şi stabilitatea scorurilor la test
Poate fi măsurată statistic prin utilizarea coeficienului de corelaţie
definiţie...
Fidelitatea reprezintă tradiţional: “precizia, consistenţa şi stabilitatea măsurării realizate de test".
Termenii de “consistenţă” şi “stabilitate” continuă să fie utilizaţi şi în prezent în legătură cu fidelitatea testelor, având sensul de repetabilitate a rezultatelor măsurării.
Standards for Educational and Psychological Tests, 1985, definesc fidelitatea ca fiind “gradul în care scorurile testului sunt consistente sau repetabile, adică gradul în care ele nu sunt afectate de erorile de măsură".
Probleme privind măsurarea
Testele încearcă să măsoare o trăsătură sau caracteristică psihologică utilizând o unitate de măsură care este influenţată de surse de eroare
Scopul măsurării este de a găsi scorul real al persoanei şi a reduce eroarea de măsurare
Eroare standard de estimare, SEE – indică cât de mult, în medie, variază scorul unei persoane de la scorul real al acesteia
consecinţă
Orice test psihologic este fidel dacă îndeplineşte următoarele cerinţe:
este lipsit de erori de măsură , deci este precis
orice persoană obţine scoruri egale la test şi la o formă paralelă a acestuia în situaţia când erorile de măsură la cele două teste pentru orice persoană sunt independente.
erori de măsură
erorile de măsură sunt aleatoare nu sistematice, deci sunt complet nepredictibile, indiferent de cunoştinţele pe care le avem despre persoanele măsurate sau despre procesul de măsurare.
În consecinţă, corect este să nu vorbim despre fidelitatea unui instrument e măsură ci despre fidelitatea acelui test aplicat pe o anumită populaţie şi în anumite condiţii.
A. Coeficienţii de stabilitate- se calculează prin metoda test-retest, corelând scorurile obţinute la test şi la retest (acelaşi test aplicat după un interval de timp). Arată cât de stabile sunt scorurile în timp.
B. Coeficienţii de echivalenţă- rezultă din metoda formelor paralele, prin corelarea scorurilor obţinute la două teste paralele, administrate aproape în acelaşi timp. Arată cât de asemănătoare sunt cele două instrumente de măsură.
C. Coeficienţii consistenţei interne- se calculează în cadrul analizei consistenţei interne, pe baza scorurilor obţinute la un test administrat o singură dată. Din această categorie fac parte coeficientul a al lui Cronbach, coeficientul 3 al lui Guttman şi coeficienţii Kuder- Richardson. Ei indică concordanţa diferitelor părţi ale testului.
D. Coeficienţii de fidelitate inter evaluatori- se calculează pentru teste al căror scor este rezultatul aprecierii subiective făcute de evaluator. Ei arată în ce măsură părerile mai multor evaluatori concordă între ele.
Determină dacă scorurile variază în timp; se măsoară prin testarea persoanei în două momente diferite (interval de timp) şi apoi se corelează scorurile obţinute
Problema principală: scorurile sunt influenţate de aspecte are ţin de atât de administare cât şi de persoana testată
Ca urmare, procedura tinde să supraestimeze fidelitatea. Este nevoie de un nivel de corelare de .90 (.80 este un nivel “acceptabil” al corelaţiei)
test-retest: procedură
Metoda test-retest evaluează gradul în care scorurile obţinute la un test de acelaşi subiect sunt constante de la o administrare la alta.
Se procedează astfel:
(1) Se administrează testul unui grup de persoane.
(2) După un interval de timp se administrează testul, aceloraşi persoane, în aceleaşi condiţii ca şi prima dată.
(3) Se calculează coeficientul de corelaţie liniară între scorurile observate în cele două situaţii.
Valoarea obţinută se foloseşte pentru estimarea fidelităţii testului, considerându-se că testul este paralel cu el însuşi, ceea ce înseamnă că între cele două administrări ale sale, scorurile reale ale persoanelor nu s-au schimbat.
test-retest
Coeficientul de corelaţie calculat prin această metodă se numeşte coeficient de stabilitate. Metoda test-retest este utilă atunci când scorurile reale ale testului măsoară caracteristici durabile, generale şi specifice, ale persoanelor.
test - retest
Dezavantajul metodei test-retest constă în faptul că pretinde două administrări ale testului, ceea ce necesită timp şi cheltuieli materiale
Fidelitatea determinată prin utilizarea unor forme paralele / alternative
Utilizează de obicei 2 forme diferite ale aceluiaşi test; ambele forme sunt date tuturor subiecţilor în cadrul aceleiaşi şedinţe, echilibrând administarea ca test prim şi secundar
Dacă nu sunt date în acceaşi zi, se numeşte “forme alternative întârziate”
Sunt corelate cele două scoruri ale aceleiaşi persoane
forme paralele – procedură:
Metoda formelor paralele constă în administrarea a două teste, care reprezintă instrumente de măsură paralele, la momente foarte apropiate unul de altul şi determinarea coeficientului de corelaţie liniară între scorurile observate ale celor două forme. Valoarea calculată se numeşte coeficient de echivalenţă.
Dacă cele două teste sunt paralele şi dacă pentru fiecare persoană erorile de măsură la cele două administrări sunt variabile aleatoare independente, atunci coeficientul de echivalenţă coincide cu coeficientul de fidelitate al fiecărui test.
forme paralele: metoda înjumătăţirii
Un caz particular al metodei formelor paralele îl constituie metoda înjumătăţirii (split-half). În literatura de specialitate, aceasta este inclusă uneori în cadrul analizei consistenţei interne.
split-half – procedură:
Metoda înjumătăţirii are următorii paşi:
Se administrează testul unui lot de persoane.
Se împarte testul în două părţi cât mai asemănătoare între ele.
Se calculează coeficientul de corelaţie între scorurile observate la cele două jumătăţi.
forme paralele -utilitate
Metoda formelor paralele este potrivită în cazul când se urmăreşte măsurarea unor caracteristici generale ale persoanelor.
Obs.
Asemenea caracteristici vor influenţa în acelaşi mod scorurile ambelor teste.
Măsoară statistic consistenţa internă a testului, formula KR estimând care este fidelitatea medie dacă ai administra testul realizând toate tipurile de înjumătăţiri posibile
Un tip special este KR – 20, care realizează acelaşi lucru pentru acele teste unde itemii sunt dihotomici
coeficienţi de consistenţă internă:
Coeficienţi de consistenţăinternă indică măsura în care itemii testului se referă la acelaşi lucru.
Metoda analizei consistenţei interne utilizează pentru estimarea fidelităţii unui test dispersiile şi covarianţele scorurilor observate ale itemilor. Se practică o singură administrare a testului. Pe baza scorurilor le itemilor se calculează de obicei unul dintre următorii coeficienţi:
coeficientul Alfa(α) al lui Cronbach;
coeficientul Lambda (λ) al lui Guttman;
coeficientul ρ: r20 sau r21 al lui Kuder-Richardson (dacă itemii testului sunt binari).
consistenţă internă – utilitate:
Aceşti coeficienţi sunt utili pentru calculul fidelităţii testelor care măsoară o caracteristică (trăsătură) unidimensională. Indică caracterul omogen al itemilor testului sau scalei acestuia.
Coeficienţi de fidelitateinter-evaluatori
În cazul testelor care nu au o cotare obiectivă, cum sunt testele proiective sau cele de creativitate, scorurile subiecţilor sunt influenţate şi de persoana care face evaluarea răspunsurilor.
Pentru a verifica în ce măsură scorurile testului sunt dependente de cel care a făcut cotarea, se calculează coeficientul de corelaţie liniară între scorurile atribuite aceloraşi subiecţi de evaluatori diferiţi.
Eroarea standard de măsurare
Un indice statstic care exprimă fidelitatea
Indică care este influenţa fidelităţii asupra interpretării scorurilor testului:
Cu cât indicele ESM (SEM) este mai mic cu atît este mai mare fidelitatea
SEM =DS 1- F
Factori care afectează fidelitatea
Numărul de itemi: adăugarea de itemi poate creşte fidelitatea datorită faptului că se lărgeşte reprezentativitatea domeniului
Formula spearman – Brown poate fi utilizată pentru a estima de câţi itmei ai nevoie pentru a atinge nivelul dorit de fidelitate
Itemi buni şi itemi slabi: se realizează o analiză de itemi, respectiv o corelare a fiecăruia dintre itemi şi scorul total al testului, sau modul cum sunt încărcaţi de un factor care este asociat testului (trăsătura ţintă)
Atenuarea, reprezintă gradul de descreştere al fidelităţii datorat erorii de măsurare
Pentru a estima fidelitatea fără nici o eroare de măsurare se poate folosi o statistică denumită “Corectarea pentru atenuare” (de ex., Corelaţia reală dintre variabile)
Coeficient de corelaţie
Calcul statistic care reflectă situaţia în care două variabile sunt corelate semnificativ, co-variază; dar chiar şi situaţia unei corelaţii puternice nu ne da dreptul să vorbim despre cauzalitate
Coeficient de corelaţie: reflectă acele puncte care tind sa se grupeze de-a lungul aceleiaşi linii; corelaţia poate fi pozitivă, peste 0, sau negativă, sub zero şi evoluează între + 1 şi – 1
Nivelul de semnificaţie statistică al unei corelaţii: se caută în tabelul “t” pentru a afla dacă relaţia este determinată de altceva decît şansă, întâmplare...
Sursele de variaţie ale erorii în funcţie de tipul de fidelitate:
test - retest : eşantionarea timpului
forme alternative (aplicare imediată) : eşantionarea conţinutului
forme alternative (la interval mai mare de timp) : eşantionare timp şi conţinut
împărţirea în două jumătăţi: eşantionarea conţinutului
Kuder-Richardson: eşantionarea conţinutului şi eterogenitatea acestuia
inter evaluatori : diferenţe de caracteristici ale personalităţii evaluatorilor
SEE eroarea standard de estimare
Este deviaţa standard a rezidurilor (diferenţa dintre scorurile reale şi cele anticipate)
Este o măsură a acurateţii predicţiei: cu cît este mai mare SEE cu atît este mai puţin acurată predicţia
Interpretarea coeficienţilor de fidelitate
Când avem de ales dintr-o mulţime de teste având toate celelalte caracteristici egale, este de preferat testul care are cea mai mare fidelitate. Dar, testul cel mai fidel poate fi cel mai scump sau mai dificil de administrat. Dar, caracteristicile testelor sunt rareori egale.
Reguli:
Se vor cere nivele înalte de fidelitate testelor folosite pentru a se lua decizii importante asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor diferenţe relativ mici între ei. În selecţia profesională, de pildă, se vor folosi teste care au coeficienţi de fidelitate mai mari decât 0.90.
reguli...
Se vor accepta nivele scăzute de fidelitate atunci când testele se utilizează pentru a lua decizii preliminare, nu finale, şi în cazul testelor care împart persoanele într-un număr mic de categorii, pe baza unor diferenţe individuale mari.
Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de fidelitate poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, testul se foloseşte pentru compararea persoanelor, una cu alta, coeficientul său de fidelitate trebuie să fie mai mare decât 0.85.
În practică se folosesc adesea teste care sunt valide pentru populaţia şi situaţia în care sunt administrate, dar care nu au coeficienţi de fidelitate foarte mari
interpretarea coef...2
Nu este posibil să se specifice un nivel minim care să fie impus coeficienţilor de fidelitate ai tuturor testelor. În practica obişnuită sunt utile următoarele recomandări:
1. Se vor cere nivele înalte de fidelitate testelor folosite pentru a se lua decizii importante asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor diferenţe relativ mici între ei. În selecţia profesională, de pildă, se vor folosi teste care au coeficienţi de fidelitate mai mari decât 0,90(J. C. Nunnally, după Hammond, 1995).
2. Se vor accepta nivele scăzute de fidelitate atunci când testele se utilizează pentru a lua decizii preliminare, nu finale, şi în cazul testelor care împart persoanele într-un număr mic de categorii, pe baza unor diferenţe individuale mari.
interpretarea coef...3
3. Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de fidelitate poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, însă testul se foloseşte pentru compararea persoanelor, una cu alta, coeficientul său de fidelitate trebuie să fie mai mare decât 0.85 (Aiken, 1994).
Observaţii practice:
Fidelitatea chestionarelor de personalitate şi a celor de interese tinde să fie mai mică decât cea a testelor cognitive (de cunoştinţe, de inteligenţă, de aptitudini speciale, Aiken, 1994).
În general, se întâlnesc de obicei coeficienţi de fidelitate cuprinşi între 0.70 şi 0.98 (Guilford, 1965).
Testele cotate obiectiv care măsoară aptitudini cognitive pot furniza, în loturi eterogene de persoane, coeficienţi de fidelitate mai mari decât 0.8.
interpretarea coef...4
Testele cotate subiectiv care măsoară aptitudini, testele de cunoştinţe şi cele care evaluează performanţe tipice (de exemplu chestionare de personalitate) au, adesea, coeficienţi de fidelitate mai mici decât 0.80 (Traub, 1994).
Testele standardizate de cunoştinţe au, în general, o fidelitate mare spre moderată.
Testele cu alegere multiplă pot avea o fidelitate mai scăzută. Coeficientul lor de fidelitate este apropiat de 0.75.
În practică se folosesc adesea teste care sunt valide pentru populaţia şi situaţia în care sunt administrate, dar care nu au coeficienţi de fidelitate foarte mari.