Principiile Analizei Căilor

Descărcat de pe pagina Facultății de Psihologie a Universității din Exeter: crab.rutgers.edu

Analiza căilor este o extensie directă a regresiei multiple. Scopul ei este să ofere estimări ale magnitudinii și semnificației legăturilor cauzale ipotetice între diferite seturi de valori. Aceasta e cel mai simplu de explicat utilizând o diagramă de cale.

Pentru a construi o diagramă de cale, pur și simplu scriem numele variabilelor și desenăm câte o săgeată de la fiecare variabilă către oricare dintre celelalte variabile pe care credem că le influențează.  Putem distinge diagrame de cale de tip intrare și de tip ieșire. O diagramă de cale de tip intrare este una care este schițată din timp pentru a ajuta în planificarea analizei și reprezintă legăturile cauzale prezise de ipoteza noastră. O diagramă de cale de tip ieșire reprezintă rezultatele unei analize statistice și reflectă descoperirile făcute.

Așadar, am putea avea o diagramă de cale de tip intrare precum cea de mai jos:

Figura 1: O diagramă de cale de tip intrare idealizată

Sau o diagramă de cale de tip ieșire precum următoarea:

Figura 2: O diagramă de cale de tip ieșire idealizată

Este util a desena săgețile astfel ca grosimea lor să fie proporțională mărimii ipotetice sau de facto a coeficienților căii. Uneori, este util de eliminat relațiile negative prin oglindirea variabilelor. Spre exemplu, în loc de a ilustra o relație negativă între vârstă și viziunile liberale se poate ilustra o relație pozitivă între vârstă și viziunile conservatoare. Uneori nu vrem să specificăm direcția legăturii cauzale dintre 2 variabile: în acest caz folosim o săgeată cu două vârfuri. Alteori, legăturile ale căror coeficienți sunt mai mici decât o oarecare magnitudine absolută sau care nu ating un anumit nivel de semnificație sunt omise în diagrama de cale de tip ieșire.

Unii cercetători adaugă o săgeată adițională direcționată spre fiecare nod al diagramei ce ține locul unei variabile dependente pentru a indica varianța neexplicată – acea varianță a variabilei datorată unor factori care nu au fost incluși în analiză.

Diagramele de cale pot fi mult mai complexe decât cele ilustrate. Pentru un caz ilustru, vezi Wahlund (1992, Fig 1).

Deși analiza căilor a devenit foarte populară, trebuie să ținem cont de o notă de avertizare formulată de Everitt and Dunn (1991): ”Oricât de convingătoare, respectabilă și logică o diagramă de cale… ar putea părea, orice inferențe cauzale extrase rareori reprezintă ceva mai mult decât o formă de fantezie statistică”. Practic, datele de corelație rămân a fi de corelație. În cadrul unei oarecare diagrame de cale analiza căilor ne poate arăta care căi sunt mai importante (și semnificative), iar aceasta poate avea implicații pentru plauzibilitatea ipotezelor cauzale prestabilite. Dar analiza căilor nu ne poate arăta care din două diagrame de cale distincte este preferabilă și nici nu ne poate arăta dacă corelația dintre A și B reprezintă un efect cauzal al A asupra lui B, un efect cauzal al B asupra lui A, dependența mutuală de alte variabile C, D, etc. sau un amestec al celor menționate. Nici un program nu poate ține cont de variabilele care nu sunt incluse în analiză.

În așa caz, la ce folosește o analiză a căilor? Cel mai evident răspuns este că, dacă două sau mai multe ipoteze cauzale prestabilite pot fi reprezentate în aceeași diagramă de cale de tip intrare, mărimea relativă a coeficienților de cale în diagrama de cale de tip ieșire ne-ar putea sugera care dintre ipoteze este mai bine susținută de date. Spre exemplu, în Figura 4 de mai jos, ipoteza precum că vârsta ar afecta nivelul de satisfacție profesională în mod indirect, prin intermediul efectelor asupra venitului și autonomiei în lucru este preferabilă ipotezei conform căreia vârsta are un impact direct asupra satisfacției profesionale. În mod un pic mai subtil, dacă două sau mai multe ipoteze cauzale prestabilite sunt reprezentate în diagrame de cale de tip intrare diferite, iar diagramele de cale de tip ieșire corespunzătoare diferă în complexitate (astfel că una din ele conține multe căi cu coeficienți moderați, iar alta conține doar câteva căi cu coeficienți mari și semnificativi și toate celelalte căi au coeficienți neglijabili), atunci s-ar putea să preferăm ipoteza asociată cu diagrama mai simplă. Totuși, acest ultim argument nu este tocmai statistic, chiar dacă efectuarea analizei statistice ne oferă evidența pentru a face astfel de raționamente.

Analiza căilor în practică

Bryman și Cramer oferă un exemplu clar utilizând patru variabile dintr-un sondaj în legătură cu joburile: vârsta, venitul, autonomia, satisfacția în legătură cu jobul respectiv. Ei propun că vârsta are un efect direct asupra satisfacției profesionale. Totuși, sunt sugerate și efectele indirecte ale vârstei asupra satisfacției profesionale: vârsta afectează venitul, care, la rândul său, afectează satisfacția; vârsta afectează autonomia, care, la rândul său, afectează satisfacția; și vârsta afectează autonomia, care afectează venitul, care afectează satisfacția. Autonomia și venitul au efect direct asupra satisfacției.

Figura 3: Diagrama de tip intrare a relațiilor cauzele în sondajul legat de joburi, conform lui Bryman și Cramer (1990)

Pentru a ajunge la diagrama de tip ieșire de la această diagramă de tip intrare, trebuie să calculăm coeficienții de cale. Un coeficient de cale este un coeficient de regresie standardizat (ponderea beta). Îl calculăm prin formularea unor ecuații structurale. În acest caz:

satisfacția = b11 vârsta + b12 autonomia + b13 venitul + e1 venitul = b21 vârsta + b22 autonomia + e2 autonomia = b31 vârsta + e3

Noi am folosit un sistem de notare pentru coeficienți diferit de cel folosită de Bryman și Cramer pentru a ilustra în mod clar că b11 din prima ecuație este diferit de b21 din a doua. Termenii e1, e2, și e3 reprezintă eroarea sau varianța neexplicată. Pentru a obține coeficienții de cale, pur și simplu efectuăm trei analize de regresie, utilizând rând pe rând satisfacția, venitul și autonomia pe post de variabilă dependentă și folosind variabilele independente specificate în ecuații. Valorile constante (a1, a2 și a3) nu sunt utilizate. Așa că varianta finală a diagramei de cale de tip ieșire arată astfel:

Figura 4: Diagrama de tip ieșire a relațiilor cauzale în sondajul legat de joburi, conform lui Bryman și Cramer (1990)

Dacă valorile e1, e2 și e3 sunt necesare, ele sunt calculate ca rădăcina pătrată din 1-R2 (atenție, nu 1-R2adj) din ecuația de regresie pentru variabila dependentă corespunzătoare.