Cos’è l’inferenza causale e i metodi utilizzati per rappresentare graficamente e algebricamente la causalità all’interno di una rete

Abbiamo bisogno di trovare un modo per riuscire a capire perché qualcosa succede.

I dati in sé possono infatti mostrarci soltanto la correlazione che esiste tra essi, senza però riuscire a spiegare il motivo di tale correlazione—cosa che cercheremo di fare tramite l’inferenza causale.

Uno dei problemi dei network baeysiani è che la rappresentazione di una data distribuzione di probabilità non è unica, dunque si ha equivalentemente

{\bf P}(A,\,B)={\bf P}(A \mid B){\bf P}(B)={\bf P}(B \mid A){\bf P}(A)

Dove dunque non siamo in grado di distinguere le due diverse rappresentazioni che potremmo avere per tale network

Abbiamo bisogno di un modello causale che ci permetta di distinguere le diverse situazioni in cui possiamo trovarci, dunque la correttezza di un certo network per rappresentare un problema.

Definizione intuitiva: una variabile X è causa di un’altra variabile Y se il valore di Y è in qualche modo basato su quello di X. Diciamo che XascoltaY.

Definizione rigorosa: quando si verifica la situazione descritta nella definizione intuitiva, chiamiamo tale modello uno structural causal model (SCM), dove distinguiamo due diversi tipi di variabili:

  • Variabili esogene: dipendono da fattori esterni
  • Variabili endogene: dipendono da fattori interni

Oltre a tali variabili un SCM è caratterizzato dalla presenza di un insieme di funzioni che esprimono le relazioni tra le variabili.

Esempio: esprimiamo la causalità tra il salario C basandoci sull’educazione A e sull’esperienza B (assegnamo dei coefficienti arbitrari):

U=\{A,\,B\},\quad V=\{C\},\quad F=\{f_C\}\\\Downarrow\\ f_C: \textcolor{00ffa1}{C}\leftarrow\textcolor{33eae4}{2A+3B}

Nota: il termine in verde rappresenta gli effetti, mentre quelli in azzurro le cause. Diciamo che X è una causa diretta di Y se essa è presente nell’espressione f_Y, altrimenti diciamo semplicemente che essa è causa di Y. Nell’esempio, A e B sono cause dirette di C, però potrebbero anche esserci altre variabili sconosciute al problema che rappresentano delle semplici cause.

Non sempre si riesce a trovare l’effettiva relazione F tra due o più variabili, dunque talvolta possiamo indicare le relazioni semplicemente tramite il simbolo f_i, come di seguito

G=U_1\\
H=f_1(G,\,U_2)\\
P=f_2(G,\,G,\,U_3)

Per rappresentare la rete

In altri casi invece possiamo esprimere in maniera più precisa le relazioni tra la diverse variabili.

Nota: se le variabili U_1,\,\dots,\, U_n sono indipendenti tra loro possono essere omesse nella rappresentazione grafica, mentre non possono essere sottointese all’interno delle equazioni.

Decomponiamo ora la seguente rete

Trovando al suo interno delle configurazioni di reti comuni—che andremo ad analizzare singolarmente.

Chain

f_C:C=U_1\\f_R:R=C\wedge U_2\\f_W:W=R\vee U_4\\[10pt]W\perp\kern-5pt\perp C \mid R

Fork

f_C:C=U_1\\f_R:R=C\wedge U_2\\f_S:S=\neg C\vee U_3\\[10pt]R\perp\kern-5pt\perp S \mid C

Collider

f_R:R=C\wedge U_2\\f_S:S=\neg C\vee U_3\\f_W:W=R\vee S\vee U_4\\[10pt]R\,\cancel{\perp\kern-5pt\perp}\,S\mid W

Tali dipendenze/indipendenze condizionate tra variabili vengono espresse in maniera più formale tramite il concetto di D-Separation, spiegato nella relativa pagina.

Esercizio: Dato il grafo in figura seguente, segnare tutte le risposte corrette

\begin{aligned}&\square \quad B \perp\kern-5pt\perp E \mid A\\&\square\quad B\,\,\cancel{\perp\kern-5pt\perp}\,E\mid A\\[10pt]&\square\quad B\perp\kern-5pt\perp J\mid A\\&\square\quad B\,\,\cancel{\perp\kern-5pt\perp}\,J \mid A\\[10pt]&\square\quad J\perp\kern-5pt\perp M\mid A\\&\square\quad J\,\,\cancel{\perp\kern-5pt\perp}\,M\mid A\end{aligned}
Soluzione
  • B\,\,\cancel{\perp\kern-5pt\perp}\,E\mid A infatti si tratta di un collider.
  • B\perp\kern-5pt\perp J\mid A infatti di tratta di una chain.
  • J\perp\kern-5pt\perp M\mid A infatti si tratta di una fork.

In poche parole

‎‏‏‎✅ L’inferenza causale è il processo mediante il quale cerchiamo di comprendere le ragioni o i motivi che stanno dietro ad un fenomeno o ad un evento. Ciò va oltre la semplice correlazione tra le variabili e mira a individuare le relazioni di causa-effetto.

‎‏‏‎✅ Per rappresentare graficamente la causalità all’interno di un network, si utilizzano grafi causali o diagrammi di Bayes. Questi grafi mostrano le variabili come nodi e le relazioni causali tra di esse come archi direzionati. I nodi rappresentano le variabili mentre gli archi rappresentano la direzione della causalità.

‎‏‏‎✅ Per rappresentare la causalità algebricamente, si utilizzano modelli causali strutturali (SCM). Gli SCM descrivono le relazioni causali tra le variabili attraverso un insieme di funzioni. Le variabili possono essere esogene (dipendenti da fattori esterni) oppure endogene (dipendenti da fattori interni). Le funzioni definiscono le relazioni tra le variabili all’interno del modello causale.

‎‏‏‎✅ Alcuni esempi di strutture causali includono Chain, Fork, e Collider. Queste strutture rappresentano diverse configurazioni di relazioni causali tra le variabili e possono essere identificate sia graficamente che attraverso equazioni che descrivono tali relazioni.

Se hai trovato errori o informazioni mancanti scrivi a:
giacomo.dandria@esercizistem.com

Se hai trovato errori o informazioni mancanti scrivi a:
giacomo.dandria@esercizistem.com

Questa pagina è stata utile?
No
Torna in alto