Home » Intelligenza Artificiale » 📋 URL
Un network bayesiano, o rete bayesiana, è un modello grafico probabilistico che rappresenta le relazioni di dipendenza tra un insieme di variabili casuali attraverso un grafo diretto aciclico (DAG). Questo tipo di modello è chiamato “bayesiano” perché si basa sul teorema di Bayes per l’inferenza probabilistica.
Ogni nodo nel grafo rappresenta una variabile casuale, e le connessioni tra i nodi indicano l’influenza diretta delle variabili una sull’altra.
Ai diversi nodi della rete sono associate delle distribuzioni di probabilità che rappresentano le probabilità del nodo dato lo stato dei suoi genitori nel grafo.
Un network bayesiano può essere utilizzato per risolvere problemi di inferenza probabilistica utilizzando la legge della probabilità totale, che decomposta tramite la procedura chiamata chain rule porta ad ottenere la seguente espressione:
\tag{$\spades$}P(x_1,\,\dots,\,x_n)=\prod_j P(x_j \mid x_1,\,\dots,\,x_{j-1})
Di fatto, (\spades) può essere espansa velocemente nel caso di problemi con poche variabili. Per esempio, nel caso di sole tre variabili diventa
P(x_1,\,x_2,\,x_3)=P(x_3 \mid x_1,\,x_2)P(x_2 \mid x_1)P(x_1)
Nota bene: se x_j è indipendente da tutti i suoi predecessori eccetto un sottoinsieme di essi (che chiameremo i genitori (parents) di x_j), allora possiamo scrivere (\spades) come
\tag{$\clubs$}{\bf P}(x_1,\,\dots,\,x_n)=\prod_j {\bf P}(x_j \mid \text{Parents}(x_j))
Chain
Utilizzando (\clubs) possiamo esprimere il network bayesiano in figura
come
\tag{$\alpha$}P(X,\,Y,\,Z)=P(Z \mid Y)P(Y \mid X)P(X)
Nota bene: le due variabili X e Z sono condizionalmente indipendenti data Y
Ricordando la formula della probabilità condizionale e l’equivalenza (\alpha) possiamo scrivere
P(Z \mid X,\,Y)=P(Z \mid Y)
Fork
Utilizzando (\clubs) possiamo esprimere il network bayesiano in figura
Come
\tag{$\beta$}P(X,\,Y,\,Z)=P(Y \mid X)P(Z \mid X)P(X)
Nota bene: le due variabili X e Z sono condizionalmente indipendenti data Y. Usando l’equivalenza (\beta) possiamo scrivere
P(Y,\,Z \mid X)=P(Y \mid X)P(Z \mid X)
Collider
Utilizzando (\clubs) possiamo esprimere il network bayesiano in figura
Come
P(X,\,Y,\,Z)=P(Z \mid X,\, Y)P(X)P(Y)
Nota bene: le due variabili X e Y sono indipendenti non data Z. Non avendo la variabile Z, tra X e Y non c’è alcuna relazione quindi possiamo semplicemente moltiplicarne le probabilità per ottenere P(X,\,Y)
P(X,\,Y)=P(X)P(Y)
Esempio: immaginiamo di avere due dadi. Chiamiamo X il risultato del primo dado e Y quello del secondo. Z rappresenta invece la somma dei dadi. Supponiamo che ci venga detto che Z=7. Automaticamente, i valori di X e Y si determinano a vicenda appena è noto uno dei due. Per esempio, se ci viene detto che X=2, automaticamente l’unico valore che può essere assunto da Y è 5, altrimenti si avrebbe Z\neq7. Similmente, se X=1,\,Y=\dots
Soluzione
Y=6
Esercizio: utilizzare (\clubs) per esprimere il network bayesiano in figura
Soluzione
P(W,\,Z,\,X,\,Y)=P(W \mid Z)P(Z \mid X,\,Y)P(X)P(Y)
In poche parole
✅ Un network bayesiano è un modello grafico che rappresenta le dipendenze tra variabili casuali tramite un grafo aciclico diretto. I nodi del grafo rappresentano le variabili e le connessioni indicano l’influenza diretta tra di loro. Le distribuzioni di probabilità condizionata associate ai nodi rappresentano le probabilità delle variabili date le loro dipendenze. Questi modelli possono essere utilizzati per risolvere problemi di inferenza probabilistica utilizzando la distribuzione congiunta delle variabili.