A Review of Bayesian Networks and Structure Learning

Sieci bayesowskie i ropoznawanie zaleznosci strukturalnych
This article reviews the topic of Bayesian networks. A Bayesian network is a factorisation of a probability distribution along a directed acyclic graph. The relation between graphical d-separation and independence is described. A short article from 1853 by Arthur Cayley [8] is discussed, which contains several ideas later used in Bayesian networks: factorisation, the noisy ‘or’ gate, applications of algebraic geometry to Bayesian networks. The ideas behind Pearl’s intervention calculus when the DAG represents a causal dependence structure and the relation between the work of Cayley and Pearl is commented on. Most of the discussion is about structure learning, outlining the two main approaches, search and score versus constraint based. Constraint based algorithms often rely on the assumption of faithfulness, that the data to which the algorithm is applied is generated from distributions satisfying a faithfulness assumption where graphical dseparation and independence are equivalent. The article presents some considerations for constraint based algorithms based on recent data analysis, indicating a variety of situations where the faithfulness assumption does not hold. There is a short discussion about the causal discovery controversy, the idea that causal relations may be learned from data.
Artykuł jest przeglądem problemów analizowanych przy pomocy sieci bayesowskich. Sieć bayesowska jest acyklicznym grafem skierowanym, w którym węzły oznaczają zmienne, a krawędzie prawdopodobieństwa warunkowe czyli wpływy jednych zmiennych na inne. Autor przedstawia zależność między d-separowalnościa a niezależnością. Znaczna cześć pracy poświęcona jest dyskusji idei zawartych w pracy Arthura Cayley'a [8], która zawiera szereg pojęć i pomysłów wykorzystywanych w teorii sieci bayesowskich takich jak faktoryzacja rozkładu, zaszumione bramki "LUB" oraz zastosowanie geometrii algebraicznej. Autor omawia również "calculus of intervention", pomysł pochodzący od Pearla, gdy acykliczny graf skierowany (DAG) przedstawia przyczynowo-skutkowa strukturę zależności, oraz związki pomiędzy pracami Cayley'a i Pearla. Większość zawartego w artykule materiału poświęcona jest rozpoznawaniu i wykrywaniu zależności miedzy zmiennymi w oparciu o dwie główne metodologie: przeszukiwania i klasyfikacji oraz realizacji ograniczeń. Algorytmy oparte na kontroli ograniczeń często opierają się na założeniu, że dane do których algorytm jest stosowany pochodzą z rozkładu spełniającego założenie wierności oznaczającego równoważność d-separowalności i niezależności. W pracy prezentowane są rozwiązania dla algorytmów opartych na realizacji ograniczeń w przypadkach gdy założenie wierności nie jest spełnione. Przeprowadzono krótka dyskusje kontrowersji związanych z wykrywaniem przypadkowych powiązań
