Une représentation par les réseaux bayésiens causaux

Une représentation par les réseaux  bayésiens causaux

Introduction

Dans les chapitres précédents, nous avons défini la sûreté dans ces termes : s’assurer, par l’étude d’un système et la modification de son comportement, que l’incertitude liée aux dangers de son fonctionnement est suffisamment limitée pour répondre aux attentes de la société. Nous avons vu qu’elle s’appuyait, dans le domaine nucléaire, sur deux grandes démarches, fondées principalement sur des raisonnements déterministes pour l’une et probabilistes pour l’autre. Nous avons également souligné les limites de chacune de ces démarches, et indiqué l’utilité d’un cadre analytique permettant de mener une analyse comparative de ces deux démarches. Nous nous donnons pour objectif, dans ce chapitre, de bâtir un tel cadre à partir de la théorie des réseaux bayésiens causaux (RBC). Nous consacrons la première partie de ce chapitre à une brève exposition de la théorie des réseaux bayésiens et de leur version causale en nous contentant, pour l’essentiel, de proposer notre synthèse des principaux résultats établis par les fondateurs de cette théorie. Nous développons notre propre approche dans la seconde partie du chapitre, notamment en proposant une généralisation du concept d’intervention. Nous montrons comment le formalisme des réseaux bayésiens peut être utilisé pour rendre compte des démarches d’inférence en analyse de la sûreté. Nous caractérisons 161 Une représentation par les réseaux bayésiens causaux   alors les approches déterministe et probabiliste de la sûreté comme deux stratégies d’étude et de modification d’un RBC partiellement identifié : le réseau idéal décrivant l’ensemble des dangers d’un système. Sous cet éclairage, il devient plus aisé d’examiner les limites de chacune des deux approches ainsi que l’étendue de leur complémentarité et, pour finir, de proposer une définition précise du risque et du risque acceptable. Il peut être utile, avant d’entrer dans le vif du sujet, de préciser que le système sur lequel nous portons toute notre attention dans ce chapitre n’est pas nécessairement une entité physique. Il s’agit de toute description d’une situation à partir d’un ensemble de grandeurs et de relations entre ces grandeurs, ces dernières vérifiant certaines propriétés de stabilité et d’autonomie que nous expliciterons. Les modèles scientifiques, à titre d’exemple, constituent fréquemment de telles descriptions. 5.2 Les réseaux bayésiens causaux 5.2.1 Les réseaux bayésiens Soit X = (X1, …,Xn) une variable aléatoire vectorielle à valeurs dans χ = χ1 × … × χn, que l’on peut se représenter comme une description de n aspects des états d’un système. Nous supposerons que l’ensemble χ des états du système est fini 1 . Soit ∆(χ) l’ensemble des distributions de probabilités sur χ. Considérons une représentation graphique D des composantes de X, où chacune d’entre elles est associée à un nœud relié à d’autres par des arcs dirigés. Dans la suite, nous appellerons D indifféremment graphe ou structure. Lorsque D ne comporte pas de cycle (c’est-à-dire de succession d’arcs qui permette, en suivant le sens des flèches, de partir d’un nœud et de revenir à lui), nous l’appelons graphe dirigé acyclique. Nous appelons en outre sous-graphe de D tout graphe dirigé acyclique qui comporte les mêmes nœuds que D et un sous-ensemble (au sens strict) de ses arcs. À chaque fois que deux nœuds sont reliés par un arc, nous appelons parent celui au départ de l’arc et enfant celui à l’arrivée. Nous parlons de même d’ascendants et de descendants. Nous noterons les ensembles d’indices des parents, des enfants, des ascendants et des descendants de Xi par Pa(i), En(i), As(i) et De(i). Nous appelons racine tout nœud sans parent et feuille tout nœud sans enfant. Nous appelons enfin sentier toute succession d’arcs, sans considération de direction. L’ordre dans lequel les composantes de X sont classées joue un rôle important dans les développements qui suivent. Nous dirons alors d’un ordre (1, …,n) qu’il est compatible avec d lorsque chaque variable y précède l’ensemble de ses descendants dans D. 

Condition de Markov et réseaux bayésiens

Remarque 5.1. Tout graphe dirigé acyclique admet au moins une racine et une feuille. Démonstration. Supposons qu’un graphe dirigé acyclique n’admette pas de feuille. Alors il devrait être possible de le parcourir en suivant, depuis chaque nœud, un arc dirigé menant à un nœud qui n’a pas encore été visité (faute de quoi on aurait suivi un cycle). Or, une fois que les n nœuds auraient été ainsi visités, cette hypothèse deviendrait absurde. Pour établir l’existence d’au moins une racine, il suffit de reproduire le raisonnement en remontant les arcs. Considérons par ailleurs une distribution de probabilités P ∈ ∆(χ) sur les réalisations de X. Pour un ordre (1, …,n) donné sur les composantes de X, P peut être écrit comme le produit de n distributions conditionnelles : P(X1, . . . , Xn) = P(Xn|Xn−1, . . . , X1).. . . .P(X2|X1).P(X1) (5.2.1) Nous nous intéressons aux relations d’indépendance conditionnelle entre les Xi . Pour trois groupes disjoints d’indices I, J et K inclus dans {1, …,n}, la notation (XI ⊥⊥ XJ | XK)P signifie « XI est indépendant de XJ conditionnellement à XK selon la distribution P », c’est-à-dire : P(XI | XJ , XK) = P(XI | XK). 2 Définition 5.2. On dit qu’un graphe dirigé acyclique D est un réseau bayésien pour une distribution de probabilités P s’il existe un ordre compatible avec D tel que conditionnellement à ses parents dans D, toute variable soit indépendante de tous ses autres prédécesseurs selon P, en d’autres termes tel que pour tout i : P(Xi |Xi−1, . . . , X1) = P(Xi |XP a(i)) .

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *