Réseaux bayésiens pour l'identification de variables hors-contrôle

(1)

HAL Id: inria-00517046

https://hal.inria.fr/inria-00517046

Submitted on 13 Sep 2010

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Réseaux bayésiens pour l’identification de variables hors-contrôle

Sylvain Verron, Teodor Tiplica, Abdessamad Kobi

To cite this version:

Sylvain Verron, Teodor Tiplica, Abdessamad Kobi. Réseaux bayésiens pour l’identification de vari-

ables hors-contrôle. 5ème Conférence Internationale Francophone d’Automatique (CIFA’08), 2008,

Bucarest, Roumanie. �inria-00517046�

(2)

R´eseaux bay´esiens

pour l’identification de variables hors-contrˆ ole

Sylvain Verron , Teodor Tiplica , Abdessamad Kobi

Laboratoire en Sˆ uret´ e de Fonctionnement, Qualit´ e et Organisation (LASQUO) ISTIA, 62 Avenue Notre Dame du Lac, 49000 ANGERS, France

sylvain.verron@univ-angers.fr

http:www.univ-angers.fr/laboratoire.asp ?ID=34&langue=1

R´ esum´ e— Le but de cet article est de pr´ esenter une m´ ethode de d´ etection et d’identification par r´ eseaux bay´ esiens. Pour cela, une combinaison est r´ ealis´ ee entre les r´ ecents travaux de Li et al. [1] (d´ ecomposition causale du

T²

) et certains de nos pr´ ec´ edents travaux [2], [3] (cartes de contrˆ ole mul- tivari´ ees par r´ eseaux bay´ esiens). Ainsi, pour un proc´ ed´ e multivari´ e, les am´ eliorations propos´ ees permettent ` a la fois la d´ etection d’une faute et l’identification des variables impliqu´ ees dans celle-ci. Un int´ erˆ et particulier de cette m´ ethode r´ eside dans le fait qu’elle n’exploite qu’un seul et mˆ eme outil : un r´ eseau bay´ esien.

Mots-cl´ es— R´ eseaux bay´ esiens, Cartes de contrˆ ole, D´ ecompo- sition MYT.

I. Introduction

De nos jours, les proc´ ed´ es industriels poss` edent de plus en plus de capteurs, fournissant ainsi une importante quan- tit´ e de donn´ ees. Un champ de recherche int´ eressant porte sur l’utilisation de ces donn´ ees pour contrˆ oler le proc´ ed´ e. Le contrˆ ole d’un proc´ ed´ e peut ˆ etre vu comme une proc´ edure en 4 phases [4]. Dans la premi` ere phase, la d´ etection, l’ob- jectif est de d´ etecter une situation anormale, une faute dans le proc´ ed´ e. Le but de la seconde phase, l’identification de faute, est d’identifier les variables les plus significatives pour le diagnostic de la faute. La troisi` eme phase est le diagnostic de faute, elle consiste ` a d´ eterminer quel type de faute est apparue dans le proc´ ed´ e. Finalement, la derni` ere phase est celle de la reconfiguration du proc´ ed´ e qui permet d’agir sur le proc´ ed´ e ou sa commande afin de retrouver les conditions nominales d’utilisation.

Le contrˆ ole des proc´ ed´ es peut ˆ etre r´ ealis´ e par trois principales approches [4] : l’approche analytique, l’ap- proche bas´ ee sur les donn´ ees, et l’approche ` a base de connaissances. L’approche analytique consiste ` a construire un mod` ele math´ ematique du proc´ ed´ e. L’approche ` a base de connaissances se base sur des mod` eles qualitatifs du proc´ ed´ e. Enfin, les m´ ethodes bas´ ees sur les donn´ ees ex- ploitent des d´ eveloppements statistiques des donn´ ees du proc´ ed´ e. Th´ eoriquement, les m´ ethodes analytiques sont les plus rigoureuses et les plus pr´ ecises, elles sont donc celles donnant les meilleurs r´ esultats. Cependant, pour des syst` emes importants et complexes (nombre ´ elev´ e d’entr´ ees, de sorties, d’´ etats de fonctionnement), l’obtention de mod` eles assez d´ etaill´ es est extrˆ emement difficile. Ainsi, les m´ ethodes analytiques ne sont pas les mieux adapt´ ees pour ce type de syst` eme, pouvant mener ` a des conclu- sions erron´ ees. Dans ce cas, les m´ ethodes bas´ ees sur des

d´ eveloppements statistiques rigoureux seront pr´ ef´ er´ ees aux m´ ethodes analytiques.

La litt´ erature est riche concernant les techniques de contrˆ ole bas´ ees sur les donn´ ees : maˆıtrise statistique des proc´ ed´ es univari´ es (cartes de contrˆ ole de Shewhart) [5], [6], maˆıtrise statistique des proc´ ed´ es multivari´ es (cartes de contrˆ ole T

²

et Q) [7], [8], ainsi que des techniques bas´ ees sur l’Analyse en Composantes Principales (ACP) [9] telles que l’ACP multi´ echelle ou l’ACP dynamique [10]. Kano et al. [11] effectuent une comparaison de ces diff´ erentes m´ ethodes. D’autres m´ ethodes se basent sur la Projection dans les Structures Latentes (PSL) [12] comme la PSL multi´ echelle [13]. Concernant l’identification de fautes, Tiplica et al. [14] ont ´ etabli un comparatif de plu- sieurs m´ ethodes. L’une des techniques statistiques la plus int´ eressante est la d´ ecomposition MYT [15], [16] qui ef- fectue une d´ ecomposition de la statistique T

²

en compo- santes orthogonales permettant de d´ eterminer quelle va- riable ou groupe de variables a contribu´ e ` a une situation hors-contrˆ ole (faute). R´ ecemment, Li et al. [1] ont pro- pos´ e une am´ elioration de la d´ ecomposition MYT nomm´ ee d´ ecomposition causale du T

²

. Pour cela, ces auteurs se basent sur un r´ eseau bay´ esien causal repr´ esentant les diff´ erentes variables du proc´ ed´ e.

Comme nous l’avons pr´ esent´ e, la d´ etection et l’identifi-

cation de fautes se basent sur des diff´ erents outils (carte de

contrˆ ole, d´ ecompositions diverses, etc). Il serait int´ eressant

d’essayer de regrouper tous ces m´ ethodes sous un seul et

mˆ eme outil. L’objectif de cet article est de proposer une

am´ elioration de la m´ ethode propos´ ee par Li et al. [1], afin

de n’utiliser qu’un seul et mˆ eme r´ eseau bay´ esien, que ce soit

pour la d´ etection de faute ou pour l’identification des va-

riables impliqu´ ees dans cette faute. Suite ` a une pr´ esentation

des r´ eseaux bay´ esiens (section II), la section III permet

de d´ etailler les m´ ethodes de d´ ecomposition MYT et cau-

sale. La section IV rappelle tout d’abord les principes

de construction d’une carte de contrˆ ole multivari´ ee par

r´ eseaux bay´ esiens, puis pr´ esente les moyens d’obtenir la

d´ etection et l’identification de situations hors-contrˆ ole dans

un seul et mˆ eme r´ eseau bay´ esien. Une application de nos

propositions sur un exemple simple est pr´ esent´ e ` a la section

V, puis les conclusions et perspectives seront ´ enonc´ es dans

la section VI.

(3)

II. R´ eseaux Bay´ esiens

Un R´ eseau Bay´ esien (RB) [17], [18] est un mod` ele gra- phique dans lequel les connaissances sont repr´ esent´ ees sous forme de variable. Chaque variable est un nœud du graphe et prend ses valeurs dans un ensemble discret ou continu.

Le graphe est toujours dirig´ e et acyclique. Les arcs dirig´ es repr´ esentent un lien de d´ ependance directe (la plupart du temps il s’agit de causalit´ e). Ainsi un arc allant de la va- riable X ` a la variable Y exprimera le fait que X d´ epende di- rectement de Y . L’absence d’arc ne renseigne alors que sur la non-existence d’une d´ ependance directe. Les param` etres expriment les poids donn´ es ` a ces relations et sont les pro- babilit´ es conditionnelles des variables sachant leurs parents (exemple : P(Y |X )) ou les probabilit´ es a priori si la variable n’a pas de parents. On peut d´ efinir formellement un r´ eseau bay´ esien comme ´ etant un triplet {G, E, D} o` u :

{G} est un graphe acyclique orient´ e, G = (V, A), o` u V est l’ensemble des noeuds de G, et A est l’ensemble des arcs de G,

{E} est un espace probabilis´ e fini (Ω, Z, P ), avec Ω un es- pace non vide, Z un ensemble de sous-espaces de Ω, et P une mesure de probabilit´ e sur Z avec P(Ω) = 1,

{D} est un ensemble de variables al´ eatoires associ´ ees aux nœuds de G et d´ efini sur E, tel que :

P (V

1

, V

2

, . . . , V

n

) =

n

Y

i=1

P(V

i

|C(V

i

)) (1)

o` u C(V

i

) est l’ensemble des causes (parents) de V

i

dans le graphe G.

Il est possible de r´ ealiser des classifieurs performants grˆ ace aux r´ eseaux bay´ esiens [19], [20], [21]. Nous pr´ esentons ici les principaux types de structures pour employer les r´ eseaux bay´ esiens comme classifieurs. Un classifieur bay´ esien d’un probl` eme ` a p variables a pour particularit´ e de poss´ eder p+1 nœuds. En effet, tous les classifieurs bay´ esiens mod´ elisent le fait d’appartenance ` a une classe par un nœud discret. Nous nommons ce nœud ”nœud de classe”, et nous le notons C. Ce nœud est un nœud discret multinomial ` a k modalit´ es, o` u k repr´ esente le nombre de classes de notre probl` eme (C

₁

, C

₂

, . . . , C

_k

). Ce nœud de classe a pour par- ticularit´ e de ne pas poss´ eder de nœud parent. Les autres variables, au nombre de p, que nous nommons variables descriptives, sont not´ ees X

i

(i de 1 ` a p).

Le classifieur bay´ esien poss´ edant la structure la plus simple est le R´ eseau Bay´ esien Na¨ıf (RBN), ´ egalement ap- pel´ e classifieur de Bayes (figure 1 (a)). On le qualifie de na¨ıf car il fait l’hypoth` ese, tr` es forte, que chaque variable des- criptive est, conditionnellement ` a la classe, ind´ ependante des autres. Lorsque toutes les variables descriptives sont incorpor´ ees au mod` ele, on parlera alors de structure na¨ıve compl` ete. Ce classifieur est extrˆ emement connu car ses per- formances (notamment dans le cas o` u toutes les variables sont discr` etes) sont int´ eressantes dans certains domaines et d´ epassent des techniques beaucoup plus sophistiqu´ ees mˆ eme lorsque l’hypoth` ese d’ind´ ependance est viol´ ee [22].

Au vu de l’hypoth` ese forte que ce classifieur implique, il est normal que certains chercheurs aient voulu am´ eliorer ce classifieur. Friedman [20] propose d’ajouter des arcs entre

les diff´ erentes variables descriptives du classifieur na¨ıf. Pour cela, il d´ ecide de cr´ eer un arbre entre les variables des- criptives, ` a la mani` ere de Chow et Liu [23], afin d’obte- nir un TAN (Tree Augmented Na¨ıve Bayes), visible sur la figure 1 (b). L’algorithme part d’un r´ eseau bay´ esien na¨ıf et ajoute alors un arc entre les variables qui partagent la plus importante information mutuelle. Mais, pour respec- ter la topologie de l’arbre, l’algorithme interdit ` a chaque nœud d’avoir plus de 2 parents (soit un parent en plus du nœud classe). Afin de prendre en compte la corr´ elation entre les diff´ erents descripteurs, il a ´ egalement ´ et´ e propos´ e le CSNBN (Condensed Semi-Na¨ıve Bayesian Network) : un r´ eseau bay´ esien semi na¨ıf condens´ e [24], [25] (figure 1 (c)).

On le nomme condens´ e car il introduit un nouveau type de variable : les variables jointes. Ces nouvelles variables jointes repr´ esentent en fait un groupement de variables des- criptives. Bien entendu, une variable descriptive ne pourra se trouver que dans une seule variable jointe. Le fait que deux variables se trouvent dans une variable jointe implique que ces deux variables sont corr´ el´ ees. Un regroupement de p variables continues suivra une loi normale multivari´ ee et sera donc repr´ esent´ e par un seul nœud continu de dimen- sion p.

a)

C

X

₁

X

₂

X

₃

X

₄

b)

C

X

₁

X

₂

X

₃

X

₄

c)

X C

Fig. 1. Diff´ erents classifieurs bay´ esiens : RBN (a), TAN (b) et CSNBN (c).

III. Diff´ erentes m´ ethodes A. Diagnostic par d´ ecomposition MYT

Comme nous l’avons d´ ej` a dit, un principe de d´ etection pour les proc´ ed´ es multivari´ es est la carte de contrˆ ole du T

²

, mise au point par Hotelling [7]. Cependant, la carte ne donne aucune indication concernant le diagnostic de la situation hors-contrˆ ole. Pour cela, beaucoup de m´ ethodes ont ´ et´ e propos´ ees [26], [27], [28], [15], [29]. Une ´ etude com- parative est effectu´ ee par Tiplica [30].

Une d´ ecomposition du T

²

particuli` erement int´ eressante

a ´ et´ e mise au point par Mason, Young et Tracy [15],

d’o` u le nom ”d´ ecomposition MYT”. De plus, pour com-

(4)

prendre cette m´ ethode de mani` ere plus intuitive, les au- teurs donnent un exemple avec un proc´ ed´ e bivari´ e [16].

Il est ´ egalement ` a pr´ eciser que les auteurs ont prouv´ es que certaines m´ ethodes peuvent se ramener ` a des cas particuliers de d´ ecomposition MYT [15]. En effet, cette d´ ecomposition r´ eunit les id´ ees de Hawkins [28], bas´ ees sur la r´ egression multiple et l’analyse des r´ esidus, et de Doga- naksoy [27] sur la contribution des variables ` a la statistique de Student.

Le principe de la m´ ethode MYT est de d´ ecomposer la statistique T

²

dans un nombre limit´ e de composantes or- thogonales qui sont ´ egalement des distances statistiques (et donc surveillables). La d´ ecomposition est la suivante :

T

²

= T

₁²

+ T

_2•1²

+ T

_3•1,2²

+ T

_4•1,2,3²

+ · · · + T

p•1,2,3···p−1²

(2) o` u T

_i•j,k²

repr´ esente la statistique T

²

de la r´ egression des variables X

j

et X

k

sur la variable X

i

. On voit qu’il existe un nombre important de d´ ecompositions diff´ erentes (p!), et donc qu’il existe un grand nombre de facteur (p × 2

^p−1

) diff´ erents. Pour mieux comprendre, sur un proc´ ed´ e ` a 3 va- riables, nous obtenons les diff´ erentes d´ ecompositions sui- vantes :

T

²

= T

₁²

+ T

_2•1²

+ T

_3•1,2²

T

²

= T

₁²

+ T

_3•1²

+ T

_2•1,3²

T

²

= T

₂²

+ T

_1•2²

+ T

_3•1,2²

T

²

= T

₂²

+ T

_3•2²

+ T

_1•2,3²

T

²

= T

₃²

+ T

_1•3²

+ T

_2•1,3²

T

²

= T

₃²

+ T

_2•3²

+ T

_1•2,3²

(3)

Le calcul des termes n’est pas d´ etaill´ e ici, mais on pourra bien entendu se reporter aux travaux de Mason et al. [15], [16]. Il est ` a noter que les termes T

_j²

sont appel´ es facteurs non-conditionn´ es (puisqu’ils ne d´ ependent pas du tout des autres variables que j), alors que les autres termes sont appel´ es facteurs conditionn´ es. Ce qui est int´ eressant, c’est que chaque facteur suit une distribution de Fisher (` a une constante multiplicative pr` es) :

T

_{j+1•1,···j}²

= (m + 1)(m − 1)

m(m − k − 1) F

_1,m−k−1

(4) o` u k est le nombre de facteurs conditionn´ es. On pourra donc simplifier cette ´ equation pour les termes non- conditionn´ es (k=0) par :

T

_{j+1•1,···j}²

∼ m + 1

m F

_1,m−1

(5)

Cela nous permet de d´ etecter un probl` eme sur chacun des facteurs de la d´ ecomposition. Par exemple, si l’on s’aper¸ coit que le facteur T

_2•1²

est responsable d’un hors contrˆ ole du proc´ ed´ e, on peut imm´ ediatement aller chercher la cause de l’anomalie sur un r´ eglage physique affectant la corr´ elation entre ces deux variables. Mais, pour moins de calcul, il suf- fit d’utiliser une carte T

²

pour la d´ etection de situation hors-contrˆ ole, et si une faute se produit, alors on utilise la m´ ethode MYT pour d´ eterminer d’o` u vient cette faute.

L’analyse des facteurs se fait dans l’ordre de niveau (ex : T

₁²

, T

₂²

, T

₃²

, puis T

_2•1²

, T

_3•1²

, T

_1•2²

, T

_3•2²

, T

_1•3²

, T

_2•3²

puis fi- nalement T

_3•1,2²

, T

_2•1,3²

, T

_1•2,3²

) jusqu’` a ce qu’on trouve le facteur ayant caus´ e la d´ etection d’une erreur sur la carte T

²

.

L’avantage de la m´ ethode MYT est qu’elle fournie un diagnostic d’une situation hors-contrˆ ole, sans avoir ` a la comparer ` a des exemples de fautes pr´ ealablement appa- rues dans le proc´ ed´ e. Ainsi, cette m´ ethode de diagnostic est une m´ ethode non-supervis´ ee. De plus, un autre avan- tage de cette m´ ethode est qu’elle est bas´ ee sur la mˆ eme d´ emarche que la carte T

²

. Les outils statistiques sont les mˆ emes et on peut penser qu’une impl´ ementation pratique est beaucoup plus compr´ ehensible qu’un m´ elange de plu- sieurs techniques.

B. D´ ecomposition causale du T

²

La m´ ethode MYT est tr` es int´ eressante mais elle est su- jette ` a un inconv´ enient majeur : le nombre de termes ` a cal- culer. En effet, elle impose un nombre de d´ ecompositions

´

egale ` a p! (o` u p est le nombre de variables du proc´ ed´ e). Or, ces d´ ecompositions impliquent alors le calcul de p × 2

^p−1

termes distincts. Par exemple, pour un proc´ ed´ e ` a 20 va- riables, plus de 10 millions de termes distincts sont ` a cal- culer. Des efforts furent effectu´ es afin de r´ eduire le nombre de termes en appliquant un algorithme en 5 ´ etapes [16] per- mettant une r´ eduction significative du nombre de termes ` a calculer. Cependant, Li et al. [1] font la remarque que mˆ eme avec l’utilisation de l’algorithme, le nombre de termes ` a calculer est tout de mˆ eme important (tr` es sup´ erieur ` a p, notamment en pr´ esence de fautes multiples). Li et al.

[1] proposent alors une m´ ethode exploitant les r´ eseaux bay´ esiens : la d´ ecomposition causale du T

²

. Un graphe cau- sal repr´ esentant le proc´ ed´ e permet de r´ eduire le nombre de termes ` a calculer ` a p. En plus de la diminution de calcul engendr´ ee par cette m´ ethode, les auteurs pr´ ecisent que les performances sont ´ egalement am´ elior´ ees.

L’hypoth` ese de base de la m´ ethode propos´ ee par Li et al. [1] est que le proc´ ed´ e peut ˆ etre mod´ elis´ e sous la forme d’un r´ eseau bay´ esien causal o` u chaque variable du proc´ ed´ e est une variable gaussienne univari´ ee. Lorsqu’un r´ eseau bay´ esien repr´ esente uniquement des variables conti- nues normales, il est ´ egalement appel´ e mod` ele lin´ eaire gaus- sien. Ainsi, pour un proc´ ed´ e ` a 3 variables, on peut par exemple obtenir le r´ eseau bay´ esien de la figure 2.

X ₁

X ₃ X ₂

Fig. 2. Exemple d’un mod` ele causal lin´ eaire gaussien

Dans le cadre de la mod´ elisation du proc´ ed´ e par un mod` ele lin´ eaire gaussien, les auteurs font la distinction entre deux types de d´ ecomposition MYT : ”pour une d´ ecomposition du T

²

donn´ ee, s’il existe un terme T

i•1,...,i−1²

tel que l’ensemble de variables {X

1

, . . . , X

_i−1

} contient au

moins un descendant de X

i

, alors cette d´ ecomposition est

de type A, dans le cas contraire, la d´ ecomposition est de

type B”. Ainsi, nous pouvons classer dans la table I les

diff´ erentes d´ ecompositions du proc´ ed´ e ` a 3 variables de la

figure 2.

(5)

D´ ecomposition Type T

²

= T

₁²

+ T

_2•1²

+ T

_3•1,2²

Type B T

²

= T

₁²

+ T

_3•1²

+ T

_2•1,3²

Type B T

²

= T

₂²

+ T

_1•2²

+ T

_3•1,2²

Type A T

²

= T

₂²

+ T

_3•2²

+ T

_1•2,3²

Type A T

²

= T

₃²

+ T

_1•3²

+ T

_2•1,3²

Type A T

²

= T

₃²

+ T

_2•3²

+ T

_1•2,3²

Type A

TABLE I

Types des décompositions du procédé à 3 variables

Li et al. [1] prouvent, en se basant sur les travaux d’Haw- kins [28], que les d´ ecompositions de type A permettent un diagnostic moins pr´ ecis que les d´ ecompositions de type B. De plus, ils prouvent ´ egalement que dans le contexte du mod` ele lin´ eaire gaussien, toutes les d´ ecompositions de type B convergent vers une unique d´ ecomposition que les auteurs nomment ”causation-based T

²

decomposition”.

Nous la nommerons d´ ecomposition causale du T

²

. En effet, chaque d´ ecomposition de type B (dans le cas d’un mod` ele lin´ eaire gaussien causal) converge vers la d´ ecomposition causale du T

²

d´ ecrite dans l’´ equation 6, o` u P A(X

i

) repr´ esentent les parents de la variable X

_i

sur le graphe causal.

T

²

=

p

X

i=1

T

_{i•P A(X}²

i)

(6)

Ainsi, la d´ ecomposition causale du T

²

de l’exemple de la figure 2 est la suivante : T

²

= T

₁²

+ T

_2•1²

+ T

_3•1²

.

Suite ` a ces diff´ erentes d´ emonstrations, les auteurs

´

enoncent alors la proc´ edure de d´ etection et d’identification utilisant la nouvelle d´ ecomposition causale. Tout d’abord, un r´ eseau bay´ esien lin´ eaire gaussien est construit afin de repr´ esenter les relations causales entre les diff´ erentes va- riables du proc´ ed´ e. Suite ` a cela, le proc´ ed´ e est surveill´ e par une carte de contrˆ ole du T

²

. Lors de la d´ etection d’une situation hors-contrˆ ole, le T

²

est d´ ecompos´ e par la d´ ecomposition causale de l’´ equation 6. Dans cette ´ equation, chaque T

_{i•P A(X}²

i)

est ind´ ependant et, dans le cas o` u les param` etres du proc´ ed´ e sont connus, suit une distribution du χ

²

` a un degr´ e de libert´ e. On compare alors chaque T

_{i•P A(X}²

i)

` a la limite χ

²_1,α

repr´ esentant le quantile ` a la va- leur α (taux de fausses alertes) de la distribution du χ

²

` a un degr´ e de libert´ e. Un T

_{i•P A(X}²

i)

significatif (d´ epassant la limite de contrˆ ole) implique alors que la variable X

_i

a pro- bablement subi un saut de moyenne. La figure 3 repr´ esente le diagramme de surveillance du proc´ ed´ e par la m´ ethode

´

enonc´ ee ci-dessus.

L’approche d´ evelopp´ ee par Li et al. [1] exploite des seuils donn´ es par des quantiles de lois statistiques. Enfin, elle permet d’am´ eliorer consid´ erablement les performances par rapport ` a la m´ ethode MYT, tout en demandant moins de calcul que celle-ci. Cependant, on remarque sur la fi- gure 3 que cette m´ ethode emploie divers outils : cartes de contrˆ ole, r´ eseaux bay´ esiens, calculs statistiques. Nous al- lons montrer, dans la section suivante, que la surveillance d’un proc´ ed´ e par la m´ ethode de d´ ecomposition causale peut ˆ

etre enti` erement effectu´ ee par r´ eseaux bay´ esiens. Ceci va

Construire un r´ eseau bay´ esien lin´ eaire gaussien avec X

1

, X

2

, . . . , X

p

Etablir une carte de contrˆ ´ ole T

²

D´ ecomposer les observations hors contrˆ ole du T

²

par l’´ equation 6

Trouver les T

_{i•P A(X}²

i)

significatifs

Fig. 3. Surveillance par la m´ ethode de d´ ecomposition causale

notamment permettre la manipulation d’un seul et mˆ eme outil pour la surveillance : un r´ eseau bay´ esien.

IV. Approche propos´ ee A. Carte de contrˆ ole par r´ eseaux bay´ esiens

Lors de pr´ ec´ edent travaux [2], [3], nous avons d´ emontr´ e qu’une carte de contrˆ ole du T

²

[7] pouvait ˆ etre mod´ elis´ ee par r´ eseaux bay´ esiens. Pour cela, nous utilisons deux nœuds : un nœud multivari´ ee gaussien X repr´ esentant les donn´ ees et un nœud bimodal E repr´ esentant l’´ etat du proc´ ed´ e. Le nœud bimodal E poss` ede les modalit´ es sui- vantes : SC pour sous contrˆ ole et HC pour hors-contrˆ ole.

En faisant l’hypoth` ese que µ et Σ sont respectivement le vecteur cible et la matrice de variance-covariance du proc´ ed´ e, nous pouvons surveiller ce dernier par la r` egle suivante : si p(SC|x) < p(SC) alors le proc´ ed´ e est hors- contrˆ ole. Ce r´ eseau bay´ esien est repr´ esent´ ee sur la figure 4, o` u nous pr´ ecisons ´ egalement les tables de probabilit´ es conditionnelles associ´ ees ` a chaque nœud.

X

E SC ^E HC 1 − α α

E X

SC X ∼ N(µ, Σ) HC X ∼ N (µ, c × Σ)

Fig. 4. Carte

T²

par r´ eseaux bay´ esiens

Sur cette figure 4, nous pouvons observer qu’un coeffi- cient c est impliqu´ e dans la carte de contrˆ ole par r´ eseau bay´ esien. Ce coefficient est la racine (diff´ erente de 1) de l’´ equation suivante :

1 − c + pc

LC ln(c) = 0 (7)

o` u p est la dimension (nombre de variables) du syst` eme

`

a surveiller et LC est la limite de contrˆ ole de la carte T

²

(6)

´

equivalente. Dans de nombreux cas, LC est ´ egale ` a χ

²_α,p

, le quantile ` a la valeur α de la distribution du χ

²

` a p degr´ e de libert´ e [31]. Ainsi, α permet de r´ egler le taux de fausses alertes de la carte de contrˆ ole.

B. Am´ elioration de la proposition de Li et al.

La m´ ethode propos´ ee par Li et al. [1] permet, en se ba- sant sur un r´ eseau bay´ esien ` a nœuds gaussiens, de connaˆıtre les diff´ erents termes de la d´ ecomposition MYT ` a calculer.

Pour le calcul des diff´ erents termes de la d´ ecomposition causale du T

²

, ainsi que pour les d´ ecisions associ´ ees (d´ epassement de limites), les auteurs n’utilisent pas leur r´ eseau de fa¸ con optimale. En effet, les auteurs utilisent une carte de contrˆ ole du T

²

ext´ erieurement au r´ eseau, alors que celle-ci peut se mod´ eliser directement ` a l’int´ erieur du r´ eseau (voir section pr´ ec´ edente). De mˆ eme, les auteurs cal- culent chaque T

_{i•P A(X}²

i)

` a l’ext´ erieur du r´ eseau, alors qu’il est possible d’effectuer ces calculs dans le r´ eseau.

Nous proposons une extension ` a la m´ ethode de Li et al. [1] permettant le calcul des diff´ erents T

_{i•P A(X}²

i)

et des d´ ecisions associ´ ees ` a chacun d’entre eux. Le diagnostic par d´ ecomposition causale du T

²

, tout comme la d´ ecomposition MYT, est en fait une surveillance des variables r´ egress´ ees, au moyen de cartes de contrˆ ole univari´ ees. Dans la sec- tion pr´ ec´ edente, nous avons d´ emontr´ e comment r´ ealiser, par r´ eseaux bay´ esiens, une carte de contrˆ ole multivari´ ee telle que la carte du T

²

de Hotelling. Or, une carte de contrˆ ole univari´ ee du type carte de contrˆ ole de Shewhart n’est tout simplement qu’un cas particulier d’une carte de contrˆ ole multivari´ ee du type carte du T

²

de Hotelling. En effet, le calcul du T

²

est le suivant :

T

²

= (x − µ)

^T

Σ

⁻¹

(x − µ) (8) Or, dans le cas univari´ e, x = x, µ = µ et Σ = σ

²

, ainsi l’´ equation 8 devient :

T

²

= (x − µ)

²

σ

²

(9)

Dans ce cas univari´ e, la statistique T

²

suit une loi du χ

²

` a un degr´ e de libert´ e. Or, au vu des d´ emonstrations de la section, ainsi que de leurs transpositions au domaine univari´ e, il est possible d’envisager une am´ elioration de la technique d´ evelopp´ ee par Li et al. [1]. Nous proposons ici de suivre directement les diff´ erentes valeurs des T

_{i•P A(X}²

i)

dans le r´ eseau bay´ esien. Pour cela, nous rajoutons une variable discr` ete pour chaque nœud univari´ e du r´ eseau bay´ esien.

Si nous avons un graphe repr´ esentant un syst` eme ` a 3 va- riables (voir figure 2), nous obtenons alors un r´ eseau avec six nœuds : 3 continus (univari´ es) et 3 discrets (bimodale), comme indiqu´ e sur la figure 5.

Nous pr´ ecisons ici que les variables continues n’ont pas obligatoirement besoin d’avoir ´ et´ e pr´ ealablement centr´ ees et r´ eduites. Les nœuds discrets rajout´ es ` a la structure ini- tiale du r´ eseau (celle ne comprenant que les nœuds conti- nus) nous permettent de r´ ealiser directement l’identifica- tion des variables incrimin´ ees lors d’une situation hors- contrˆ ole. Ces nœuds mod´ elisent une carte de contrˆ ole T

_{i•P A(X}²

i)

permettant de conclure sur le statut de chaque variable. Nous rappelons que la modalit´ e SC du nœud dis- cret signifie sous contrˆ ole, alors que la modalit´ e HC signifie

T

²₁

X

1

T

²_3•1

X

3

T

²_2•1

X

2

Fig. 5. Am´ elioration de la d´ ecomposition causale

hors-contrˆ ole. La figure 6 d´ etaille la table de probabilit´ es conditionnelles associ´ ee ` a un nœud continu du r´ eseau, ainsi que la table de probabilit´ es a priori de son nœud discret as- soci´ e.

T

²i•PA(Xi)

X

_i

T_{i•P A(X}²

i)

SC HC

1

−α α

T_{i•P A(X}²

i) Xi

SC Xi∼N(µi•P A(X_i), σ_{i•P A(X}²

i)

)

HC Xi∼N

(µ

i•P A(X_i), c×σ²_{i•P A(X}

i)

)

Fig. 6. R´ eseau bay´ esien similaire ` a la carte

T_{i•P A(X}²

i)

Lorsqu’une faute est d´ etect´ ee dans le proc´ ed´ e, chaque nœud discret (repr´ esentant le statut d’une variable r´ egress´ ee) fournit une certaine probabilit´ e que la variable soit sous contrˆ ole. Les variables incrimin´ ees dans la faute du proc´ ed´ e sont les variables poss´ edant une probabilit´ e a posteriori inf´ erieure ` a leur probabilit´ e a priori. La personne charg´ ee d’identifier physiquement la faute poss` ede alors des indications tr` es pr´ ecieuses puisqu’elle connaˆıt les variables du proc´ ed´ e sur lesquelles la faute a agi.

A la vue de ces propositions, nous pouvons dresser un r´ eseau bay´ esien permettant, apr` es une prise de d´ ecision sur les variables, de d´ eterminer tout d’abord si le proc´ ed´ e est sous contrˆ ole ou hors-contrˆ ole (d´ etection). Dans le cas du proc´ ed´ e hors contrˆ ole, le r´ eseau va ´ egalement pouvoir nous fournir les variables responsables de cette situation (iden- tification).

La figure 7 pr´ esente la forme g´ en´ erale de ce r´ eseau bay´ esien pour un proc´ ed´ e ` a p variables. Ce r´ eseau per- met ` a lui seul d’effectuer toutes les phases de surveillance d´ evelopp´ ees par Li et al. [1], c’est ` a dire qu’il permet l’ap- plication du diagramme de la figure 3.

V. Application

Afin de mieux appr´ ehender la m´ ethode propos´ ee, nous

avons simul´ e un proc´ ed´ e ` a trois variables tel que pr´ esent´ e

sur les figures 2 et 5. Les param` etres (µ et Σ) de ce proc´ ed´ e

lorsqu’il est sous contrˆ ole sont les suivants :

(7)

X ₁ X _i

X _p

X ₃ X ₂

SC HC SC

HC SC

T

²1•2 HC

T

²2

T

²3•2

T

²i•1,3,p

T

²p

X

SC

E

HC

Détection Identification

Fig. 7. R´ eseau bay´ esien pour la d´ etection et l’identification

µ = 0 0 0 Σ =





1 0.8 0.6 0.8 1 0.1 0.6 0.1 1





Nous avons simul´ e 100 observations sous contrˆ ole, puis 50 observations hors-contrˆ ole. Ces observations hors-contrˆ ole sont un saut de moyenne d’amplitude 2 sur la variable X

2

. L’objectif du r´ eseau est donc de d´ etecter qu’une faute est apparue ` a partir de l’observation 101, et que la variable X

2

est impliqu´ ee dans cette faute.

La premi` ere action effectu´ ee est la construction du r´ eseau conditionnel gaussien. Pour cela, l’algorithme PC [32] est utilis´ e pour la construction de la structure du r´ eseau. Pour l’algorithme PC, nous avons employ´ e un test d’ind´ ependance conditionnelle par transform´ e en z [33]. On ajoute alors tous les nœuds de contrˆ ole de param` etres, c’est

`

a dire tous les nœuds T

_{i•P A(X}²

i)

, avec un taux de fausses alertes de 5%. On ajoute ´ egalement la mod´ elisation de la carte de contrˆ ole du T

²

, permettant la d´ etection par le r´ eseau, avec un taux de fausses alarmes de 1%. Suite ` a cela, les param` etres de chaque nœud sont calcul´ es.

Suite ` a l’apprentissage de la structure et des param` etres du r´ eseau, nous pr´ esentons les 150 observations pour les- quelles nous voulons obtenir un r´ esultat. On observe alors les probabilit´ es a posteriori du nœud E. Pour une observa- tion donn´ ee, si cette probabilit´ e est inf´ erieure ` a 99% alors le proc´ ed´ e est hors-contrˆ ole. Dans ce cas, on observe les valeurs des probabilit´ es a posteriori des nœuds T

_{i•P A(X}²

i)

. Les variables poss´ edant une probabilit´ e inf´ erieure ` a 95%

sont alors impliqu´ ees dans la situation de hors-contrˆ ole.

Les r´ esultats (les probabilit´ es ` a posteriori) du r´ eseau sont donn´ es sur la figure 8.

Sur cette figure, on peut remarquer que le r´ eseau ne d´ etecte pas de faute sur les 100 premi` eres observations.

Cependant, le r´ eseau d´ etecte une situation hors contrˆ ole

0 50 100 150

0 0.2 0.4 0.6 0.8 1

p(E=SC|x)

0 50 100 150

0 0.2 0.4 0.6 0.8 1

p(T² 1=SC|x)

0 50 100 150

0 0.2 0.4 0.6 0.8 1

p(T² 2.1=SC|x)

0 50 100 150

0 0.2 0.4 0.6 0.8 1

p(T²_3.1=SC|x)

Fig. 8. Probabilit´ es ` a posteriori des nœuds

d` es l’observation 101. De plus, le r´ eseau nous signale que la variable X

₂

est impliqu´ ee dans cette faute.

VI. Conclusions et perspectives

Dans cet article nous avons pr´ esent´ e une approche per-

mettant d’effectuer la d´ etection de fautes dans un proc´ ed´ e

multivari´ e, ainsi que l’identification des diff´ erentes va-

riables impliqu´ ees lors de ces fautes. Cette approche se

(8)

base sur un r´ eseau bay´ esien. Il s’agit de la combinaison de pr´ ec´ edents travaux [2], [3] permettant la mod´ elisation de cartes de contrˆ ole multivari´ ees par r´ eseau bay´ esien, ainsi que de l’am´ elioration de la technique de d´ ecomposition causale du T

²

propos´ ee par Li et al. [1]. Ainsi, la pers- pective int´ eressante qu’entraˆıne cette m´ ethode est la mise au point d’un r´ eseau bay´ esien complet permettant ` a la fois la d´ etection, l’identification et le diagnostic de faute dans un proc´ ed´ e multivari´ e.

R´ ef´ erences

[1] Jing Li, Jionghua Jin, et Jianjun Shi. Causation-based

t²

de- composition for multivariate process monitoring and diagnosis.

Journal of Quality Technology, 40(1) :46–58, 2008.

[2] Sylvain Verron, Teodor Tiplica, et Abdessamad Kobi. Multiva- riate control charts with a bayesian network. 4th International Conference on Informatics in Control, Automation and Robo- tics (ICINCO), 2007.

[3] Sylvain Verron. Diagnostic et surveillance des processus com- plexes par r´ eseaux bay´ esiens. PhD thesis, University of Angers, 2007.

[4] Leo H. Chiang, Evan L. Russell, et Richard D. Braatz. Fault de- tection and diagnosis in industrial systems. New York : Springer- Verlag, 2001.

[5] Walter A. Shewhart. Economic control of quality of manufactu- red product. New York : D. Van Nostrand Co., 1931.

[6] S. W. Roberts. Control chart tests based on geometric moving averages. Technometrics, 1(3) :239–250, Aoˆ ut 1959.

[7] Harold Hotelling. Multivariate quality control. Techniques of Statistical Analysis, :111–184, 1947.

[8] J.A. Westerhuis, S.P. Gurden, et A.K. Smilde. Standardized q- statistic for improved sensitivity in the monitoring of residuals in mspc. Journal of Chemometrics, 14(4) :335–349, 2000.

[9] Edward J. Jackson. Multivariate quality control. Communica- tion Statistics - Theory and Methods, 14 :2657 – 2688, 1985.

[10] Bhavik R. Bakshi. Multiscale PCA with application to multiva- riate statistical process monitoring. AIChE Journal, 44 :1596–

1610, 1998.

[11] M. Kano, K. Nagao, S. Hasebe, I. Hashimoto, H. Ohno, R. Strauss, et B.R. Bakshi. Comparison of multivariate statis- tical process monitoring methods with applications to the east- man challenge problem. Computers and Chemical Engineering, 26(2) :161–174, 2002.

[12] J.F. MacGregor et T. Kourti. Statistical process control of mul- tivariate processes. Control Engineering Practice, 3(3) :403–414, 1995.

[13] B.M. Wise et N.B. Gallagher. The process chemometrics ap- proach to process monitoring and fault detection. Journal of Process Control, 6(6) :329–348, 1996.

[14] Teodor Tiplica, Abdessamad Kobi, et Alain Barreau. Synth` ese et comparaison des m´ ethodes pour la maˆıtrise statistique des processus multivari´ es. Actes du cong` es QUALITA, pages 134–

142, Annecy, France, 2001.

[15] Robert L. Mason, Nola D. Tracy, et John C. Young. Decomposi- tion of

T²

for multivariate control chart interpretation. Journal of Quality Technology, 27(2) :99–108, 1995.

[16] R.L. Mason, N.D. Tracy, et J.C. Young. A practical approach for interpreting multivariate

t²

control chart signals. Journal of Quality Technology, 29(4) :396–406, 1997.

[17] Finn V. Jensen. An introduction to Bayesian Networks. Taylor and Francis, London, United Kingdom, 1996.

[18] Patrick Naim, Pierre-Henri Wuillemin, Philippe Leray, Olivier Pourret, et Anna Becker. R´ eseaux bay´ esiens - 2` eme ´ edition.

Eyrolles, 2004.

[19] Pat Langley et Stephanie Sage. Induction of selective bayesian classifiers. In Proceedings of the Tenth Conference on Uncer- tainty in Artificial Intelligence, 1994.

[20] N. Friedman, D. Geiger, et M. Goldszmidt. Bayesian network classifiers. Machine Learning, 29(2-3) :131–163, 1997.

[21] F. Pernkopf. Bayesian network classifiers versus selective k-nn classifier. Pattern Recognition, 38(1) :1–10, 2005.

[22] Pedro Domingos et Michael J. Pazzani. Beyond independence : Conditions for the optimality of the simple bayesian classifier.

International Conference on Machine Learning, 1996.

[23] C. Chow et C. Liu. Approximating discrete probability distribu- tions with dependence trees. Information Theory, IEEE Tran- sactions on, 14(3) :462–467, 1968.

[24] Igor Kononenko. Semi-naive bayesian classifier. EWSL-91 : Pro- ceedings of the European working session on learning on Ma- chine learning, pages 206–219, 1991.

[25] M. Pazzani. Searching for dependencies in bayesian classifiers.

Learning from Data Artificial Intelligence and Statistics, 5 :239–

248, 1997.

[26] Meng Koon Chua et Douglas C. Montgomery. Investigation and characterization of a control scheme for multivariate qua- lity control. Quality and Reliability Engineering International, 8 :37–44, 1992.

[27] Necip Doganaksoy, Frederick .W. Faltin, et William T. Tucker.

Identification of out of control quality characteristics in a multi- variate manufacturing environment. Communications in Statis- tics - Theory and Methods, 20(9) :2775–2790, 1991.