• Aucun résultat trouvé

CHAPITRE 3 SYNTHÈSE DE L’ENSEMBLE DU TRAVAIL

3.5 Estimation de la probabilité du dommage

3.5.4 Processus par essai-erreur pour estimer la probabilité globale du dommage

Un processus par essai-erreur en 4 étapes a été testé. La première examine la probabilité globale du dommage en considérant toutes les règles générées par classe. La deuxième cherche à comprendre le comportement de la probabilité en passant par une base de données pour laquelle toutes les observations possibles sont connues. L’exemple de la table logique « ET » est donc examiné à cette fin. Basée sur le comportement des probabilités calculées pour la table logique, la troisième étape propose d’éliminer toute règle dont les accidents couverts le sont déjà par une règle partageant au moins une condition similaire. La quatrième étape vise à réduire la redondance d’information entre les règles en cherchant à considérer seulement le nombre minimal de règles couvrant tous les accidents.

3.5.4.1 Probabilité globale du dommage à partir de toutes les règles générées

Pour ce faire, nous posons que la probabilité du dommage équivaut à la probabilité de l’union des règles générées par classe. Ce choix se base sur le fait que toute classe est caractérisée par l’union des règles qui lui sont associées. La probabilité d’une union est définie par la formule de Poincaré (Éq. 4) (Jourdain, 2013). Elle stipule que pour un espace probabiliste de n éléments A1,

A2, ... An appartenant à A et partageant ou non des intersections, la probabilité de leur union se

calcule par : P[⋃𝑛𝑖=1𝐴𝑖] = ∑ ((−1)𝑘+1 𝓟(𝐴 𝑖1∩ 𝐴𝑖2∩ … ∩ 𝐴𝑖𝑘) 1≤𝑖1<𝑖2<⋯<𝑖𝑘≤𝑛 ) 𝑛 𝑘=1 (Éq. 4)

Dans notre contexte, A représente une classe d’accidents. Chacune des règles d’une classe correspond à un élément Ai. Alors, la probabilité globale du dommage correspondant à chacune

des classes sera :

P[Mortel] = P[⋃𝑛𝑖=1𝑃𝑖+] (Éq. 5)

P[Non mortel] = P[⋃𝑛𝑖=1𝑃𝑖−] (Éq. 6) où Pi- représente une règle de la classe « Non mortel ».

Ainsi : P[Mortel] = P[P1+ U P2+ U P3+ U P4+ U P5+ U P6+ U P7+]

P[Non mortel] = P[P1- U P2- U P3- U P4- U P5- U P6- U P7- U P8- U P9- U P10- U P11- U

P12-]

Lors du calcul de probabilité des intersections issues de la formule de Poincaré, une attention est portée aux cas particuliers suivants :

• les règles imbriquées dans d’autres. Cela occasionne une intersection avec inclusion. Par exemple, P2+ est incluse dans P6+. Alors, au moment de calculer la probabilité de

l’intersection entre ces deux règles dans la formule de Poincaré, on aura : P[P2+∩ P6+] =

P[P2+] et non P[P2+∩ P6+] = P[P2+] × P[P6+];

• les règles ayant des intersections vides entre elles. Par exemple : P1+ et P2+ ne peuvent

partager d’intersection puisque leurs conditions (E > 4,5) et (E ≤ 3,5) sont contradictoires. La probabilité de leur intersection sera donc nulle. Il en va de même pour toute

intersection d’une combinaison de règles comprenant P1+ et P2+.

Dans le cas des intersections non vides et dépourvues d’inclusion, la probabilité de l’intersection est le produit des probabilités de chaque règle. Par exemple, P[P1+∩ P7+] = P[P1+] × P[P7+].

Ainsi, P[Mortel] ≈ 0,979.

En procédant de même pour la classe “Non mortel”, on obtient : P[Non mortel] ≈ 0,119.

Tout compte fait, la somme des probabilités des deux classes en considérant toutes les règles générées vaut 1,099 > 1 (tous les calculs relatifs à la formule de Poincaré ont été effectués avec Excel pour tout le processus par essai-erreur). La complémentarité des probabilités n’est donc pas respectée. Les tests suivants avec la table logique « ET » permettront d’élucider la situation.

3.5.4.2 Probabilité globale du dommage : comparaison entre la base de données d’accidents et la table logique « ET »

Prenons trois indicateurs A, B et C décrivant des accidents. Supposons que la population d’accidents est celle d’une table « ET » à trois variables (cf. tableau 3.21).

Tableau 3.21 : Table « ET » à trois variables (indicateurs) décrivant 8 types d’accidents possibles

Accident No. Classe A B C

1 0 0 0 0 2 0 0 0 1 3 0 0 1 0 4 0 0 1 1 5 0 1 0 0 6 0 1 0 1 7 0 1 1 0 8 1 1 1 1

L’équation logique décrivant le comportement d’une table « ET » à trois variables est :

Classe = A ∩ B ∩ C (Éq. 7)

En d’autres termes, la « Classe = 1 » est décrite par la règle : (A = 1) ET (B = 1) ET (C = 1). En revanche, la « Classe = 0 » est décrite par les trois règles suivantes : (A = 0), ou (B = 0), ou (C = 0). L’union de ces trois règles forme la négation de l’équation 7. En effet, la loi de De Morgan stipule que : 𝐴 ∩ 𝐵 ∩ 𝐶̅̅̅̅̅̅̅̅̅̅̅̅̅ = 𝐴̅ ∪ 𝐵̅ ∪ 𝐶̅. Ainsi, les probabilités des classes « 1 » et « 0 » doivent être complémentaires.

Pour calculer la probabilité de chaque classe, nous utilisons les fonctions de masse 𝑝𝑌(𝑦) pour A, B, puis C disponibles au tableau 3.22.

Tableau 3.22 : Fonctions de masse associées aux indicateurs A, B et C de la table « ET » y = a y = b y = c Valeurs possibles de « y » 0 1 0 1 0 1 pY(y) 4/ 8 4/8 4/8 4/8 4/8 4/8 0,50 0,50 0,50 0,50 0,50 0,50

En calculant la probabilité de chaque classe à partir des fonctions de masse et en supposant l’indépendance des indicateurs, nous avons :

P[Classe = 1] = P[(A = 1) ∩ (B = 1) ∩ (C = 1)] = P[A = 1] × P[B = 1] × P[C = 1] P[Classe = 0] = P[(A = 0) U (B = 0) U (C = 0)]

où P[A = 1] = P[B = 1] = P[C = 1] = P[A = 0] = P[B = 0] = P[C = 0] = 0,5 d’après le tableau 3.23.

Par la formule de Poincaré, on obtient :

P[Classe = 0] = P[A = 0] + P[B = 0] + P[C = 0] - P[A = 0] × P[B = 0] - P[A = 0] × P[C = 0] - P[B = 0] × P[C = 0] + P[A = 0] × P[B = 0] × P[C = 0]

Alors :

P[Classe = 1] = 0,125

Leur somme vaut 1  Probabilités complémentaires. P[Classe = 0] = 0,875

Si LAD-WEKA génère des règles pour la table « ET » (cf. tableau 3.23), la somme des probabilités des deux classes donne une valeur différente de 1, en considérant toutes les règles générées. En effet, contrairement au cas de l’équation 7, l’union des règles générées par le logiciel pour la « Classe 0 » n’est pas le complément de la règle générée pour la classe « 1 ». Alors, la loi de De Morgan n’est pas vérifiable pour ces règles-là. Les calculs ci-après montrent ce propos.

Tableau 3.23 : Règles générées par LAD-WEKA à partir de la table « ET » Accidents couverts « Classe = 1 » P1+ = (A = 1) ET (B = 1) ET (C = 1) 8 « Classe = 0 » P1- = (B = 0) 1 2 5 6 P2- =(C = 0) 1 3 5 7 P3- = (A = 0) 1 2 3 4 P4- = (A = 1) ET(C = 0) 5 7 P5- = (A =1) ET (B = 0) ET (C = 1) 6 P6- = (A = 1) ET (B = 0) 5 6

En calculant la probabilité de chaque classe à partir des fonctions de masse tout en considérant les conditions sur les indicateurs groupeurs et leur indépendance, on obtient :

P[Classe = 1] = P[P1+] = P[(A = 1) ∩ (B = 1) ∩ (C = 1)] = P[A = 1] × P[B = 1] × P[C = 1] P[Classe = 0] = P[P1- U P2- U P3- U P4- U P5- U P6-] = P[(B = 0) U (C = 0) U (A = 0) U ((A = 1) ∩ (C = 0)) U ((A = 1) ∩ (B = 0) ∩ (C = 1)) U ((A = 1) ∩ (B = 0))]

Encore une fois, la formule de Poincaré permet de calculer la probabilité de l’union des règles de la classe « 0 ».

Alors :

P[Classe = 1] = 0,125

Leur somme vaut 0,563 < 1  Probabilités non complémentaires. P[Classe = 0] ≈0,438

La somme des probabilités des classes « Mortel » et « Non mortel », ainsi que celle des classes « 0 » et « 1 » de la table « ET » sont ≠ 1. Cette constatation montre que considérer toutes les règles générées par LAD-WEKA pour la classe d’une base de données ne permet pas nécessairement d’estimer la probabilité de la classe. Pour y arriver, il faudrait sélectionner uniquement l’échantillon de règles qui permettraient d’atteindre la complémentarité entre les probabilités des classes, comme ce fut le cas pour la table « ET » avec son équation logique. D’après les résultats pour la table « ET », cela pourrait être possible en éliminant chaque règle dont tous les accidents couverts (cf. les accidents biffés au tableau 3.24 et au tableau 3.25) sont également caractérisés par une autre règle partageant au moins une même condition avec la règle précédente.

3.5.4.3 Probabilité globale du dommage en considérant le critère du partage de conditions

En appliquant ce critère aux règles générées à partir de la base de données « MELITO » (cf. tableau 3.24 et tableau 3.25), les règles suivantes : P1+, P4+, P5+ et P6+ sont retenues pour calculer

la probabilité de la classe « Mortel ». Puis, les règles P1-, P3- et P7- sont retenues pour calculer la

probabilité de la classe « Non mortel ».

Tableau 3.24 : Choix des règles pour le calcul de probabilité du dommage « Mortel »

Règles obtenues avec LAD-WEKA pour la classe « Mortel » Accidents couverts P1+ (E > 4,5) 10 P2+ (E ≤ 3,5) ET (O ≤ 2,5) 1 2 3 4 5 7 13 16 17 20 22 P3+ (E ≤ 3,5) ET (I ≤ 2,5) 1 2 5 8 9 18 22 23 P4+ (M ≤ 1,5) ET (E ≤ 3,5) 3 5 7 9 13 16 17 18 22 23 P5+ (E ≤ 4,5) ET (I ≤ 2,5) 1 2 5 6 8 9 12 14 18 2223 P6+ (E ≤ 4,5) ET (O ≤ 2,5) 1 2 3 4 5 7 12 13 16 17 20 22 P7+ (I ≤ 2,5) ET (O > 2,5) 6 8 9 14 18 23

Tableau 3.25 : Choix des règles pour le calcul de probabilité du dommage « Non mortel »

Règles obtenues avec LAD-WEKA pour la classe « Non mortel » Accidents couverts P1- (I > 2,5) ET (E = 4) 15 21 P2- (M ≤ 1,5) ET (E = 4) ET (I ≤ 2,5) ET (O ≤ 2,5) 19 P3- (E ≤ 4,5) ET (I > 2,5) ET (O > 2,5) 11 21 P4- (M ≤ 1,5) ET (E ≤ 4,5) ET (I > 2,5) ET (O > 2,5) 21 P5- (M ≤ 1,5) ET (E = 4) ET (O ≤ 2,5) 15 19 P6- (E > 3,5) ET (I > 2,5) ET (O ≤ 2,5) 15 P7- (M ≤ 1,5) ET (E > 3,5) ET (O ≤ 2,5) 15 19 P8- (E = 4) ET (I > 2,5) ET (O > 2,5) 21 P9- (M > 1,5) ET (E ≤ 3,5) ET (I > 2,5) ET (O > 2,5) 11 P10- (M > 1,5) ET (I > 2,5) ET (O > 2,5) 11 P11- (E ≤ 3,5) ET (I > 2,5) ET (O > 2,5) 11 P12- (M ≤ 1,5) ET (E > 3,5) ET (I > 2,5) ET (O ≤ 2,5) 15 Ainsi : P[Mortel] = P[P1+ U P4+ U P5+ U P6+] P[Non mortel] = P[P1- U P3- U P7-] Alors : P[Mortel] ≈ 0,935

Leur somme vaut 1,227 ≠ 1 Probabilités non complémentaires. P[Non mortel] ≈ 0,292

Ainsi, ce n’est pas la méthode de calcul appropriée pour estimer la probabilité d’une classe.

3.5.4.4 Probabilité globale du dommage en considérant le minimum de règles couvrant tous les accidents

Pour éviter des redondances entre les règles considérées pour le calcul, une autre tentative serait de considérer uniquement le nombre minimal de règles permettant de couvrir tous les accidents. Ainsi, pour la classe « Mortel », il s’agit des règles : P1+, P6+ et P7+ (cf. tableau 3.26). Quant à la

Tableau 3.26 : Règles minimales couvrant les accidents de la classe « Mortel »

Règles minimales couvrant les accidents

P6+ P7+ P6+ P7+ P1+ P6+ P7+ P6+ P7+ P6+ P7+

Les 19 accidents de la

classe « Mortel » 1 2 3 4 5 6 7 8 9 10 12 13 14 16 17 18 20 22 23

Tableau 3.27 : Règles minimales couvrant les accidents de la classe «Non mortel »

Règles minimales couvrant les accidents

P3- P7- P3-

Les 4 accidents de la classe « Non mortel » 11 15 19 21

Ainsi :

P[Mortel] = P[P1+ U P6+ U P7+]

P[Non mortel] = P[P3- U P7-]

Alors :

P[Mortel] ≈ 0,821

Leur somme vaut 1,129 ≠ 1  Probabilités non

complémentaires.

P[Non mortel] ≈ 0,308

3.5.4.5 Issue des calculs de probabilités

Comme mentionné plus tôt, les classes « Mortel » et « Non mortel » ont été choisies pour avoir un espace échantillon d’accidents aux événements complémentaires. Cependant, les règles générées par LAD-WEKA pour une classe ne sont pas complémentaires par rapport à celles de l’autre classe (c.-à-d. l’ensemble des règles d’une classe ne correspond pas à la négation des règles de l’autre classe). La loi de De Morgan n’est donc pas vérifiée. Cela expliquerait l’impossibilité d’aboutir à des probabilités complémentaires pour ces deux classes d’accidents. En revanche, la probabilité de chaque règle a pu être obtenue en supposant que les indicateurs groupeurs étaient indépendants entre eux. Chacune de ces probabilités représente la probabilité

du dommage spécifique à une situation dangereuse représentée par une règle. Jumelées à la couverture de chaque règle, ces probabilités permettent de hiérarchiser les situations dangereuses et ainsi d’établir les priorités en matière de réduction du risque.

La base de données « MELITO » ne comprend pas tous les cas possibles d’accidents liés à un convoyeur à courroie. Si elle comprenait tous les cas possibles, comme pour la table logique « ET » amenant à une sortie « 1 » ou « 0 », il aurait été possible de déduire avec l’ALD la fonction booléenne caractérisant chaque classe. Les fonctions booléennes induiraient des probabilités complémentaires comme c’est le cas pour la somme des probabilités des sorties « 1 » et « 0 » de la table « ET ». Étant donné que les règles générées par l’ALD, pour une base de données au nombre d’observations incomplet, forment une fonction booléenne partiellement définie (Crama et al., 1988) plutôt qu’une fonction booléenne et comme le calcul des probabilités dépend des règles, il semble normal d’avoir obtenu une somme des probabilités des deux classes, différentes de 1. Il est donc envisageable que la complémentarité pour les classes caractérisées par ces règles ne soit pas atteinte. L’expression « fonction booléenne partiellement définie » signifie que l’ensemble des règles obtenues ne décrit pas tous les cas possibles d’accidents. Comme on ne peut vérifier une méthode en se basant uniquement sur un cas partiellement connu, il a été proposé de tester le calcul de probabilité globale du dommage à l’aide d’une table « ET » à trois variables ayant tous les cas possibles.