5.2 Surveillance et conditions d’utilisations des composants
5.2.2 Conditions d’utilisation et modèles de durée de vie
Actuellement, les modèles de durées de vie sont obtenus à partir de l’historique de
maintenance disponible par véhicule. Ils sont élaborés par composant pour une gamme de
véhicule donnée et par année de mise en circulation. Les résultats obtenus décrivent des
modèles avec une variance très importante. La méconnaissance des conditions d’utilisation
est l’explication principale de cette variance. En effet, les pannes observées dans l’historique
peuvent provenir de composants utilisés dans des conditions totalement différentes. Dans
ce contexte, considérer un modèle unique pour un jeu de données de pannes s’avère
inapproprié et conduit à définir un modèle avec une variance importante.
L’objectif est donc de réussir à relier les différents profils d’utilisation d’un composant à des
modèles de durée de vie. Dans cette sous-partie, une méthode basée sur l’expérience est
proposée pour établir cette connexion. Sous l’hypothèse que les conditions d’utilisation du
composant affectent sa fiabilité et sa loi de durée de vie, une méthode basée sur les
modèles de mélange peut être utilisée. Considérer un modèle de mélange de lois pour un
composant revient à considérer qu’à chaque profil d’utilisation correspond une loi. De plus,
lorsqu’on observe la durée de vie d’un composant sans connaître son profil d’utilisation, sa
loi de durée de vie suit une loi de mélange des lois liées à chaque profil d’utilisation.
Pour mettre en place la méthode, nous considérons avoir accès à un historique de pannes
par composant. Nous supposons également qu’un composant évolue au cours de sa vie
entre un environnement dit « normal » et un environnement dit « stressé ». Pour chacune
des pannes contenues dans l’historique, nous faisons l’hypothèse que la variable 𝜏
𝑖,𝑝𝑎𝑛𝑛𝑒𝑆est
disponible. Celle-ci correspond au ratio de la distance passée par un composant 𝑖 dans un
environnement « stressé » sur la distance totale parcourue à la panne.
102
Définition des modèles de mélange
Nous sommes en présence d’un modèle de mélange de lois de probabilité lorsque les
données proviennent d’une source contenant plusieurs sous-populations (Razali &
Al-Wakeel, 2013). Chaque sous-population est modélisée de manière séparée par une loi de
probabilité. La population totale est un mélange de ces sous-populations. Dans notre
contexte, chaque sous-population représente donc un profil d’utilisation différent pour un
composant. La fonction de densité de la loi de mélange est donnée par:
𝑔(𝑥) = ∑ 𝜋
𝜀𝑓
𝜀𝑠
𝜀=1
(𝑥, 𝜑
𝜀) (5.3)
avec 𝑠 le nombre supposé de sous-populations dans le mélange étudié, 𝜋
𝜀la proportion de la
𝜀-ième sous-population dans le mélange et 𝑓
𝜀(𝑥, 𝜑
𝜀) la densité de probabilité de la 𝜀 ième
sous-population. De même, la fonction de répartition de la loi de mélange est donnée par:
𝐺(𝑥) = ∑ 𝜋
𝜀𝐹
𝜀𝑠
𝜀=1
(𝑥, 𝜑
𝜀) (5.4)
avec 𝐹
𝜀(𝑥, 𝜑
𝜀) la fonction de répartition de la 𝜀-ième sous-population.
L’estimation des paramètres de la loi de mélange est effectuée avec la méthode du maximum de
vraisemblance. Cette méthode consiste à rechercher les valeurs des paramètres qui maximisent le
logarithme de la vraisemblance des données observées. Pour atteindre cet objectif en présence de
données incomplètes, l’algorithme EM (Expectation-Maximisation) est majoritairement utilisé
(Lebarbier & Mary-Huard, 2008). Cette procédure va ainsi permettre, à partir de l’historique des
pannes, d’estimer les paramètres du modèle de mélange pour un nombre donné de 𝑠
sous-populations.
Cependant, en principe, le nombre de sous-populations est inconnu. Même si l’on dispose
d’informations a priori sur les données, il est difficile de le fixer par avance. Pour déterminer le
nombre de sous-populations 𝑠, le coefficient de détermination permettant d’appréhender la
qualité de l’ajustement entre les données initiales et les données estimées avec le modèle de
mélange est introduit (Razali & Al-Wakeel, 2013). Le coefficient de détermination s’exprime de la
façon suivante:
𝑅
2= 1 −∑
𝑁𝑑(𝜗
𝑒− 𝜗̂)
𝑒 2 𝑒=1∑
𝑁𝑑(𝜗
𝑒− 𝜗̅)
2 𝑒=1(5.5)
avec 𝑁
𝑑le nombre de données dans la population totale, 𝜗
𝑒les fréquences relatives associées aux
données observées, 𝜗̂
𝑒les valeurs estimées en utilisant les lois de mélange et 𝜗̅ la moyenne
des 𝜗
𝑒. La qualité de l’ajustement augmente naturellement avec le nombre de sous-populations
103
considéré. Pour éviter de choisir toujours le nombre maximal de sous-populations défini par notre
connaissance a priori, un seuil de 0.99 est fixé pour le coefficient de détermination. Ainsi, le
premier modèle de mélange à 𝑠 sous-populations avec un coefficient de détermination supérieur à
0.99 est retenu. Cette limite a été fixée suite à des tests sur des données où le nombre de
sous-population était initialement connu. Pour choisir le nombre de sous-sous-populations dans le mélange,
le critère BIC (Bayesian Information Criteria) est également très utilisé. Néanmoins, dans le
contexte de notre étude, les résultats obtenus avec ce critère sont moins pertinents.
Affectation des données a posteriori
Une fois le nombre de sous-populations et les paramètres du mélange identifiés, il est
ensuite nécessaire de pouvoir affecter chaque panne observée à une sous-population
donnée. Pour ce faire, l’idée naturelle est de classer la panne dans la sous-population dont
elle a le plus de chances d’être issue au vue de sa valeur observée et des caractéristiques des
sous-populations. On s’intéresse donc ici à la probabilité que l’individu 𝑎 appartienne à la
sous-population 𝐵, sachant que l’on a observé pour cet individu la valeur 𝑥
𝑎pour sa date de
défaillance. Cette probabilité notée 𝜌
𝑎𝐵est appelée probabilité a posteriori que l’individu𝑎
soit dans la population 𝐵 et elle est donnée par :
𝜌
𝑎𝐵= ∑𝜋
𝐵𝑓
𝐵(𝑥
𝑎, 𝜑
𝐵)
𝜋
𝜀𝑓
𝜀𝑠
𝜀=1
(𝑥
𝑎, 𝜑
𝜀) (5.6)
En s’appuyant sur cette probabilité, une classification basée sur la règle du Maximum A
Posteriori (MAP) va être utilisée (Lebarbier & Mary-Huard, 2008). Nous allons ainsi classer
l’individu 𝑎 dans la sous-population 𝐵 correspondant à la probabilité 𝜌
𝑎𝐵maximale pour cet
individu. Si cette quantité est proche de 1 pour une sous-population, l’individu est classé
avec un faible risque d’erreur dans cette sous-population. Si au contraire les probabilités
sont assez proches, le classement de l’individu comporte un risque d’erreur plus important.
En pratique, cette affectation réalise une classification des pannes observées. Pour rappel, la
variable 𝜏
𝑖,𝑝𝑎𝑛𝑛𝑒𝑆est supposée connue. Cette variable permet dans ce contexte de connaître
les conditions d’utilisation pour chaque panne répertoriée. Notre démarche consiste alors à
apprendre le ou les seuils sur 𝜏
𝑖,𝑝𝑎𝑛𝑛𝑒𝑆pour distinguer les différentes sous-populations à
partir de l’ensemble d’apprentissage classifié par une règle MAP. Ce ou ces seuils sont
ensuite utilisés quand une décision de maintenance doit être prise pour sélectionner le
modèle de durée de vie adéquat pour un composant. Cela signifie qu’à l’instant 𝑡, quand une
décision de maintenance doit être prise, la variable 𝜏
𝑖,𝑡𝑆est utilisée pour sélectionner le
modèle de durée de vie adéquat en fonction des conditions d’utilisation. Cette variable 𝜏
𝑖,𝑡𝑆correspond au ratio de la distance passée par un composant 𝑖 dans un environnement
« stressé » sur la distance totale parcourue à l’instant 𝑡.
104
Illustration de la méthode
L’objectif de cette illustration est de mettre en œuvre la méthode basée sur les modèles de
mélange que nous venons de détailler. L’histogramme (cf. figure 5.9) représente l’ensemble
des pannes répertoriées pour un composant 𝑖 donné. Chaque panne mentionnée dans
l’histogramme est associée avec sa variable 𝜏
𝑖,𝑝𝑎𝑛𝑛𝑒𝑆. A partir de cette population initiale,
l’objectif va être de déterminer si les pannes obtenues pour ce composant sont issues d’une
ou de plusieurs sous-populations.
Figure 5.9: Répartition des pannes pour le composant i
Considérons, dans une première étape le cas avec 𝑠 = 1 sous-population. Une loi de Weibull
est utilisée pour modéliser la durée de vie de ce composant. A noter que la loi de Weibull est
la loi de durée de vie la plus largement utilisée pour modéliser des ensembles de pannes.
Pour ce jeu de données, si nous considérons uniquement une sous-population et une loi de
Weibull pour l’estimation, on obtient un coefficient de détermination égal à 𝑅
𝑠=12= 0.986.
Figure 5.10: Modèles de durée de vie obtenus avec 𝒔 = 𝟏 et 𝒔 = 𝟐
1 1.5 2 2.5 3 3.5 x 105 0 200 400 600 800 1000 1200
Kilométrage des pannes
N o m b re d e p a n n e 0 1 2 3 4 5 x 105 0 0.5 1 1.5 2 2.5x 10 -5 Kilométrage [Km] D e n si té d e p ro b a b ili té
Modèle s=2, 1ere sous-population Modèle s=2, 2eme sous-population Modèle s=1