• Aucun résultat trouvé

Z

0

u(t)f (t, θ)dt, (II.12)

où u(t) est une fonction mesurable [27]. θ est le vecteurs des paramètres de la fonction de densité

f .

Le fondement théorique de cette approche résulte de la convergence asymptotique des mo-ments empiriques vers les momo-ments théoriques,

1 n n X i=1 u(ti) → gm(θ), (II.13) lorsque n → ∞.

La détermination des paramètres nécessite autant d’équations indépendantes que de para-mètres dans la distribution choisi a priori. Le problème se résume donc à trouver un nombre suffisant d’équations pour déterminer les paramètres de la loi sous-jacente des données. Pour plus de détail, le lecteur peut se référer aux travaux de Cousineau [17]. À l’instar de la méthode de Vraisemblance, l’approche par les moments nécessite la connaissance a priori d’une loi dé-pendant des paramètres θ. Après une comparaison entre les moments empiriques et théoriques, nous déterminons le vecteur de paramètres θ qui vérifie toutes les égalités. Nous remarque-rons que cette technique devient difficilement exploitable lorsque les expressions des moments théoriques ne sont pas linéaires en fonction des paramètres de la loi a priori.

Enfin, nous notons que les méthodes des moments ainsi que le maximum de vraisemblance sont tributaires de la complexité du système d’équations à résoudre.

1.3 Analyse de l’approche paramétrique

L’approche paramétrique est très utilisée dans la modélisation des distributions de durées de vie. Sa résolution demeure difficile pour certains types de distribution. Nous pouvons le voir à travers les travaux de la littérature où les auteurs proposent des solutions pour garantir la convergence. Parmi ces travaux, nous citons ceux developpés dans [18] [19] [20] dont les résul-tats reposent sur la mesure de la MLE. D’autres travaux tels que [16] [22] [23] reposent sur une

mesure d’erreur pondérée par rapport à la fonction de réparation empirique ou lisse (exemple : méthode du Noyau de Parzen). Cette dernière mesure est plus adaptée en comparaison à la mesure MLE, pour le cas de la distribution de Weibull à trois paramètres. A travers les tra-vaux cités ci-dessus, nous nous rendons compte que l’estimation paramétrique d’une seule loi de probabilité sous-jacente suscite d’énormes difficultés (pour la distribution de Weibull). Cette difficulté augmente dans le cas de mélange de lois de durées de vie. En effet, en plus de l’iden-tification des modes de défaillances présents dans les données (choix du modèle), s’ajoutent l’estimation du poids associé à chaque mode.

Les travaux de Krifa [28] considèrent un mélange de deux lois de distribution de Weibull

afin de prédire le comportement de matériaux soumis à plusieurs processus de rupture avec un

modèle à 5 paramètres. Le travail de Klein et Bertsche [29] propose un algorithme génétique

comme technique de résolution en cas de mélange des données de durées de vie distribuées selon des lois de Weibull. L’algorithme génétique est utilisé dans cette analyse pour identifier le nombre de distributions sous-jacentes, les paramètres de chacune des lois et leurs poids par minimisation d’une mesure d’erreur par rapport à la fonction de répartition.

L’approche paramétrique combinée à la mesure de vraisemblance ou avec une erreur par rapport à la fonction de répartition empirique est un moyen efficace pour trouver les lois de distribution des durées de vie des équipements. Cependant, il faut noter que cette démarche repose sur une hypothèse a priori pouvant être fausse.

2 Méthode d’estimation semi-paramétrique

Dans l’approche semi-paramétrique l’hétérogénéité est prise en compte par des co-variables indépendantes de l’usure due à l’âge. Cet aspect nécessite la connaissance des facteurs (va-riables exogène ou explicatives) susceptibles d’impacter la distribution des durées de vie en plus des durées de vie. La fonction de risque instantanée λ(t) est liée à la fonction de densité de probabilité f (t) par : f (t) = λ(t) exp Z t 0 λ(u)du  , (II.14)

Les modèles semi-paramétriques doivent être identifiée pour assurer la convergence de l’estima-tion [30]. Les modèles usuels sont ceux de la classe à risque multiplicatif tel que :

II.2 Méthode d’estimation semi-paramétrique

où W (Z) est une fonction qui caractérise les facteurs d’influences (co-variable) et λ0(t) repré-sente la fonction de risque de défaillance intrinsèque dépendant de l’âge de l’équipement. La fonction λ0(t) est choisie de manière à appartenir à une classe de distribution paramétrique (exponentiel, Weibull, log-normale,· · · ). La fonction W (Z) est généralement de la forme [30] :

n log linéaire (modèle de Cox) : W (Z) = exp (AZ), n linéaire : W (Z) = 1 + AZ,

n logistique : W (Z) = log (1 + exp (AZ)).

Le modèle le plus répandu est celui de Cox introduit en 1972 souvent appelé aussi le modèle à

risque proportionnel (Proportional Hazard Model (PHM)) [31]. Le modéle de Cox est largement

exploité en maintenance [32] [33] [34]. Le modèle de Cox se caractérise par son expression des facteurs d’influence :

W (Z) = exp (AZ) , (II.16)

où A est le vecteur des facteurs d’influence défini par A = (A1, A2, · · · , Ak) et le coefficient

Aj {j = 1, · · · , k} est l’effet du facteur d’influence j sur la durée de vie. La vraisemblance de Cox

ne prend pas en compte λ0(t) et permet la détermination du vecteur A qui maximise la mesure

de vraisemblance de Cox (Lcox). Cette mesure définit par le risque de survie conditionnelle :

LCox(Z) = k Y i=1 exp (AZi) P

j∈R(i)exp (AZj). (II.17)

Avec (ti 6= tj si i 6= j pour tout (i, j)), et où R(i) est composé des durées de vie tj supérieure à

ti. Zi et Zj les valeurs prises par les facteurs d’influence à ti et tj. Par conséquent, les durées n’interviennent que dans la construction de R(i) c’est-à-dire par leur rang (statistique d’ordre). Nous notons souvent par pi le risque de survie conditionnelle à partir de l’instant ti.

pi = Pexp (AZi)

j∈R(i)(AZj). (II.18)

Cette manière d’intégrer l’hétérogénéité à travers des variables explicatives réduit les marges d’erreur et fournit un meilleur pouvoir de prédiction même en présence d’échantillon de taille faible. Elle nécessite la gestion, en plus des données de durées de vie, des données sur les facteurs d’influence.

Dans la suite d’autres approches connues pour leurs robustesse seront exposées. Ces mé-thodes sont particulièrement plus appropriées au traitement des données hétérogénes

contrai-rement aux modèles paramétriques ou semi-paramétrique dont selon Saporta [14] la quantité

durées de vie.

3 Méthodes d’estimation non-paramétrique

Les approches non-paramétriques sont exemptes de connaissance a priori de la loi des durées de vie. Elles ne font état d’aucune loi de distributions sous-jacentes pour les données. Elles se basent plutôt sur la structure des données dans l’échantillon pour estimer les lois caractérisant les durées de vie d’un équipement. Les approches non-paramétriques sont regroupées en deux classes à savoir, les méthodes basées sur les distances de voisinage et celles basées sur des fonctions.