R EVUE DE STATISTIQUE APPLIQUÉE
J. R EYROLLE
Vieillissement et maintenance d’un système fortement modulaire. Estimation et factorisation des paramètres d’un modèle de Weibull
Revue de statistique appliquée, tome 27, n
o3 (1979), p. 5-14
<http://www.numdam.org/item?id=RSA_1979__27_3_5_0>
© Société française de statistique, 1979, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
VIEILLISSEMENT ET MAINTENANCE
D’UN SYSTÈME FORTEMENT MODULAIRE
ESTIMATION ET FACTORISATION DES PARAMÈTRES
D’UN MODÈLE DE WEIBULL*
D’après
une étude réalisée sur le fichier"rails"
SNCF par J.REYROLLE
(ex Conseiller scientifique au service "Recherche")
RESUME
La littérature technique abonde sur la fiabilité de systèmes dont les pannes surviennent
avec un taux d’incidence constant. Cette
hypothèse
nie le vieillissement. Elle rejette l’originedes pannes à
l’extérieur
du système. Ceci devrait nous rendre plus circonspects quant aux va- leursM.T.B.F. ( )
trouvées dans les banques de données.Nous nous plaçons ici dans une
hypothèse
d’usure accélérée, en choisissant le modèle de WEIBULL pourreprésenter
la croissance du taux d’incidence. La missionparticulière
du système étudié exigel’intégrité
de chaines formées d’éléments semblables et nombreux ensérie. Le
paramètre
d’échelle de ces élémentsdépend
de divers facteurs sur lesquels on attenddes choix techniques. Le
paramètre
de forme est commun et fort. L’organisation de la main- tenance impose alors une limite au-delà de laquelle il devient pluséconomique
de remplacerune portion du.
système
que de continuer à l’entretenir. Cette limite simplifie l’expressiondes statistiques exhaustives relatives au
paramètre
d’échelle. Leprésent
articledéveloppe
quelquesconséquences
de cette simplification quant auxproblèmes
de jugement sur échan- tillon rencontrés dans les choix techniques ; puis une factorisation duparamètre
parrégres-
sion
pondérée.
Enfin il propose un moyen de constituer une banque de données susceptibles d’éviter l’écueil habituel de colinéarité et sesconséquences
surl’interprétation
des résultats.PLAN 1 -
Système
étudiéII - Modèle fiabiliste III - Objectif de l’étude
IV - Problèmes de jugement sur échantillon relatifs au
paramètre
d’échelleV - Modélisation du
paramètre
d’échelleVI - Généralisation : cas ou le
paramètre
de forme est inconnuVII - Quelques difficultés relatives à la définition des modalités pour certains facteurs VIII - Plan d’observation visant une utilisation optimale de l’information
IX - Note bibliographique succincte
(*) Cet article a fait l’objet d’un
exposé
aux Journées Nationales de laqualité
le 28.3.79.(1) M.T.B.F. "Moyenne des Temps de Bon Fonctionnement" ou "Mean Time Between Failures" (terminologie anglo-saxonne).
Revue de Statistique Appliquée, 1979, vol. XXVI I, n° 3
Mots-Clés :
Weibull, Maintenance,
Modélisation6
1 - SYSTEME ETUDIE
Le
système peut
être un réseau de communication oud’alimentation,
voireun
échangeur tubulaire,
etc. Sa continuité doit être assurée pourqu’il puisse
accom-plir
sa mission. Sur legraphe qui
en donnel’image, chaque
arc est constitué d’élé- mentsnombreux, identiques quant
à leur fonction et à peuprès quant
à leur consti-tution,
assemblés bout à bout : nous lesappellerons
"maillons". Ils sontsujets
àune usure liée à
l’accomplissement
de leur mission. Ils sontremplaçables,
soit isolé-ment pour avarie
individuelle,
soit en groupe pour parer à leur vieillissement. Nousappellerons "tronçon
isochrone" un tel groupe de maillons successifs mis en service simultanément au cours d’uneopération
derenouvellement,
etrigoureusement identiques quant
à leur constitution.Le
découpage
en maillonspeut
n’être quefictif,
le mailloncorrespondant
alors à l’unité de
longueur,
ou mieux auquantum
deremplacement
en cas d’avarieindividuelle.
II - MODELE FIABILISTE
L’avarie d’un maillon est sans incidence sur l’état des maillons
voisins,
mais la discontinuitéqu’elle engendre pénalise
le service rendu par leréseau,
du moinssur les chemins
empruntant
l’arc dont un maillon au moins est avarié.Chaque
maillon subit un taux instantané d’avarie croissant comme unefonction
puissance
du "flot" écoulédepuis
sa pose sur l’arcauquel appartient
le maillon. C’est-à-dire que le flot écoulé avant avarie suit une loi de WEIBULL dont nousdésignerons
lesparamètres,
suivant les notations habituelles :j3
=paramètre
deforme,
commun à tous les maillons11 =
paramètre d’échelle,
variable(et
nous poserons À =r¡-(3 )
F(t)
= 1 - exp[- (t/11)(3]
= 1 - exp[- Àt(3]
= fonction derépartition
des flots técoulés avant
avarie ( 1 )
h(t) = [ 1 - F(t)]-1 d[F (t)]/dt = 03BB03B2t03B2-1
= taux instantané d’avarie.Le
paramètre
deforme j3 peut
être connu par une étudeantérieure,
ou inconnu(voir paragraphe
6 :généralisation).
Il est seulementsupposé supérieur
à2,
de sorte que le taux instantané d’avarieh(t)
croitrapidement.
Il s’ensuit que tout maillonayant supporté
un certain flot est affecté d’un taux instantané d’avarietrop impor-
tant pour rester
compatible
avec desopérations
de maintenance raisonnable : il ya lieu de renouveler tout le
tronçon
isochrone.Pratiquement
ce renouvellement a lieu dès que le taux deremplacement
indi-viduel atteint pour le
tronçon
une valeur de l’ordre de0,10.
Cette valeur est suffi- samment faible pourqu’on puisse négliger
laprobabilité
concernant l’occurrence de 2 avaries successives sur le même maillon.(1) On introduit souvent dans le modèle de WEIBULL un
3e paramètre
to, dit de posi-ton. C’est-à-dire que t est
remplacé
par (t - to) dans les expressions de f et h, qui sont nulles pour tout t to. Outre que l’échantillon nécessaire à l’estimation simultanée de 3paramètres
devient considérable, il faut remarquer qu’un tel modèle implique une modification du processus
physique de vieillissement : inexistant pour t to, il ne se mettrait en oeuvre que pour t > to.
Revue de Statistique Appliquée, 1979, vol. XXVI I, n° 3
7
III - OBJECTIFS DE L’ETUDE
L’homogénéité
de constitution et de mission d’un tel réseau estgénérale-
ment toute
relative,
de sorte que leparamètre
d’échelle 11 est très variable sui- vant le maillon considéré.L’hétérogénéité
résulte de facteursqu’on peut grossièrement répartir
commeci-dessous :
a)
constitution :plusieurs
modalitésqualitatives (matière, fournisseur, ...) ; b)
mission : facteurs liés à la nature et à l’intensité duflot,
ils caractérisentson
agressivité (difficiles
àquantifier
si le flot varie dans letemps) ;
c)
environnement : nombreux facteurssusceptibles
de modulerplus
oumoins
l’agressivité
du flot(profil
del’arc, ambiance,...) ;
On désire d’abord
permettre
des choixtechniques
relatifs au groupe(a),
entièrement
maîtrisable,
et au groupe(b) qui
ne l’estguère,
du moins à court terme, étant admisqu’on
subit entièrement la variabilitéprésentée
par les fac- teurs(c).
Ensuite,
on voudrait comparer différentespolitiques
de maintenance(cura-
tive et
préventive,
et de renouvellement(son
échéance étantmodulable).
N.B. - Sur un
tronçon
isochrone tel que défini auparagraphe I,
les facteurs de constitution et de mission sont constants. Les maillons ne diffèrentobjective-
Revue de Statistique Appliquée, 1979, vol. XXVII, no 3
8
ment que par les modalités des facteurs
d’environnement,
dont l’influence sur leparamètre
d’échelle est moindre que celle des autres facteurs. Il arrivequ’on
dis-pose de fichiers d’avaries très lourds où sont
consignés
de nombreux facteurs"d’environnement",
dont lerenseignement,
d’utilitédouteuse,
alourdit lesopé-
rations de maintenance. Un
objectif
subsidiaire est depréciser
l’information stric- tement utile.IV - PROBLEMES DE JUGEMENT SUR ECHANTILLON RELATIFS AU PARAMETRE D’ECHELLE
Sur un
tronçon isochrone,
considérons le sous-ensemble de maillonspré-
sentant les mêmes modalités pour les facteurs
d’environnement,
donc pour tous les facteurs(III N.B.).
A l’instant
d’observation,
trois données essentielles caractérisent ce sous-ensemble :
n = nombre de maillons
posés
àl’origine (au renouvellement)
t = flot écoulé
depuis l’origine
k = nombre de maillons
déposés
pour avaries individuellesNous avons affaire à un "essai
tronqué
avecremplacement".
Mais du faitque
k/n
estpetit ( 0,10)
il est aisé de montrer quepratiquement :
- l’occurence de deux avaries successives sur le même maillon est
impos- sible ;
- k suit une loi de POISSON de
paramètre n Àt(3,
- le
triplet
n t k résume toute l’information relative à X.C’est-à-dire que les instants d’avarie n’interviennent
pratiquement
pas, comme s’ils’agissait
d’une loiexponentielle.
Plusprécisément,
l’estimation du maximum de vraisemblance estpratiquement
dans ce cas :avec
On
peut développer
sur cet estimateur les méthodesclassiques
dujugement
sur
échantillon,
dans le but parexemple
de comparer deuxtypes
de maillons(deux
modalités du facteur
a)
ou de testerl’apport
d’un nouveauconstituant,
ou de donner un intervalle de confiance auxopérations
de maintenance àprévoir
dans lapériode
couvrant la tranche de flot[t ,
t+ At].
Unegénéralisation
desabaques
de M. CAVE
permet
enparticulier (voir annexe)
de résoudre leproblème
de dimen-sion relatif à ce
plan
decontrôle, qu’on
détermine ici par leproduit nt03B2.
S’il s’avère que le
tronçon
isochrone n’est pas assezimportant, compte
tenu del’obligation
dedépose (troncature)
dès que le taux d’avarie crée desproblèmes
insolubles pour la
maintenance,
onpeut augmenter
laquantité
d’information enréunissant
plusieurs
sous-ensembles £ de maillonsprésentant
la mêmemodalité,
mais
répartis
surplusieurs tronçons
isochrones dont les dates de pose, donc les flots à la troncature,peuvent
différer.Revue de Statistique Appliquée, 1979, vol. XXVII, n° 3
9
On montre encore dans ce cas que l’estimation linéaire sans biais de moindre variance est :
avec
Cet estimateur
permet
de faireporter
lescomparaisons précédentes
sur desensembles de maillons
plus importants. Si03A3 k
estsuffisant (> ...30
parex.)
pour chacun des deuxtypes de maillons I et II, le critère I - II Var I + Var II suit VVarXi+VarXn
pra-tiquement
une loi normale réduite dansl’hypothèse
nulle ou les deuxparamètres
sont
égaux.
On estimera les variances par : -
Ce critère
permet
deséparer
les facteurs lesplus importants quant
au para- mètred’échelle,
parexemple
à l’aide d’uneprocédure
desegmentation portant
sur un sous-ensemble très
important
de maillons.V - MODELISATION DU PARAMETRE D’ECHELLE
Ayant
sélectionné par une étudepréalable
un nombre limité de facteursqui
semblent
importants quant
auparamètre d’échelle,
ilpeut
être intéressant de re- chercher un modèleexplicatif
de ceparamètre
si l’ondispose
d’un échantillon suf- fisant. Lalogique
etl’exigence
desimplicité
s’accordent souvent sur un modèlemultiplicatif
de la forme :r = indice d’un lot
homogène
de maillonaij
= effet de lamodalité j
du facteurAi.
Xijr =
variable indicatrice de cette modalité sur le lot d’indice r.Ce modèle se linéarise en :
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 3
10
si.
Revue de Statistique Appliquée, 1979, vol. XXV Il, no 3
11
Les effets aij s’obtiendront par une
régression qui revient,
dansl’espace
desvariables,
àprojeter
le vecteurcorrespondant
à la variable. àexpliquer
surl’hyper- plan qu’engendrent
les vecteurscorrespondant
aux variablesexplicatives (les
indi-catrices
Xijr).
Il convient ici de noter
qu’on
nedispose
pas de valeurs "observées" pour03BBr
mais seulement d’estimationÀr
calculées commeindiqué
auparagraphe
IV(c’est kr qui
estobservé), après
réunion en un même "lothomogène"
de tousles maillons
présentant
une même combinaison r de modalités pour l’ensemble des facteursexplicatifs.
Toutes ces estimations sont sansbiais, globalement
indé-pendantes,
mais de variancesinégales.
Pour obtenir des estimations
âij qui jouissent
d’une certaineoptimalité (centrées,
varianceminimale),
le théorème de GAUSS-MARKOV nous conduit àpondérer chaque
valeurLog Àr
par un coefficient inversementproportionnel
à sa variance
a;.
Ceci revient à définirl’orthogonalité,
dans laprojection
envisa-gée,
par lamatrice diagonale [03B8rr’/03C32r],
inverse de la matrice des covariances.Le
paragraphe
IV donne :d’où l’on tire :
que l’on estimera par
La matrice
diagonale
depondération,
définissantl’orthogonalité,
sera donc :[Orr’ kr].
La réunion en un même lot de tous les maillons
présentant
une même combi-naison r de
modalités, quel
que soit letronçon d’origine,
conduit à l’estimationunique Àr
pour cette combinaison. Ainsi la variance de cette estimation est-elleréduite,
et lerisque
minimisé de trouver zéro pour le nombre d’avaries donc pourÀr ;
enfin la distribution des résidus est normalisée cequi
facilitel’interprétation classique
des résultats par le test de FISHER.Remarque
sur lesystème
depondération.
Il valorise l’information
portée
par les lots de faibleimportance
mais cor-respondant
à laconjonction
de circonstances très défavorables. Il élimine par contre des lots de taille moyenne dont le faible taux d’avarie... et le hasard conduisent à un nombre nul d’avarie. Pour nousprémunir
contre ceteffet,
onpeut remplacer
le coefficient depondération kr
par03A3nt03B2 qui demeure, quelque
Q
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 3
12
soit le
paramètre d’échelle, proportionnel
àl’espérance
dekr.
Il faut toutefois dans ce cas, à cause de la transformationlogarithmique,
fixer un seuil pour letotal
n2t
de sorte que soient éliminés tous les lotstrop petits,
dont enparti-
Q
culier ceux pour
lesquels k,
= 0.Les résultats des deux
ajustements
sontplus complémentaires
que contra- dictoires : ilsapportent
sur le rôle des différents facteurs deséclairages
différents.Un autre intérêt de la
pondération
parn t(3 apparaîtra
en VIII.VI - GENERALISATION DE LA METHODE AU CAS OU LE PARAMETRE DE
FORME 03B2
EST INCONNUSi tous les maillons d’un même lot
homogène
rprésentent
la même valeurtr
pour le flot cumulédepuis
la pose, le modèleprécédent s’écrit, après
linéarisa-tion
Sous cette forme on voit
que j3 peut
être introduit comme unparamètre
inconnu que l’on estimera par la
régression,
pourvuqu’il
soit admis que sa valeur estindépendante
des modalitésprises
sur les facteursexplicatifs(l).
Cettehypo-
thèse est le
plus
souvent trèsréaliste(2).
La nouvelle version du modèledispense
alors de
l’investigation préalable
nécessaire à connaître la valeur dej3.
Onpeut
même
dire, compte
tenu du caractère trèsgénéral
de la loi deWEIBULL, qu’il
suffit de savoir que le taux instantané d’avarie croit
rapidement
avec le flot écoulé.Le
système
depondération
reste lemême,
c’est-à-dire que la matrice définissantl’orthogonalité
esttoujours : [8 rr’, kr].
La seule contrainte est d’avoir à travailler avec un
plus grand
nombre d’obser-vations,
chacunecorrespondant
à un "sous-lot" de même valeur pour le flot t, issu engénéral
d’un mêmetronçon
isochrone de pose, et conduisant à des va-riances
plus grandes
donc à unrisque
accru de nullité pour l’estimationÀ.
VII -
QUELQUES
DIFFICULTES RELATIVES A LA DEFINITION DES MODALITES POUR CERTAINS FACTEURS Il y a contradiction entre :- finesse de la
partition,
nécessaire pour éclairer le rôle des facteurs :-
importance
des lotshomogènes,
souhaitable pour diminuer la variance deXr
et lerisque
denullité,
et normaliser la distribution des résidus.(1) Qualité des estimateurs. S’il est vrai
que = k/nt03B2
soit toujours l’estimateur du maximum de vraisemblance, on peut s’interroger surl’estimateur
fourni par la minimisation de la somme des carrés des résidus. Du moins, dans la condition où l’approximation normaleest valable pour la distribution de Log k (et alors le biais introduit par la transformation loga- rithmique est minime), peut-on admettre
l’équivalence
de la méthode des moindres carrés(pondérés)
avec celle du maximum de vraisemblance.(2) Si Tl
dépend
étroitement del’agressivité
du flot et de l’environnement et de laqualité
des maillons, il semble bien que j3 soit une constante
spécifique
de la mission du système.Revue de Statistique Appliquée, 1979, vol. XXVI I, n° 3
13
En
particulier
onperdra
de l’informationchaque
foisqu’un
facteur sepré-
sente normalement comme une variable continue. Dans ce cas, il
s’agira
moinsd’estimer l’effet d’une modalité que de tester le caractère
significatif
de l’effet.Encore faut-il
disposer
d’une bonnepartition.
Le
paragraphe
IIIévoque
la difficulté propre aux facteurs "de mission".Dans le cas, par
exemple,
de courants de trafictechniquement hétérogènes,
ilest intéressant de mettre en lumière les différences
d’agressivité
entre ces diverscourants. Leurs effets cumulatifs sur
l’émergence
des avaries rendent cettesépara-
tion malaisée. Un
procédé
consiste àrépartir
lestronçons
isochrones en classesprésentant
des similaritésquant
à la nature des flots écoulésdepuis
la posejusqu’à
la troncature. Une
analyse
factorielle descorrespondances
entretronçons
iso- chrones et nature de traficparait indiquée
pourengendrer
des classes de similarité.Si le test de FISHER révèle alors comme
significatif
le facteur "nature detrafic",
il reste naturellement à découvrir les courants
responsables
des différences entre les modalités ainsi constituées.Enfin on a vu en VI que l’estimation par
régression
duparamètre
deforme exige
unepartition
en"sous-lots", correspondant
à des classeshomogènes
pour le flot cumulté t,qui augmente
ladispersion
desestimations À
et lerisque
de nul-lité. Pour s’affranchir de la contrainte issue des observations k =
0,
HAROLD J.BALABAN et KENT HASPERT
proposent
une méthode(voir
notebibliogra- phique).
Elle consiste à faire unepremière régression
ne tenant pascompte
des sous-lots pourlesquels
k = 0. Puis à calculerl’espérance
du flot t relatif à la pre- mière défaillance sur lestronçons
où k = 0 enprenant pour À
la valeur issue decette
régression.
Enfin à réitérer larégression
enprenant
encompte
tous les lots.VHI - PLAN D’OBSERVATION VISANT UNE UTILISATION OPTIMALE DE L’INFORMATION
De telles études
s’appuient
leplus
souvent sur ladisponibilité
de fichiers trèslourds,
constitués sans but bien défini : çapeut toujours
servir àquelque
chose... et
puis
l’ordinateur est là... Lepersonnel chargé
de la maintenance est d’autant moins motivé pour la collecte derenseignements
minutieuxqu’il
n’envoit jamais
les retombées sinon comme sanction d’une franchisetrop
zélée.Le raffinement du traitement multidimentionnel mis en oeuvre est souvent sans commune mesure avec la
qualité
de telsfichiers,
dont le taux d’erreur croîtavec le volume et la
complexité.
Ces données "tout-venant" débouchent alorssur des résultats
médiocres,
d’autantplus ambigus
que les facteursproposés
àl’expli-
cation sont naturellement
plus
corrélés entre eux. Uneanalyse "pas
àpas",
solution
chère,
sert souvent d’alibi au refus de la mise en cause de ces fichiers.Il semblerait du moins
préférable
de rechercher aupréalable
lescomposantes prin- cipales
de cesfacteurs ;
encore faudrait-ilqu’elles
soient facilementinterprétables,
ce
qui
n’est pas souvent le cas.Mais la remarque sur le
système
depondération (paragraphe V)
noussuggère
un
plan
de collecte des données dontl’analyse échappe
pour l’essentiel aux incon- vénientssignalés.
Leproduit nr tf, proportionnel
àl’espérance
du nombrekr d’avaries,
mesure enquelque
sorte, avant touteobservation,
laquantité
d’infor-mation
apportée
par le lot r.Après
élimination de facteurs manifestement neutres,Revue de Statistique Appliquée, 1979, vol. XXVII, n° 3
14
sur
l’analyse grossière
du fichierdisponible,
on constituera unplan
d’échantillon- nage. Il inclura destronçons donnant,
pour chacune des combinaisons r de moda-lités,
unproduit nota
très voisin d’une même valeur fixé àpriori,
etcompatible
avec la
précision
souhaitée... et letemps
d’obtention.Si j3
est inconnu il suffitde
disposer
d’unepremière approximation.
Onpeut aussi, après
choix des tron-çons
isochrones,
faire en sorte que l’information soit stockéejusqu’à dépose
collec-tive des
tronçons,
moment où elle est laplus
richecompte
tenu de la croissance du taux instantané d’avarie. Ainsipourra-t-on
tout à la foisalléger
la collecte et aboutir à des résultats facilementinterprétables.
IX - NOTE
BIBLIOGRAPHIQUE
SUCCINCTECette
approche
a été mise en oeuvre sur le fichier "rails" de la S.N.C.F. en1974. Par
ailleurs,
HAROLD S. BALABAN et KENT HASPERT[ 1 ] développent,
dans le cas d’un modèle de WEIBULL où seul le
paramètre
d’échelle estinconnu,
une
approche plus générale
en ce sensqu’elle n’exige
pas de limite pour le taux dedépose k/n. S’appuyant
exlcusivement sur unestatistique
de rangs, elleperd cependant
unepartie
de l’information(1).
Deux cas sontenvisagés :
avec et sansremplacement
des défaillants.J.C. LIGERON et R. GOARIN
[2] exposent
une factorisation du taux dedéfaillance,
dans lecas j3
= 1(loi
de survieexponentielle)
paranalyse
des corres-pondances multiples ; puis
ils modélisent sur les facteurs retenus par différentes méthodesadaptées
à la forme dumodèle ;
enfin ilsproposent
uneprocédure bayesienne
d’améliorationprogressive
de leurs estimations.REFERENCES
[1] HAROLD
S. BALABAN et KENT HASPERT -Estimating
WEIBULL para- meters for ageneral
class of devices from limited failures data. I.E.E. Tran- sactions onReliability,
Vol.21, n° 2,
Mai 1972.[2]
LIGERON J.C. et GOARIN R. - Modélisation multidimensionnelle des taux de défaillance descomposants électroniques. R.S.A.,
Vol.XXII, n° 3,
1974.(1) La perte d’information liée au remplacement des valeurs tQ par leurs rangs peut être notable, du moins si k/n est grand.
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 3