R EVUE DE STATISTIQUE APPLIQUÉE
A LI H AMLILI
Estimation non-paramétrique par régression antitone de la croissance de fiabilité des logiciels
Revue de statistique appliquée, tome 48, n
o3 (2000), p. 39-56
<http://www.numdam.org/item?id=RSA_2000__48_3_39_0>
© Société française de statistique, 2000, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ESTIMATION NON-PARAMÉTRIQUE PAR RÉGRESSION
ANTITONE DE LA CROISSANCE DE FIABILITÉ
DES LOGICIELS
Ali Hamlili
ENSIAS, LMD, B.P. 713,
Agdal,
Rabat, Maroce-mail: hamlili@ensias.ac.ma
RÉSUMÉ
Dans cet article, nous nous intéressons à l’étude
statistique
de la fiabilité deslogiciels
au cours des
phases
de test et de maintenance. Ainsi, nous proposons une méthodedynamique
d’estimation et de
prédiction
de la croissance de la fiabilité deslogiciels qui
se base surl’outil
statistique
de larégression
antitone. Cette méthode nous permet d’étudier l’évolution de la croissance de fiabilité sans introduired’hypothèses
trop restrictives. Pour ce faire, nousmontrons que l’estimateur du maximum de vraisemblance sous des restrictions d’ordre est
équivalent
à l’estimateur obtenu par larégression
antitone. Cequi
nous amène à définir lanotion d’information de Kullback-Leiber cumulée sur le cône convexe des fonctions antitones pour la famille des processus
exponentiels.
Enfin, nous confrontons notre modèle àcinq
modèlesparamétriques classiques,
lesplus
cités dans la littérature, sur desjeux
de données émanant deprojets
réels de fiabilité deslogiciels
et nous comparons lescapacités prédictives
des modèlesen utilisant la méthode du
u-plot.
Mots-clés : Fiabilité des
Logiciels,
modèle de croissance defiabilité,
intensité conditionnelle dedéfaillance, régression
antitone,information
de Kullback-Leiber,u-plot.
ABSTRACT
In this paper, we consider the statistical evaluation of the software
reliability during phases
of test and maintenance. Thus, we propose here adynamic
method forestimating
andpredicting
the softwarereliability growth
based on the statistical tool of the antitoneregression.
This method is
going
to allow us tostudy
the evolution of thereliability growth
withoutintroducing
too restrictivehypotheses.
To make this, we show that the maximum likelihood estimate under order restrictions isequivalent
to the estimate obtainedby
the antitoneregression.
That will
bring
us to define the notion of cumulated Kullback-Leiber information on the convex cone of antitone functions for theexponential
families.Finally,
we confront our model withfive classic
parametric
models, the mostquoted
in the literature, on data setsemanating
fromreal software
reliability projects
and we compare theirpredictive
andreplicative capacities by using
theu-plot
method.Keywords : Software reliability, reliability growth
model,conditional failure
intensity, antitonic regression, Kullback-Leiberinformation, u-plot.
40 A. HAMLILI
1. Introduction et
hypothèses préliminaires
L’aptitude
àproduire
de bonslogiciels
est àprésent
considérée comme un atout incontestable à tous les niveaux de latechnologie
moderne. Eneffet,
avec l’utilisation intensive de l’outilinformatique,
la mesure de laqualité
dulogiciel
et la sûreté de fonctionnement dessystèmes informatiques
sont devenues dessujets
depréoccupation
autant pour le
développeur
que pour l’utilisateur. La norme ISO 9000-3 décrivant leslignes
directrices pourl’application
de l’ISO 9001 àl’installation,
la mise àdisposition
et la maintenance des
logiciels préconise l’application
destechniques statistiques
etl’introduction de la fiabilité pour caractériser ce
type
deproduits [ISO-98].
L’étudestatistique
de la fiabilité deslogiciels
a débuté dès les années soixante-dix avec les travauxpionniers
de Moranda[MOR-72] [MOR-75],
Jelinski[JEL-72],
Shooman[SHO-72],
Coutinho[COU-73],
Littlewood et Verrall[LIT-73],
Schick et Wolverton[SCH-78]
etc.1.1. Modèle de test d’un
logiciel
et détection desfautes
Dans le cadre du test fonctionnel des
logiciels,
le programme subit une série d’exécutions en vue de détecter d’éventuelles fautes deconception
et de les éliminer.Dans ce contexte, une défaillance se définit comme étant un état du
logiciel
danslequel,
suite à une
entrée,
celui-ci n’estplus
en mesure de rendre des résultats conformes àceux
prévus
lors de saconception.
On ne considère ici que des défaillances dues à des fautes deconception.
Hypothèse
1 - La détection desfautes
dansl’approche
du testfonctionnel
etde la maintenance corrective des
logiciels se fait
à travers lamanifestation
aléatoiredes
défaillances
au cours de l’exécution du programme.1.2. Processus des
défaillances-corrections
Dans le cadre de l’étude
statistique
de la fiabilité deslogiciels,
le processus des défaillances-corrections induit par le test fonctionnel ou la maintenance correctivepeut
être décritdynamiquement [SOL-96]
à l’aide :2022 du processus des défaillances :
qu’on peut
définir indifféremment par :- le processus
{Ti/i
EN*}
des instants successifs de défaillance tels queTi T2
...Ti
...,-le processus
{ Xi j i
EN*}
destemps
interdéfaillances tels queXi = Ti-Ti-1 (avec To
=0),
- le processus
{Nt j t ~ R+}
des nombres de défaillances survenues avant l’instant t. Ilpeut
être défini àpartir
du processus des instants des défaillances dulogiciel
2022 du processus des corrections que l’on
peut définir,
de manièresimilaire,
indifféremment par le processus des instants de
correction,
le processus des tempsintercorrections ou encore par le processus des nombres de corrections effectuées avant l’instant t.
Hypothèse
2 - Les corrections sontopérées ponctuellement
et immédiatementaprès
l’observation d’unedéfaillance.
Cette
hypothèse signifie que
les processus des défaillances et des corrections sont ici confondus. La théorie des processusponctuels [SNY-75] permet
de caractéri-ser la loi du processus à
partir
de l’intensité conditionnelle de défaillance.1.3. Croissance
de fiabilité
et intensité dedéfaillance
Le standard IEEE définit la fiabilité des
logiciels
comme étant laprobabilité
que lelogiciel
ne cause pas la défaillance d’unsystème pendant
untemps
déterminé etsous des conditions
spécifiées [IEEE94]. Formellement,
la fiabilitépeut
êtreexprimée
à tout instant t par
avec
Àt
= lim1 P(Nt+h - Nt
==1/xt)
oùHt
est la tribu des événements survenus avant l’instant t. Leparamètre At
estappelé
« intensité dedéfaillance
conditionnelle à l’instant t».Construire un modèle
statistique
de fiabilité deslogiciels
consiste essentielle- ment à se donner une famille de lois deprobabilité plausibles
pour le processus sto-chastique
caractérisant lephénomène
des défaillances-corrections. Pour les modèles deprédiction
de la fiabilité deslogiciels,
celarevient,
à donner uneexpression
ouune forme à l’intensité conditionnelle de défaillance.
Aussi,
dans la modélisation du processus decorrection,
on suppose la croissance de fiabilité dulogiciel [COU-73]
[LIT-73] [YAM-83] [SOL-96].
Hypothèse
3 - Le processus des corrections entraîne une croissancede fiabilité
du
logiciel.
Dans la
littérature,
on retrouveplusieurs
modélisations de la croissance de fiabilitéqui
ont étéproposées, discutées,
modifiées et ensuitegénéralisées,
alors qued’autres ont été
critiquées
etrejetées [LIT-73] [SCH-78] [YAM-83] [SHO-84] [MUS- 87] [XIE-91] [LYU-96].
1.4. Durée moyenne instantanée de bon
fonctionnement
Par
ailleurs,
notons que dans lesapproches classiques,
on définit la durée moyenne instantanée de bon fonctionnement dulogiciel
ou MTTF(Mean
Time ToFailure),
en tantqu’indicateur
sur le tempsqu’il
faut attendre pour observer une42 A. HAMLILI
défaillance
qui,
si nous nousplaçons
à l’instant de lanème défaillance,
s’écrit1.5. Modélisation de la croissance de
fiabilité
deslogiciels
Comme le
logiciel
ne subit pas de modifications entre deux instants successifs de correction etqu’il
ne s’use pas, il est naturel de considérer que l’intensité de défaillance reste constantependant
cet intervalle detemps.
Hypothèse
4 - Entre deux corrections successives(i - 1)
et i la distribution du tempsinterdéfaillance Xi
connaissant l’instant dedéfaillance-correction Ti-1
suitune loi
exponentielle
deparamètre 03BBi
constant.Dans le cadre de
l’analyse
de la fiabilité deslogiciels,
le modèle de Jelinski- Moranda[JEL-72]
est l’un despremiers
modèles étudiés en tant que schéma faisantappel
à cettehypothèse.
Il est considéré comme étant le modèle leplus simple
de laclasse des modèles markoviens
[XIE-91].
Des modifications et des
généralisations
ont étéapportées
au modèle de base de Jelinski-Moranda[MOR-75] [SCH-78] [GOE-80] [TRA-85]. Ainsi,
Shanthikumar[SHA-81 ] a
étudié un type degénéralisation
du modèle de processus de Markov enexprimant
l’évolution de laprobabilité
de transition en fonction dutemps.
En
1991,
Xie[XIE-91] a passé
en revueplusieurs
modèles de croissance de fiabilité deslogiciels
et aproposé
une formulationgénérale
du modèle de Markoven
supposant
que laprobabilité
de détection des fautesdépend
de leur sévérité. Il amontré aussi que cette formulation
peut
amener à un modèle de croissance de fiabilitégénéral
avec des sauts de la fonction intensité de défaillance.Gaudoin et Soler
[GAU-92],
pour leurpart,
ont étudié le modèleproportionnel
déterministe en tant que modèle de croissance de fiabilité.
Récemment,
Soler[SOL- 96]
arepris
l’étude de ce modèle sous desperspectives
de corrections différées dansune
approche
de la croissance de fiabilité des versions d’unlogiciel.
Notons que les modèles de croissance de fiabilité
peuvent
notamment être utilisés dans le cas où la structure dulogiciel
est introduite.Ainsi,
cetype
de modèlesa été utilisé dans
l’analyse
structurelle de la fiabilité deslogiciels
par Littlewood[LIT-79], Cheung [CHE-80], Laprie [LAP-84],
les Hecht[HEC-86],
Masuda et al.[MAS-89]
et Ledoux[LED-95].
La formulation que nous proposons dans cet article concerne
l’approche
boîtenoire et
n’impose
aucune formeparamétrique particulière
auxparamètres Ài
et de cefait
généralise plusieurs
modèlesclassiques
de la fiabilité deslogiciels [HAM-98].
2. Information de Kullback-Leiber et
régression
antitoneNous définissons dans ce
paragraphe
deux notionsimportantes qui
vont nouspermettre,
par lasuite,
de déterminer l’estimateur du maximum de vraisemblance nonparamétrique
de l’intensité de défaillance.2.1.
Information
de Kullback-Leiber et estimateur du maximum de vraisemblance Considérons(R, B(R), P03B8)03B8~0398
un modèlestatistique,
surR,
dominé par unemesure J-l, S une
statistique
exhaustive à valeurs dans(R, B(R))
et(x, 03B8)
~L
(x; 0)
une fonction mesurable telle que L(x ; 0)
définisse une vraisemblance. Un estimateur du maximum de vraisemblance(EMV)
d’unparamètre
inconnu 0 est unestatistique S
telle quePar
ailleurs,
l’information de Kullback-Leiberapportée
parP03B8,
surPo peut
êtredéfinie,
dans cesconditions,
parAinsi, d’après
les relations(4)
et(5),
il est clair que l’estimateur du maximum de vraisemblance réalise la borne inférieure de l’information de Kullback-Leiber.Dans la
suite,
l’information de Kullback-Leiber sera considérée comme une mesurede dissemblance entre des
probabilités équivalentes.
Maintenant, lorsque (M, B(R), P03B8)03B8~0398 désigne
un modèleexponentiel,
il existeune
application W,
de l’ensemble 0 dansR,
liée à lastatistique S
et à la vraisemblance par(M, 0398, 03A8)
définit alors unparamétrage
de la familleexponentielle {P03B8}03B8~0398.
En outre,on montre
[DAC-90]
que si Wprend
ses valeurs dans l’intérieur deQ,
elle est CI et dans ces conditionsoù
’Q’(0) désigne
la dérivéede 03A8(03B8).
2.2.
Principes
de larégression
antitoneDans la
suite,
Edésignera
un ensemble fini ordonné et S ==(Xu)u~E
uneséquence
de variables aléatoires réelles indicées sur E. Nous dirons que S est une44 A. HAMLILI
séquence
aléatoire du modèlestatistique (R, B(R), P03B8)03B8~0398,
s’il existe uneunique fonction 03B8,
de l’ensembleF(E, 8)
des fonctions de E dansQ,
telle queAinsi,
nous pourrons considérer desséquences
aléatoires indicées sur l’ensem- ble E ou, de manièreéquivalente,
les fonctionscorrespondantes
dansF(E, 0398).
Définition 1
Soit E
= {u1,
u2, ···,un}
un ensemble ordonné d’indices tels que u1 ~ U2 ~ ... ~ un, uneapplication
03B8 de E vers un intervalle ouvert 0398 de R est dite antitone(ou antitonique),
si et seulement siDans cet ordre
d’idées,
nousdésignerons
par4(E, e)
l’ensemble des fonctions antitones sur E à valeurs dans l’intervalle 0. Parailleurs,
soient03B81
et03B82
deux fonctionsde E dans O :
définit une distance euclidienne
pondérée
surF(E, 0398);
oùw(u)
est unepondération
strictement
positive.
Définition 2
Soient, 03B8
une fonction
de E vers 0398 et wune fonction positive
sur E. Onappelle régression
antitone de 03B8 uneapplication 03B8~ qui
minimise la distance euclidiennepondérée
entre 03B8 et la classeA(E, 0398).
Autrement ditNous montrons dans
[HAM-98] [HAM-99b]
que larégression
antitone de 0peut
se mettre sous la forme
2.3. Théorèmes d’antitonisation
L’objectif
de ceparagraphe
est d’établir le cadre formel del’équivalence
entrele
problème
derégression
antitone et leproblème
de l’estimation du maximum de vraisemblance sous des restrictions d’ordre.Définition 3
Soit E un ensemble
fini
et ordonné d’indicespondérés
par unpoids positif
w.Considérons
03B81
et03B82 deux fonctions
deF(E, 0398),
nousdéfinissons
alorsl’information
de Kullback-Leiber de
la fonction 03B81
surla fonction 03B82
comme étantl’information
deKullback-Leiber cumulée des valeurs
prises
par03B81
sur les valeursprises
par03B82
i.e.Nous démontrons dans
[HAM-99b]
les résultats suivants :Proposition
1Soit E un ensemble
fini
et ordonné d’indicespondérés
par unpoids positif
03C9 et
{P03B8}03B8~0398
unefamille exponentielle
telle que la variété desparamètres
0398 soit unensemble convexe de R. Considérons 03B8 une
fonction
surF(E, 0398)
dont l’ensemble des valeurs s’inscrit à «l’intérieur» de l’ensemble 0398.Alors,
larégression
antitone03B8~
de 03B8 minimisel’information
de Kullback-LeiberK03C9(03B8, 03B8)
sur la classeA(E, 0398).
Autrement dit
Si,
parailleurs,
lafonction W
caractérisant leparamétrage
de lafamille exponentielle {P03B8}03B8~0398
est strictement convexe, alors le minimum estunique,
i. e.Corollaire 2 - Dans les conditions de la
proposition
1 et avec les notationsci-dessus,
larégression
antitone03B8~
de 03B8 maximise laquantité
Démonstration :
Le corollaire découle directement de la
proposition
1 et du fait qued’après
lesrelations
(6)
et(11), l’expression (14)
estégale
à46 A. HAMLILI
3.
Application
du modèle à l’évaluation de la fiabilité 3.1. EMV de l’intensité dedéfaillance
Soit
Nt
= n, le nombre des défaillances observéesjusqu’à l’instant t,
E
= {1,2, ···, n}
et ti t2 ...tn
les instants de défaillancecorrespondants (avec to -
0t1); d’après
leshypothèses
3 et4,
l’intensité de défaillance est une fonctionétagée
décroissante deA(E,R)
demeurant constante entre deux défaillances-corrections successives.Aussi, l’équation (1) permet
d’écrireet le
problème
d’estimation du maximum de vraisemblance duparamètre 03BB(.) qui
caractérise l’histoire des corrections
apportées
aulogiciel
aux instantsti, t2, ···
ettn,
consiste à maximiser la fonction vraisemblance auxpoints
xi = ti - ti-l pour i = 1..n :sous la contrainte
03BB1 03BB2
...Àn.
Dans cesconditions,
leproblème d’optimisation
pour la fonctionlog-vraisemblance prend
la formeMaintenant,
en considérant la fonctionconvexe IF (u) - u log u -
u, en posantw(i)
= xi,03B8(i)
==x-1i
et(i)
=a2
pour i = 1..n et enprolongeant l’expression (6)
établie pour l’information de Kullback-Leiber à l’ensemble des fonctions convexes, les résultats énoncés dans leparagraphe
2.3. restentapplicables
et on reconnaît en(17)
une forme du corollaire 2 avec la fonction W que nous avonsadoptée.
D’après
la relation(10),
la solution duproblème d’optimisation (17)
est enconséquence
Ainsi,
l’estimateur du maximum devraisemblance,
sous la restrictition d’an- titonicité de l’intensité dedéfaillance,
basé sur laséquence d’observations {ti/i =
1..n} est
Toutefois,
il faut remarquerqu’avec
la fonction convexe 03A8adoptée
dans ceparagraphe, l’expression (6)
associée necorrespond plus
à l’information de Kullback-Leiber,
mais les valeursÀi
maximisant(17)
minimisent cette information.3.2.
Aptitudes prédictives
du modèleLa fiabilité d’un
logiciel
est souvent estimée etprédite
enanalysant
les données des défaillances collectées par lepassé.
En se fixant uneorigine
destemps,
les données que nous considérons ici sont les instants de défaillancelorsque
lelogiciel
est en trainde subir des corrections durant la
phase
de test ouopérationnelle
de soncycle
de vie.Nous considérons aussi une forme de
prédiction séquentielle
d’ordre1;
c’est-à-direqu’à partir
de l’ensemble des données{ti/i = 1..n},
nous essaierons deprédire
lecomportement
dutemps Tn+1
de laprochaine
défaillance.Remarquons
tout d’abord que l’estimateur décrit par les relations(18)
et(19)
n’est déterminé de manièreunique
que sur l’intervalle detemps [0, Tu[.
La fonctionétagée,
intensité de défaillanceestimée, correspondante peut
donc êtreprolongée
dela manière suivante
où cn est une constante arbitrairement choisie telle que cn
03BB~n:n
pourpréserver l’hypothèse
3. Eneffet,
tant que nous n’avons pas encore observé une nouvelledéfaillance,
nous ne pouvons avoir une meilleure information apriori.
Plusieursméthodes
statistiques
deprévision peuvent
servir d’aide au choix pour déterminer la constante cn au vu d’un échantillon donné. Dans uneapproche
deprédiction
«aupire »
nous proposons de fixer : Cn =03BB~n:n;
cela reviendrait à dire :«puisqu’il s’agit
d’un modèle de croissance de
fiabilité,
aupire
des cas Cn vaudrait03BB~n:n ».
C’estle cas, par
exemple, lorsque
la tentative d’élimination des fautesqui
ont causé lanième
défaillance n’a pas abouti.La fiabilité
prédictive après n
défaillances observées vaut :et la durée moyenne
prédictive
de bon fonctionnement dulogiciel,
connaissant les instants de défaillance{ti/i
=1..n},
paranalogie
avec la relation(2), peut
être estimée dans le cas duprésent
modèle par :En outre, les
performances prédictives
du modèle sur desjeux
de données réellespeuvent
êtreévaluées,
parexemple,
à l’aide des testsd’adéquation.
Pour notrepart,
nous utiliserons ici la méthode du
u-plot [COX-66] [ABD-86].
48 A. HAMLILI
3.3. Méthode du
u-plot
La méthode du
u-plot
définit un indicateurd’adéquation non-paramétri-
que
[COX-66]. L’objectif
de cetteprocédure
est de déterminer si lesprédictions
{n:i}i=s..r
sont assezproches
des distributions réelles{Fn:i}i=s..r
inconnues desXi (avec
1 s i r n+ 1).
Si ces distributions étaientidentiques alors,
cela si-gnifierait
que les variables aléatoiresUi = Fn:2 (Xi)
sont uniformément distribuéessur l’intervalle
]0,1[. Ainsi,
soient(Xi)i=s..r
le vecteur des réalisations destemps
interdéfaillances(Xi)i=s..r;
les u2 =n:i(xi)
sont des réalisations des v.a.Ui.
Levecteur ordonné
(u(j))j=1..r-s+1
constitue une réalisation du vecteur desstatistiques
d’ordre
(U(j))j=1..r-s+1
associé au vecteur(Ui)i=s..r.
La courbe du
u-plot
est alors la fonction derépartition empirique
desu(j).
Elleest définie par la fonction
étagée,
à pas constant,qui
àu(j) associe j r-s+1 (pour
j
=1,...,
r - s+ 1).
Cette courbepermet
de constater visuellement laperformance
du modèle dans
l’interprétation
des données observées.Les
statistiques
deKolmogorov-Smimov
permettent
de définir un testnon-paramétrique
bilatéralqui rejette l’hypothèse
nulle au seuil ce, si on observeKSs,r
>d’,;
oùd’,
est lavaleur lue sur la table de
Kolmogorov-Smimov
à(r - s + 1) degrés
de liberté pour le seuil derisque
Q.Par ailleurs et de manière à
quantifier l’aptitude
du modèle àinterpréter
lesdonnées
(Xi)i=s..r,
nous pouvons définir[HAM-99a]
deux indicateurs induits par leu-plot
du modèleproposé,
2022 la
statistique
définissant l’écart moyenempirique
associé auu-plot
du modèle2022 la
statistique
de l’erreurquadratique
moyenneempirique
incitée par leu-plot
du modèle -
3.4.
Analyse
des données de défaillance-correctionCette
analyse
a été réalisée à l’aide de l’outil COALAS[HAM-98] [HAM- 99a].
C’est unsystème
dédié au traitement formel desapplications statistiques.
Lesystème
COALAS regroupe un ensemble debibliothèques statistiques
etgraphiques permettant l’analyse paramétrique
etnon-paramétrique
de la fiabilité deslogiciels,
à la
fois,
par desapproches dynamiques
etstatiques.
Nous l’avons écrit autour du noyau dusystème
de calcul formel MAPLE V.FIGURE 1
Temps interdéfaillance
dessystèmes
SYSI et SYS3(voir
leparagraphe 1.2)
L’objectif
de ceparagraphe
estd’analyser
des données de défaillance-correction émanant de véritablesprojets
de fiabilité à l’aide des méthodes établies dans cet article et de comparer lesperformances
de notremodèle,
identifié dans la suite par l’attributNOPRA,
à celles des modèles résumés par le tableau suivant :50 A. HAMLILI
FIGURE 2
Intensités de
défaillances
des deuxsystèmes (voir la formule (18))
FIGURE 3
Courbes des
u-plots prédictifs
du modèle NOPRA pour les deuxsystèmes (voir
leparagraphe 3.3)
Les
figures
1(SYS 1 )
et 1(SYS3)
montrent que les donnéesrécoltées,
lors du test fonctionnel desproduits logiciels
SYS 1 et SYS3[MUS-79], présentent globalement
une croissance de fiabilité. En
effet,
les intervalles destemps
interdéfaillances sontglobalement
deplus
enplus grands;
cequi justifie l’application
d’un modèle de croissance de fiabilité.FIGURE 4
Comparaison
des intensités dedéfaillance
pour lesdifférents
modèles(voir
le tableau dessymboles
duparagraphe 3.4)
Selon le modèle
NOPRA,
lafigure
2(SYS1)
montre que les fautes lesplus
sévères détectées par le
plan
de test considéré ont été éliminées au début du test. Cettefigure
montre aussi que leur nombre n’est pas très élevé(une demi-douzaine),
à moinsque le
plan
de test dulogiciel
n’ait paspermis
derévéler,
asseztôt,
toutes les fautessévères au début de la
phase
du test.La même remarque peut être faite à propos de la
figure
2(SYS3),
sauf que pour lesystème
SYS3 la détection des fautes sévères a continuéjusqu’à
un stade assezavancé du test du
logiciel puisqu’on
observe des sauts de forteamplitude
auvoisinage
de la
22ème
défaillance. Desinterprétations
différentes duplan
de testpeuvent
êtreproduites,
si on se fie aux allures des courbes de l’intensité de défaillance des autres modèles décrits dans lesfigures
4(SYS1),
4(SYS3),
5(SYSl)
et 5(SYS3)
oùl’intensité de défaillance demeure très faible
comparée
à l’intensité de défaillance du modèle NOPRA au début du test.Dans les tableaux 1 et
2,
nous introduisons l’indicateurKLs,r désignant
lamesure de dissemblance de Kullback-Leiber cumulée et normée associée aux
poids
cvi = xi pour i = s,..., r du modèle considéré par
rapport
au modèle nonparamétrique
NOPRA.Ainsi,
comme les intensités de défaillances utilisées sont estimées par des fonctionsétagées,
àsavoir, A
pour le modèle considéré etÀ t
pour lemodèle
NOPRA,
alorsKLs,r,
dans cesconditions,
est donnée parl’expression
En somme, les mesures
exposées
dans les tableaux 1 et 2 et lesfigures
4(SYSI),
4(SYS3),
5(SYSI)
et 5(SYS3),
pour lessystèmes
SYSI etSYS3,
52 A. HAMLILI
TABLEAU 1
Mesures relatives à la
comparaison
des modèles pour lesystème
SYSI(voir les formules (3), (21), (22), (23)
et(24))
TABLEAU 2
Mesures relatives à la
comparaison
des modèles pour lesystème
SYS3(voir les formules (3), (21), (22), (23)
et(24))
relatent une meilleure
adéquation
du modèleparamétrique
GM pourl’interprétation
des données de défaillance-correction de SYS 1 et du modèle
non-paramétrique
NOPRA pour
l’interprétation
des données dusystème
SYS3. Celaétant,
il fautnoter que l’information de Kullback-Leiber cumulée
KLs,r
des différents modèlesparamétriques
relativement au modèlenon-paramétrique NOPRA, indique
dans lesdeux cas une
plus
faible dissemblance pour le modèleparamétrique
GM.FIGURE 5
Confrontation
desu-plots
pour lesdifférents
modèles4. Conclusions
Dans cet
article,
nous avonsprésenté
uneapproche
d’estimation et deprédiction
de la fiabilité des
logiciels
basée sur la méthode du maximum de vraisemblancesous
l’hypothèse
de la croissance de fiabilité. Parailleurs,
nous avons défini deux indicateurs de laqualité prédictive
des modèles basés sur la courbe duu-plot;
indicateurs
qui
avec la distance deKolmogorov-Smimov
nous ontpermis
de donnerune idée sur la
performance
des modèles et d’offrir un instrument pour le choix du modèle leplus adéquat
àl’interprétation
des données d’unprojet
de fiabilité.L’approche
d’estimation et deprédiction
de la croissance de fiabilité deslogiciels
que nous avonsproposée,
nous semble êtreprometteuse.
Son intérêtmajeur
réside dans le fait
qu’elle
ne restreint pas l’intensité de défaillance à unequelconque
forme
analytique.
Ellepermet
ainsi de débarrasser la modélisation de la croissance de fiabilité de bien de contraintes inutiles. Ellepeut
êtregénéralisée
à la modélisation et à l’étude de la croissance de fiabilité d’unegrande
classe desystèmes
améliorables.Remerciements
Je tiens à remercier les relecteurs. La
pertinence
de leurs remarques m’apermis
d’améliorer différents
points
de ce texte.Bibliographie
[ABD-86]
ABDEL-GHALYA.A.,
CHANP.Y.,
LITTLEWOOD B.(1986),
Evalua-tion of
competing
softwarereliability predictions,
IEEE Trans. on Soft.Eng.,
SE-12(9).
pp. 950-967.54 A. HAMLILI
[BAR-71]
BARLOWR.E.,
UBHAYA V.A.(1971),
IsotonicApproximation.
InOptimizing
methods instatistics,
J.S.Rustagi ed.,
New York.[CHE-80]
CHEUNG R.C.(1980),
A user orientedreliability model,
IEEE Trans.Software
Eng., SE-6,
pp. 118-125.[COU-73]
COUTINHO J. De H.(1973),
Softwarereliability growth,
Record of1973 IEEE
Symp.
onComp.
Soft. Rel. IEEEComputer Society, NY,
pp. 58-64.
[COX-66] COX D.R.,
LEWIS P.A.W.(1966),
Statisticalanalysis
of seriesof events,
MethuenMonographs
onApplied Probability
andStatistics, London,
Methuen & Co Ltd.[CRO-74]
CROW L.H.( 1974), Reliability analysis
forcomplex repairable systems, Reliability
andBiometry,
Statisticalanalysis
oflifelength,
SIAM Phila-delphia,
pp. 379-410.[DAC-90]
DACUNHA-CASTELLED.,
DUFLO M.(1990),
Probabilités et statis-tiques,
Tome1,
Masson.[GAU-92]
GAUDOINO.,
SOLER J.L.(1992),
Statisticalanalysis
of thegeometric de-eutrophication
softwarereliability model,
IEEE Trans. onReliability, R-41(4),
pp. 518-524.[GOE-80]
GOEL A.L.(1980),
A summary of the discussion on ananalysis
ofcompeting
softwarereliability models,
IEEE Trans. SoftwareEng.,
SE-6,
pp. 501-502.[HAM-98]
HAMLILI A.(1998),
Estimation de la fiabilité deslogiciels
soushy- pothèse
de leuramélioration, Accepté
pourpublication.
Actes de ladeuxième conférence internationale sur les
mathématiques appliquées
et les sciences de
l’ingénieur (CIMASI’98),
pp.232-237, Casablanca, Maroc,
27-29 Oct.[HAM-99a]
HAMLILI A.(1999),
Etudecomparative
des modèles de croissance de fiabilité deslogiciels,
Actes de la deuxième conférence internationale enrecherche
opérationnelle, Marrakech, Maroc,
24-26 Mai.[HAM-99b]
HAMLILI A.(1999),
Contribution à l’évaluation et laprédiction
de lafiabilité des
logiciels : méthodologies, modèles,
inférencestatistique
et
qualité.
Thèse de doctorat d’état ès sciencesappliquées.
UniversitéMohamed
V,
Ecole Mohammediad’Ingénieurs, (soutenance public
le 8septembre 1999).
[HEC-86]
HECHTH.,
HECHT M.(1986),
Softwarereliability
in thesystem
context, IEEE Trans. SoftwareEng., SE-12,
pp. 51-58.[IEEE94]
IEEE Standards Collection(1994),
SoftwareEngineering, published by
the Institute of Electrical and Electronic
Engineers
Inc..[ISO-98]
ISO 9000-3(1998),
Normes pour lemanagement
de laqualité
etl’assurance de la
qualité,
Partie 3 :Lignes
directrices pourl’application
de l’ISO 9001 :1994 au
développement,
à la mise àdisposition,
àl’installation et à la maintenance du
logiciel, Organisation
internationale denormalisation, Suisse,
versionfrançaise.
[JEL-72]
JELINSKIZ.,
MORANDA P.B.(1972),
Softwarereliability research,
in Stat.
Comp.
Performance Evaluation. Ed. Freiberber W. pp.465-484,
Academic NY.[LAP-84]
LAPRIE J.C.(1984), Dependability
evaluation of softwaresystems
inoperation,
IEEE Trans. SoftwareEng., SE-16(6),
pp. 701-714.[LED-95]
LEDOUX J.(1995),
Sur la modélisation structurelle markovienne enfiabilité des
logiciels. Rapport INRIA,
n° 2714.[LIT-73]
LITTLEWOODB.,
VERRALL J.L.(1973),
Abayesian reliability growth
model forcomputer software,
Jour.Roy.
Stat.Soc.,
C vol.22,
pp. 332-346.
[LIT-79]
LITTLEWOOD B.(1979),
Softwarereliability
model for modular pro- gram structure, IEEE Trans.Reliability, R-28,
pp. 241-246.[LYU-96]
LYU M.R.(1996),
Handbook of softwareengineering, Computing McGraw-Hill,
New York.[MAS-89]
MASUDA Y. and al.( 1989),
A statisticalapproach
fordetermining
timeof software
system
with modular structure, IEEETrans, Reliability, R-38,
pp. 365-372.
[MOR-72]
MORANDAP.L.,
JELINSKI Z.(1972),
Final report on software relia-bility study,
McDonnelDouglas
AstronauticsCompagny,
MADCreport
number 63921.[MOR-75]
MORANDA P.B.(1975),
Predictions of softwarereliability during
de-bugging.
Proc. of the AnnualReliability
andMaintenability Symposium,
pp.
327-332, Washinton, D.C.,
USA.[MUS-79]
MUSA J.D.( 1979),
Softwarereliability
data.Report
available from data andanalysis
center forsoftware,
Rome airdevelopment
center, New York.[MUS-87]
MUSAJ.D,
IANNIOA.,
OKUMUTO A.(1987),
Softwarereliability :
measurement,
prediction, application, McGraw-Hill,
New York.[SCH-78]
SCHICKG.J.,
WOLVERTON R.W.(1978),
Ananalysis
ofcompeting
software
reliability models,
IEEE Trans. SoftwareEng. SE-4,
pp. 104- 120.[SHA-81]
SHANTHIKUMAR J.G.(1981),
Ageneral
softwarereliability
modelfor
performance prediction,
Microelectronics andreliability,
vol.21, pp. 671-682.
[SHO-72]
SHOOMAN M.L.(1972),
Probabilistic models for softwarereliability predictions,
in Stat.Comp.
PerformanceEvaluation,
ed. FreiberberW.,
pp.
485-502,
Academic press, NY.[SHO-84]
SHOOMAN M.L.(1984),
Softwarereliability :
a historicalperspective,
IEEE Trans. Software
Eng. R-33,
pp. 48-55.[SNY-75]
SNYDER D.L.(1975),
Randompoint
processes,Wiley,
New York.[SOL-96]
SOLER J.L.(1996),
Croissance de fiabilité des versions d’unlogiciel.
Rev. Stat.
App., XLIV(1),
pp. 5-20.56 A. HAMLILI
[TRA-85]
TRACHTENBERG M.( 1985),
The linear softwarereliability
model anduniform
testing,
IEEE Trans.Reliability, R-34,
pp. 8-16.[XIE-91]
XIE M.(1991),
Softwarereliability modelling,
WorldScientific, Singa-
pore.