• Aucun résultat trouvé

, (III.70) α(h) = ch5/7, c = 1.347 Ssj(a) T (b) !1/7 , (III.71) T (b) = − 1 b7n(n − 1) n X i=1 n X j=1 K(6) ti− tj b  , (III.72)

où a et b sont des paramètres de lissages pilotes définis à travers la distance interquartile des données IRQ :

a = 0.92IRQn−1/7, (III.73)

b = 0.912IRQn−1/9, (III.74) Les méthodes de plug-in ont une grande performance par rapport aux autres techniques de calcul de paramètre [75], [77]. Les techniques du plug-in sont plus précises que la méthode de validation croisée non biaisée (vitesse de convergence de l’ordre de o(n−1/10)). Cependant, les méthodes plug-in en dépit de leur performance négligent la variation de l’estimateur Rg(f ”). Car le paramètre de lissage issu de la dérivée de l’AM ISE, est obtenu avec la fonction Rg(f ”) qui est indépendante de h. Or son estimateur S(α(h)) est lié au h. Sa variation en fonction du paramètre de lissage doit être prise en compte dans la minimisation de l’AM ISE.

∂hAM ISE(h) = − Rg (K) nh2 +1 4σ 4 K h4 ∂hS((α(h)) + 4h 3S((α(h)) ! . (III.75)

Le paramètre de lissage au sens de la méthode doit être le paramètre de lissage h qui minimise l’AMISE à travers une annulation l’Équation (III.75).

6 Applications numériques

6.1 Calcul du paramètre de lissage

Dans cette partie nous nous intéressons à l’efficacité statistique des méthodes de calcul du paramètre de lissage indispensable pour l’estimateur du Noyau de Parzen. Les données sont supposées provenir de distribution de Weibull. Une distribution de Weibull est définie par trois

III.6 Applications numériques

paramètres dont :

n paramètre de forme β (scale parameter), n paramètre d’échelle η (shape parameter), n paramètre d’origine γ (location parameter).

Nous adopterons la notation suivante W (β, η, γ) pour la distribution de Weibull dans le reste du rapport. La distribution de Weibull est définie par :

f (t) = β η t − γ η !β−1 exp t − γ η !β , (III.76) F (t) = 1 − exp t − γ η !β , (III.77) R (t) = exp t − γ η !β , (III.78) λ (t) = β η t − γ η !β−1 . (III.79)

Chaque paramètre de la distribution de Weibull a une part d’explication dans le processus d’usure de l’équipement pendant son exploitation. Explicitement le paramère β décrit le mode de défaillance de l’équipement ou son intensité d’usure en fonction de l’âge. Le paramètre η dé-signe l’échelle ou la plage de variation de l’âge de fonctionnement de l’équipement. Le paramètre d’origine γ désigne l’âge au delà duquel l’équipement pourrait être sujet à des défaillances.

L’objective de ces simulations d’un côté est de comparer certaines techniques de calcul du paramètre de lissage sur les données de défaillance générées. D’un autre côté, elle permet de mettre en application la démarche d’estimation : des données de durées de vie jusqu’à la modélisation de la densité de probabilité. Les données sont supposées indépendantes et provenant de distributions de Weibull qui peuvent être de même mode ou non et même échelle ou non. Une hétérogénéité qui résulte du changement de mode, des conditions ou/et lieu de fonctionnement des équipements. Dans cette analyse, nous nous intéressons à la variabilité des calculs de paramètres de lissage issus des techniques citées dans les sections précedentes. Nous allons tester plusieurs types de distribution de Weibull telles que : distribution simple avec un seul Weibull, des mélanges de distributions de Weibull et des distributions de Weibull en concurrence.

Cas des distribution simples, les résultats sont représentés par des boites à moustache (box-plots) sur les Figures III.3, III.4 etIII.5 respectivement pour les tailles d’échantillons 100, 500 et 1000. La boite à moustache est un outil graphique pour visualiser la dispersion dans un

échantillon autour de sa valeur médiane représentée par un trait rouge à l’intérieur de la boite. La longueur de la boite est définie par la distance entre le premier et le troisième quartiles. Les moustaches représentent les queues inférieure et supérieure. Les queues ou moustaches in-férieure et supérieure sont définies respectivement par rapport au premier et troisième quartiles à 1,5 fois la longueur de la boite3.

Nous notons qu’en fonction de l’augmentation de la taille les valeurs des paramètres de lissage et leurs dispersions respectives se réduisent. Nous remarquons en plus que les techniques n’ont pas les mêmes performances. Ainsi, la méthode du plug-in de Sheater et Jones (noté h_plg_ShJ_dich et h_plg_ShJ_grad) enregistre de faible dispersion contrairement aux para-mètres calculés par la validation croisée baisée 2 (noté h_bcv2). A taille élevée, la méthode de validation croisée biaisée 1 (h_bc1) devient identique à la méthode de plugin naif (h_plgnaif) voir Figure III.5. Enfin, la méthode de validation croisée non biaisée (h_lscv) fournit des fe-nêtres de lissage souvent faibles comme l’indique les queues de son box-plot. En effet la méthode de validation croissée biaisée 2 doit être évitée vu sa dispersion et en plus elle ne converge pas souvent vers des solutions réelles.

Ces analyses sont identiques au cas de mélange pondéré de distributions de Weibull de même paramètre d’échelle voir Figures III.6, III.7 et III.8. Cependant, lorsque les paramètres d’échelle des distributions présentes dans le mélange sont significativement différents alors les autres techniques de calcul enrégistrent des insuffisances. Pour le mélange de trois distributions de Weibull de paramètre de d’échelle 15, 150 et 1500, nous remarquons que seul les méthodes du plug-in restent performantes et ne sont pas piégées par les données provenant de la distribution de Weibull de paramètre d’échelle 15. Par conséquent les FiguresIII.9,III.10 etIII.11montrent que les autres méthodes produisent des valeurs de paramètres de lissage faible. Cela conduit à une courbes d’estimation rugueuse, signe d’une forte variance d’estimation. Nous notons également que les validations croisées non biaisée et biaisée 2 ont des performances très faibles en mélange des données lorsque les paramètres d’échelle ne sont pas du même ordre de grandeur. Pour le cas de la concurrence, l’ordre des performances demeurent identiques en terme de variabilité des résultats. Cependant, il faut remarquer que la méthode du Noyau de Parzen est une approche fréquentielle alors que la densité issue de la concurrence ne l’est pas. Lorsque les données ne sont pas linéairement séparable c’est à dire β1 << β2 ou η1 << η2 la méthode du noyau n’est pas apte à faire un lissage correcte de la densité de probabilité des durées de vie et toutes les autres fonctions qui en découlent.

3. dans les graphiques la moustache inférieure est définie par la plus petite des observations supérieure au premier quartile diminué de 1,5 fois la longueur de la boite et la moustache supérieure est définie par la plus grande des observations inférieure au troisième quartile augmenté de 1,5 fois la longueur de la boite

III.6 Applications numériques

Enfin, les méthodes basées sur les fonctions de répartition ont un temps de calcul énorme dû au calcul d’intégrations numériques. Les paramètres résultants de la minimisation du CE(h) (voir annexe) sont trop large conduisant à un biais très élévé FigureIII.15ouIII.16. Les autres basées sur le critère EC(h) (voir annexe) sous estiment le paramètre de lissage avec un temps de calcul qui explose avec la taille des données. Cependant, cette sous-estimation dépend du facteur de p utilisé dans le calcul de la distribution empirique de la fonction de répartition (ici nous avons utilisé p = {0; 0, 1; 0, 5; 0, 7; 0, 9} correspondant respectivement aux paramètres de lissage h_rep0, h_rep1, h_rep5, h_rep7, h_rep9).

Figure III.3Dispersion après 30 simulations de calcul du paramètre de lissage h : cas d’une Weibull

W (2, 3; 15) ; taille des données 100.