Choix de la surface d’analyse - M´ethode de Gumbel

4.2 M´ethode de Gumbel

4.2.4 Choix de la surface d’analyse

La méthode de Gumbel nécessite la décomposition en blocs d’analyse. Le choix de la taille et le nombre de ces blocs est un problème rarement discuté dans la littérature. Shibata ([Shi96]) a discuté ce problème en concluant que le bloc d’analyse doit contenir un nombre minimal de piqûres, et la théorie des valeurs extrêmes n’est plus valable à partir d’une taille critique du bloc d’analyse. Melsher ([Mel08]) a posé le problème de la « surface représentative » et a conclu que, pour récolter les données, il faut adapter la taille des blocs en fonction des profondeurs des piqûres. Ainsi, un grand bloc est nécessaire dans le cas des grandes profondeurs, et un petit bloc dans le cas des petites profondeurs. Il propose un autre critère du choix de la surface d’analyse, en se basant sur la remarque que l’hétérogéneité, en terme de profondeur, est la conséquence du phénomène de mé- tastabilité des piqûres. Ainsi, l’auteur propose comme critère de choix, des surfaces pour lesquelles le pourcentage des piqûres métastables ne dépasse pas 10%.

Dans cette section, un critère de découpage est proposé. Une fois que la taille des blocs d’analyses est déterminée, le nombre de ces blocs peut être choisi de telle sorte qu’ils stabilisent les estimations. Cette stabilisation est quantifiée en terme de variation de l’estimation lors du passage de p à p + 1 blocs. En d’autres termes, on va considérer que les estimations se sont stabilisées si le rapport entre l’estimation à p+1 blocs et celle à p blocs est inférieure à un certain seuil qu’on peut fixer à l’avance. 4.2.4.1 Discussion d’un critère de découpage en blocs d’analyse

Les deux approches de simulations numériques présentées dans la section précédente consistent à comparer les estimations dans le cas de « bloc-différent »et le cas de « bloc-égal ». La conclusion, est que les deux estimations sont proches en terme de biais et de variance. Sachant que dans la première approche, les coordonnées des piqûres sont générées selon une CSR, la méthode des

quadrats présentée au troisième chapitre est la plus appropriée pour découper la surface d’étude en blocs d’analyse. En effet, elle permet de trouver l’échelle pour laquelle la structure spatiale des piqûres est une CSR. En outre, cette échelle permettra d’avoir des blocs d’analyse pour lesquels l’hypothèse d’égalité des nombres de piqûres n’est pas rejetée. Ainsi, la méthode des quadrats permet de s’approcher des conditions théoriques de l’application de la méthode de Gumbel. A noter que la méthode ne permet pas toujours l’obtention de l’échelle CSR, car en pratique la structure spatiale des piqûres peut être fortement agrégée. Dans ce cas l’estimation de la densité spatiale et son intégration dans des simulations numériques à l’image du calcul présenté dans la section précédente, peut donner des réponses quant au meilleur découpage en terme de biais et de variance. La figure (4.29) montre les résultats de la méthode des quadrats appliquée aux positions 3 et 4 de la bande 1 (issue de la tôle 1) présentée dans la section (4.1.3).

20 40 60 80 100 40 60 80 100 120 Nombre de blocs Valeur du chi−deux Position 3 Observé théorique 20 40 60 80 100 40 60 80 100 120 Nombre de blocs Valeur du chi−deux Position 4 Observé théorique

Fig. 4.29: M´ethode des quadrats pour les positions 3 et 4 de la bande 1

Le découpage respecte la condition CSR si la valeur observée est inférieure à la valeur théorique du Chi-deux. On remarque qu’en pratique (pour les plaques attaquées), il est possible de trouver le découpage pour lequel l’hypothèse de l’égalité entre les nombres de piqûres par bloc n’est pas rejetée. La difficulté dans cette démarche réside dans le fait qu’il est parfois difficle d’extraire les coordonnées des piqûres.

Désormais, on va s’intéresser à l’influence du choix de la taille des blocs d’analyse ainsi qu’à celui de leur nombre sur les estimations des quantiles extrêmes. Pour cela, on simule une surface de 50× 50 cm2 _{d’une fa¸con identique à celle de 10000 cm}2 _{(même densité de 8 piqûres par cm}2

et répartition spatiale), ce qui conduit à la simulation de 20000 piqûres selon une structure CSR. La réduction de la taille de la surface objective simulée a seulement pour objectif la réduction du temps de calcul. Les conclusions restent les mêmes.

Le procédé de calcul consiste à découper la surface objective en plusieurs blocs entre 100 et 1600, et d’y appliquer la méthode de Gumbel. Pour comparer les estimations pour les différents

découpages, le nombre de blocs sera proportionel à la taille de la surface objective. En d’autres termes, si on découpe toute la surface objective en 100 blocs, et si on en choisit 5 pour estimer les quantiles extrêmes (soit 5% de la surface totale étant analysée) alors, pour le découpage en 200 blocs, on va en analyser 10. Dans ce travail, cette surface analysée varie entre 5% et 30% de la taille totale de la surface objective. Cela permet d’avoir des estimations comparables pour analyser l’impact de la taille des blocs sur les estimations. Pour chaque découpage, 1000 blocs ont été choisis aléatoirement. Vu que toutes les méthodes d’estimations aboutissent aux mêmes conclusions, seule la régression linéaire sera présentée. La figure (4.30) montre les moyennes des 1000 estimations des quantiles associées à chaque découpage ainsi que leurs écarts-types. A noter que dans la suite, c’est l’approximation de Hazen qui sera utilisée pour la méhode de la régression linéaire.

5 10 15 20 25 30 180 185 190 195 Pourcentage

Moyenne des quantiles

5 10 15 20 25 30 1 2 3 4 5 6 7 8 9 10 Pourcentage

Moyenne des écarts−types

100 200 400 500 800 1000 1600 Max−simul

Fig. 4.30: Comparaison des estimations en fonction de la taille des blocs (méthode de la régression) : a-Moyennes des quantiles , b-Moyennes des écarts-types des quantiles

Pour la même taille de surface analysée (égale au nombre de blocs fois la taille d’un bloc), les estimations des quantiles varient. On remarque que plus les blocs ont une grande taille, plus le biais des estimations est faible ; en contre partie la variance augmente. Pour un découpage donné, l’augmen- tation du nombre de blocs n’influe pas sensiblement sur les estimations des quantiles contrairement à leurs tailles. En résumé, en fixant une surface à analyser, la découper en grands blocs aboutira à des estimations à faibles biais mais avec une variance plus importante, et la découper en petits blocs conduira à des surestimations mais avec une variance moins importante. Selon le besoin et l’objectif du travail, on peut privilégier un découpage par rapport à un autre. Par exemple, si on choisit un découpage en petit blocs, on aura une probabilité plus élevée de surestimer l’événement extrême étudié ce qui évitera le risque de la sous-estimation qui peut s’avérer dangereux. En contre partie il faudra évaluer le coût de cette surestimation pour pouvoir trancher.

Dans le document Développement de méthodes statistiques et probabilistes en corrosion par piqûres pour l'estimation de la profondeur maximale : application à l'aluminium A5 (Page 101-104)