• Aucun résultat trouvé

𝐾�𝐴𝑛 = 𝑛�𝜌 �� 𝐾�𝐴𝑛(𝑟1) … 𝐾�𝐴𝑛(𝑟𝑑) � − 𝜋 �𝑟1 2 … 𝑟𝑑2 �� → 𝒩(0, Σ) (25)

Σ est la matrice de variance covariance d’une loi normale de dimension 𝑑. Ses éléments valent :

Si 𝜆 est connu :

Σ𝑠,𝑡 =2𝜋𝜆 min(𝑟𝑠2, 𝑟𝑡2) + 4𝜋𝑟𝑠2𝑟𝑡2 (26)

Si 𝜆 est inconnu :

Σ𝑠,𝑡 =2𝜋𝜆 min(𝑟𝑠2, 𝑟𝑡2) (27)

Dans ce dernier cas, 𝜆 est estimé par 𝜆̂ =𝑛(𝐴𝑛)

𝑛2 .

Figure 11 : Convergence de la variance de 𝑲�𝟏,𝑨𝒏(𝟏), intensité connue.

Les tests montrent que les valeurs limites sont atteintes pour des nombres de points très supérieurs à ceux utilisés en pratique. Les variances asymptotiques n’ont donc pas d’intérêt pratique.

Figure 12 : Convergence de la covariance de 𝑲�𝟏,𝑨𝒏(𝟏) et 𝑲�𝟏,𝑨𝒏(𝟐), intensité connue.

La Figure 11 et la Figure 13 montrent les valeurs de la variance de 𝐾�𝐴𝑛(1) pour

des valeurs croissantes de 𝑛. Les courbes empiriques sont calculées à partir de 1 000 simulations d’un processus de Poisson d’intensité 5 tiré dans un carré de côté 𝑛. L’espérance du nombre de points varie de 125 à 50 000. Les variances dé- croissent à la vitesse 𝜆𝑛2 : elles sont donc toutes multipliées par 𝜆𝑛2 pour per-

mettre de les comparer. Quand 𝜆 est inconnu, 𝜆𝑛2 est estimé par 𝜆𝑛� = 𝑛(𝐴2 𝑛).

Les estimateurs 𝐾�1,𝐴𝑛(1) et 𝐾�2,𝐴𝑛(1) sont calculés pour chaque tirage. Leur va-

riance empirique varie beaucoup, malgré le nombre de simulations important. Quand l’intensité est connue, la variance (normalisée) augmente avec le nombre de points, mais le comportement est inversé quand l’intensité est inconnue, parce que l’incertitude due à son estimation est plus faible.

Quand l’intensité est connue, la variance de 𝐾�1,𝐴𝑛(1) est calculée indépendam-

ment des données. Quand elle ne l’est pas, elle doit être estimée à partir des don- nées. À chaque tirage du processus correspond donc une valeur de la variance calculée de 𝐾�2,𝐴𝑛(1), qui varie selon le nombre de points observé. La Figure 13 et

la Figure 14 présentent pour chaque valeur de 𝑛 la plus petite et la plus grande de ces valeurs sur les 1 000 tirages.

Figure 13 : Convergence de la variance de 𝑲�𝟐,𝑨𝒏(𝟏), intensité inconnue.

Figure 14 : Convergence de la covariance de 𝑲�𝟐,𝑨𝒏(𝟏) et 𝑲�𝟐,𝑨𝒏(𝟐), intensité inconnue.

La même approche est appliquée à la covariance entre 𝐾�𝐴𝑛(1) et 𝐾�𝐴𝑛(2). Les résul-

En conclusion, il est illusoire de chercher à utiliser la variance asymptotique dans les cas pratiques. La matrice de variance-covariance devra être calculée pour les valeurs réelles (éventuellement estimées) de 𝑛 et 𝜆.

Test

T = Σ−1 2� 𝐾�𝐴𝑛(𝑟1)

𝐾�𝐴𝑛(𝑟𝑑)

� est distribué asymptotiquement comme une loi normale cen- trée réduite de dimension 𝑑. Le test statistique consiste donc à calculer la norme de 𝑇 au carré, qui suit une loi de 𝜒𝛼2 à 𝑑 degrés de libertés. Si ‖𝑇‖2 dépasse le

quantile de 𝜒𝛼2(𝑑) au seuil de risque 𝛼, l’hypothèse selon laquelle le semis de

points est une réalisation d’un processus de Poisson homogène peut être rejetée. Pour vérifier la méthode, un processus de Poisson pris comme hypothèse nulle est tiré 10 000 fois. Au seuil de risque de 5%, 500 tirages doivent être rejetés comme n’étant pas des Poisson. Le test peut être lui-même testé : le rejet d’un tirage suit une loi de Bernoulli, et les tirages sont indépendants. L’espérance de la propor- tion de rejets est 0,05 et sa variance théorique 0,0475. Comme le test est répété 10 000 fois, l’approximation normale de la distribution des résultats est valide. Au seuil de risque de 5%, la proportion de rejets devrait être 5% ± 𝑡5%(10000)�0,047510000, c'est-à-dire entre 4,56% et 5,44%.

Les calculs ont été réalisés dans R (R Development Core Team, 2010) : la simula- tion des processus avec la fonction rpoispp du module Spatstat, l’intégration numérique simple avec integrate et l’intégration double avec la fonction adapt du module du même nom.

Différentes méthodes de calcul de la matrice Σ sont testées :

• Empirique : 10 000 tirages supplémentaires du même processus de Poisson sont effectués, 𝐾�1,𝐴𝑛 est calculé pour toutes les valeurs de 𝑟 et la matrice de

variance-covariance est calculée à partir de ces valeurs.

• Empirique (auto) : la matrice de variance-covariance est calculée à partir des tirages testés eux-mêmes.

Intensité connue ou inconnue : Σ est calculée. Si l’intensité est connue, Σ ne dépend pas des données : seules les valeurs de 𝐾�1,𝐴𝑛 sont calculées pour

chaque tirage. Si l’intensité est inconnue, Σ est aussi calculée à chaque ti- rage en fonction du nombre de points observés.

Méthode de calcul

de 𝜮 Empirique Empirique (auto, in- tensité connue) Empirique (auto, intensité inconnue) Intensité connue, cal- cul exact Intensité in- connue, calcul exact Poisson, 𝒏 = 𝟑𝟎, 𝝀 = 𝟏 5,40 5,04 5,01 5,20 5,10 Poisson, 𝒏 = 𝟏𝟎, 𝝀 = 𝟓 5,61 5,40 5.38 5,19 5,37 Poisson, 𝒏 = 𝟏𝟎, 𝝀 = 𝟓 𝒓 ∈ {𝟏; 𝟐; … ; 𝟏𝟎} 5,28 5,32 6,67 6,08 5,84 Poisson, 𝒏 = 𝟏𝟎, 𝝀 = 𝟏 5,67 5,86 5,30 5,81 5,25 Poisson, 𝒏 = 𝟏𝟎, 𝝀 = 𝟎, 𝟓 5,52 5,73 5,60 5,52 4,91 Poisson, 𝒏 = 𝟏𝟎, 𝝀 = 𝟎, 𝟐 6,40 6,84 6,59 6,59 5,22 Thomas (𝜿 = 𝟏, 𝝈 = 𝟑, 𝝁 = 𝟓) 71,63 Thomas (𝜿 = 𝟎, 𝟓, 𝝈 = 𝟎, 𝟓, 𝝁 = 𝟏𝟎) 100 Strauss (𝜷 = 𝟏𝟎, 𝜸 = 𝟎, 𝟗𝟓, 𝒓 = 𝟏) 21,31

Tableau 1 : Pourcentage de rejets de tirages de processus divers (1 000 tirages). Les distances traitées sont

𝒓 ∈ {𝟏; 𝟐; 𝟓} sauf indication contraire.

Le Tableau 1 présente les résul- tats en pourcentages de tirages rejetés. Chaque ligne du tableau correspond à un processus diffé- rent :

• Un processus de Poisson d’intensité 1 tiré dans un carré de 30x30 (espérance du nombre de points : 900), 𝐾�𝐴30 est calculé pour

𝑟 ∈ {1; 2; 5}. Ce cas ne pré- sente aucune difficulté : peu d’effets de bord, beau- coup de points.

• Un processus de Poisson d’intensité 5 tiré dans un carré de 10x10 (espé- rance du nombre de points : 500, voir un tirage Figure 15), 𝐾�𝐴10 est calculé

pour 𝑟 ∈ {1; 2; 5}. Cet exemple correspond à un cas concret assez courant. Les effets de bord sont importants : pour 𝑟 = 5, la zone centrale du carré de la Figure 10 disparaît totalement.

• Un processus de Poisson d’intensité 1 tiré dans un carré de 30x30 (espé- rance du nombre de points : 900), 𝐾�𝐴10 est calculé pour 𝑟 ∈ {1; 2; 3; … ; 10}.

Ce cas pose le problème de l’inversion d’une matrice Σ de grande taille (10x10).

• Trois processus de Poisson d’intensité 1, 0,5 puis 0,2 tirés dans un carré de 10x10. 𝐾�𝐴10 est calculé pour 𝑟 ∈ {1; 2; 5}. L’objectif est de tester les perfor-

mances de la méthode pour un nombre de points aussi faible que possible (espérance de 100, 50 puis 20 points).

Figure 16 : Processus de Thomas

Voir la définition en annexe 1, page 144 Voir la définition en annexe 1, page 147 Figure 17 : Processus de Strauss

• Un processus de Thomas très légèrement agrégé (voir un tirage Figure 16), dans un carré de 10x10. L’intensité des centres 𝜅 = 1, l’écart type de la dis- tance entre les points et les centres 𝜎 = 3 et l’espérance du nombre de points par agrégat 𝜇 = 5 (espérance du nombre total de points : 500) font que l’agrégation est difficile à détecter parce que les agrégats de points sont grands et se superposent largement. Le même processus avec deux fois moins d’agrégats, plus petits (𝜎 = 0,5) et contenant deux fois plus de points, devrait être plus facile à détecter.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

indiscernable du Poisson et du Thomas des figures précédentes. L’objectif est de tester la puissance du test.

Les résultats sont proches de 5% pour les processus de Poisson, ce qui montre que le test asymptotique fonctionne sur des cas réels. Bien que la variance asympto- tique soit loin d’être atteinte, la normalité est approximativement atteinte rapi- dement, ce qui permet d’appliquer le test à condition de calculer la variance pré- cisément. Les processus agrégés sont bien détectés (71% de rejet pour le Thomas très lâche et 100% pour le cas plus facile). Le processus très légèrement répulsif est détecté dans 21% des cas.

L’estimation empirique de la variance à partir de simulations présente l’avantage d’être très simple mais en pratique, le calcul de Σ nécessite de connaître l’intensité du processus, ce qui limite son intérêt.

L’utilisation de la variance calculée est donc plus appropriée. En pratique, l’intensité du processus est très rarement connue. Elle doit être estimée à partir du seul tirage disponible, le jeu de points étudié.