• Aucun résultat trouvé

Test du processus de Poisson homogène par la statistique de Ripley

N/A
N/A
Protected

Academic year: 2021

Partager "Test du processus de Poisson homogène par la statistique de Ripley"

Copied!
6
0
0

Texte intégral

(1)

HAL Id: inria-00386800

https://hal.inria.fr/inria-00386800

Submitted on 22 May 2009

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est

Test du processus de Poisson homogène par la

statistique de Ripley

Gabriel Lang, Eric Marcon

To cite this version:

Gabriel Lang, Eric Marcon. Test du processus de Poisson homogène par la statistique de Ripley. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386800�

(2)

Test du processus de Poisson homog`

ene

par la statistique de Ripley

Gabriel Lang & Eric Marcon

AgroParisTech, Equipe MORSE, UMR MIA518, F-75005 Paris, France, AgroParisTech, UMR EcoFoG, F-97310 Kourou, France

Mots-cl´es principaux: statistique math´ematique, statistique des processus

Mots-cl´es secondaires: processus ponctuels, processus de Poisson, agr´egation, test asymptotique

1

esum´

e

1.1

Definition et notations

Soit X un processus ponctuel sur R2. On peut caract´eriser la dependance entre les

posi-tions des points de X en ´etudiant le processus ponctuel X(2) defini sur R2× R2 par tous

les couples de points du processus original. L’intensit´e de ce nouveau processus informe surn la pr´esence simultan´ee de points dans le processus original. Notons ρ(2)(x, y) cette

(appel´ee densit´e produit du second ordre). L’intensit´e du processus de Poisson ρ(x) a pour propri´et´e que ρ(2)(x, y) = ρ(x)ρ(y).

La statistique de Ripley est une m´ethode d’estimation de la densit´e ρ(2)(x, y), plus

exacte-ment d’estimer l’int´egrale sur des ensembles tests du rapport g(x, y) = ρ(2)(x, y)/ρ(x)ρ(y).

La fonction g(x, y) caract´erise le fait que les points x and y simultan´ement dans les tirages de X. Si g(x, y) = 1, les points apparaissent ind´ependament. Si g(x, y) < 1, ils ont ten-dance `a s’exclure; si g(x, y) > 1, ils apparaissent fr´equemment ensemble.

Nous supposerons une certaine invariance spatiale du processus. Tout d’abord l’invariance par translation g(x, y) = g(x− y). Nous d´efinissons alors l’int´egrale de la fonction g sur un ensemble K :

K(A) = Z

A

g(x)dx.

Si nous supposons en plus que le processus is isotrope, nous d´efinissons la function K de Ripley par

K(r) =K(B(0, r)).

Par exemple, si le processus est processus de Poisson, alors g(x) = 1 et K(r) = πr2. Nous

utilisons l’estimateur de Ripley (Ripley, 1976) de la fonction K comme une statistique de test pour les processus de Poisson. Soit A un ensemble fini de R2, m la mesure de

(3)

1.2

Hypoth`

eses

Nous supposons que X est un processus de Poisson homog`ene sur R2 d’intensit´e inconnue

ρ. On choisit l’estimateur bρ = pN (N − 1)/n2. Les donn´ees sont observ´ees sur le carr´e

An= [0, n]2 et on fait tendre n vers l’infini. La statistique de Ripley s’exprime comme

b KAn(r) = n2 N (N − 1) X Xi6=Xj∈S I 1{d(Xi, Xj)≤ r}.

1.3

Biais

Nous calculons le biais dˆu aux effets de bord : Proposition 1 E bKAn(r) = r 2 µ π 8r 3n + r2 2n2 ¶ ³ 1− e−ρn2 − ρn2e−ρn2´ .

1.4

Variance

nous calculons un ´equivalent de la matrice de covariance de bKAN(r).

Proposition 2 Var( bKAn(r)) = 2πr2 ρ2n2 + O µ 1 n3 ¶ . Cov( bKAn(r), bKAn(r ′ )) = 2πr 2 ρ2n2 + O µ 1 n3 ¶ .

1.5

Theor`

eme de la Limite Centrale

Nous montrons qu’un vecteur normalis´e de statistiques de Ripleypour diff´erents r converge en distribution vers un vecteur normal.

Theorem 1 Soit d un entier, 0 < r1 < . . . < rd un ensemble de r´eels ;

Soit Kn= ( bKAn(r1), . . . , bKAn(rd)): n√ρ(Kn− π(r21, . . . r2d))−→ N (0, Σ) avec Σ = 2π(r 2 s∧ r2t)

(4)

1.6

Applications `

a la statistique de test

Du TLC, nous d´eduisons que T = Σ−1/2K

n est asymptotiquement distribu´e comme

N (0, Id) . Sous l’hypoth`ese

H0: X est un processus de Poisson homog`ene.

nous utilisons T2 =PT2

i comme statistique de test avec zone de rejet au niveau α:

T2 > χ2α(d). o`u χ2

α(d) est le quantile (1− α) de la distribution χ2(d).

2

Abstract

2.1

Definition and notations

Consider a point process X over R2. To characterize the dependence of the position of

points in X, one may consider the point process X(2) defined on R2× R2 by all the couple

of points of the original process. The density of this new process gives information on the simultaneous presence of points in the original process. Denote ρ(2)(x, y) this density

(called the second order product density). The Poisson process of density ρ(x) will have the property that ρ(2)(x, y) = ρ(x)ρ(y).

The Ripley statistic is a way to estimate the density ρ(2)(x, y). Precisely it is a way to

estimate the integral on test sets of the ratio g(x, y) = ρ(2)(x, y)/ρ(x)ρ(y). The function

g(x, y) characterizes the fact that the points x and y appear simultaneously in the samples of X. If g(x, y) = 1, the points appear independently. If g(x, y) < 1, they tend to exclude each other; if g(x, y) > 1, they appear more frequently together.

Now we assume some spatial invariance on the point process. The first property is the translation invariance g(x, y) = g(x− y). In order to estimate the function g, we define its integral as the set function K :

K(A) = Z

A

g(x)dx

If we also assume that the point process is isotropic, we define Ripley K-function as K(r) =K(B(0, r))

For example, if the process is a Poisson process then g(x) = 1 and K(r) = πr2. We use

the Ripley estimator of the K function as a test for Poisson processes. We define the Ripley statistic (Ripley, 1976) that estimates the K function. Let A be a finite subset of the R2, m be the Lebesgue measure. Assume that the intensity ρ is known. Let S be a

(5)

2.2

Assumptions

We assume that X is an homogeneous Poisson process on R2 with unknown intensity

ρ. Choose bρ = pN (N− 1)/n2. We consider that the data are available on the square

An= [0, n]2 and let n go to infinity. Ripley statistic is expressed as

b KAn(r) = n2 N (N − 1) X Xi6=Xj∈S I 1{d(Xi, Xj)≤ r}.

2.3

Bias

We compute the bias due to the edge effect Proposition 3 E bKAn(r) = r 2 µ π 8r 3n + r2 2n2 ¶ ³ 1− e−ρn2 − ρn2e−ρn2´ .

2.4

Variance

We compute an equivalent of the covariance matrix of bKAN(r).

Proposition 4 Var( bKAn(r)) = 2πr2 ρ2n2 + O µ 1 n3 ¶ . Cov( bKAn(r), bKAn(r ′ )) = 2πr 2 ρ2n2 + O µ 1 n3 ¶ .

2.5

Central Limit Theorem

We show that a normalized vector of Ripley’s statistics for different r converges in distri-bution to a normal vector.

Theorem 2 Let d be an integer, 0 < r1 < . . . < rd a set of reals and define Kn =

( bKAn(r1), . . . , bKAn(rd)): n√ρ(Kn− π(r21, . . . r2d))−→ N (0, Σ) where Σ = 2π(r 2 s∧ r2t)

(6)

2.6

Applications to test statistics

From the CLT, we deduce that T = Σ−1/2K

n is asymptotically N (0, Id) distributed.

Under the hypothesis

H0: X is an homogeneous Poisson process.

we use T2 =PT2

i as a test statistic with rejection zone for the level α:

T2 > χ2α(d).

where χ2

α(d) is the (1− α)-quantile of the χ2(d) distribution.

Bibliographie

[1] Moller, J., Waagepetersen, R.(2004) Statistical inference and simulation for spatial

point processes, Chapman and Hall.

[2] Ripley, B. D. (1976) The second-order analysis of stationary point processes. J. Appl.

Probab. 13, 255-266.

[3] Ripley, B. D. (1979) Tests of ‘randomness’ for spatial point patterns. J. Roy. Statist.

Références

Documents relatifs

Toute utili- sation commerciale ou impression systématique est constitutive d’une in- fraction pénale.. Toute copie ou impression de ce fichier doit contenir la présente mention

Remarque: On ne se préoccupe pas de savoir si t0 est elle-même une date d’occurrence ou pas, car cela ne change pas la loi de T grâce à l’hypothèse de homogénéité dans

Le test d’ ’amplificateur RF c amplificateur RF c’ ’est test de qualit est test de qualité é qui qui mesure les performances physiques desn. mesure les performances physiques des

Comme C([0, T ]) est séparable, tout ouvert est une union dénombrable de boules, donc il suffit de montrer que les boules sont dans F.. On vérifie que F den est une tribu, et

Si l'on connait la densité de probabilité du vecteur X sous H 0 , on peut déterminer la région critique RH 0 telle que la probabilité de de rejeter l'hypothèse nulle (c'est à dire

On en d´ eduit l’algorithme suivant pour g´ en´ erer la r´ ealisation d’une variable de loi de Poisson : G´ en´ erer x 1. des r´ ealisations de variables al´ eatoires de

Soit (X n ) une suite de variables al´ eatoires ind´ ependantes et identiquement distribu´ ees de loi exponentielle E(λ) avec λ &gt; 0.. En d´ eduire un code Matlab permettant de

L’ensemble des ´ etats est E = {ABC, AB, AC, BC, A, B, C, ∅}. Une fois qu’un char est descendu, il ne peut plus revenir et ainsi, on peut commencer par mettre un certain nombre de