Optimal Tests for Symmetry

(1)

Faculté des Sciences Département de Mathématique Service de Statistique Mathématique

Optimal Tests for Symmetry

Thèse présentée en vue de l’obtention du grade de Docteur en Sciences, orientation statistique.

Promoteurs: Marc Hallin et Davy Paindaveine

Ann´ ee acad´ emique 2006-2007 Delphine CASSART

(2)

Ce travail a été effectué sous la direction de Monsieur le Professeur Marc Hallin et de Monsieur le Professeur Davy Paindaveine. Je les remercie pour leur aide et leurs nombreux conseils, pour tout le temps qu’ils ont passé à lire mes manuscrits, et pour l’intérêt et le soutient qu’ils m’ont portés durant ces quatre années. Je tiens également à exprimer ma gratitude aux membres du jury.

Je voudrais remercier Catherine Dehon pour sa patiente et son écoute, ainsi que pour tous les moments agréables que nous avons passés en travaillant ensemble, et Catherine Vermandele qui a été le témoin des instants de joie ou de frustration qui ont rythmés ces années de recherche.

Je remercie mes collègues, et en particulier Nézar pour son amitié, et Thomas pour son aide ces derniers mois.

Je voudrais remercier mes parents pour leur patience ces 28 derni`eres ann´ees, et mes amis

pour leur pr´esence et leur soutien.

(3)

Introduction.

Dans ce travail, nous proposons des procédures de test paramétriques et nonparamétriques localement et asymptotiquement optimales au sens de Hájek et Le Cam, pour trois modèles d’asymétrie (les deux premiers sont des modèles univariés tandis que le dernier est multi- varié). La construction de modèles d’asymétrie est un sujet de recherche qui a connu un grand développement ces dernières années, et l’obtention des tests optimaux (pour trois modèles différents) est une étape essentielle en vue de leur mise en application. Notre approche est fondée sur la théorie de Le Cam d’une part, pour obtenir les propriétés de normalité asymptotique, bases de la construction des tests paramétriques optimaux, et la théorie de Hájek d’autre part, qui, via un principe d’invariance, permet d’obtenir les procédures nonparamétriques.

1 Les classes de mod` eles d’asym´ etrie

1.1 Probl´ ematique: qu’est-ce que la sym´ etrie, qu’est-ce que l’asym´ etrie?

La notion de symétrie dans un contexte univarié ne présente aucune ambigu¨ıté: la variable aléatoire X est symétrique par rapport à θ si X − θ =

^d

− (X − θ), o` u = désigne l’égalité en

^d

distribution. La notion d’asymétrie est plus vague. Cette négation de la symétrie peut en effet prendre des formes diverses. Nous considérons dans ce travail deux classes de distributions univariées asymétriques, l’une fondée sur un développement d’Edgeworth (décrit en page 6), et l’autre construite en utilisant un paramètre d’échelle différent pour les valeurs positives et négatives (le modèle de Fechner, décrit en page 7).

La notion de symétrie multivariée, quant à elle, n’est pas unique. Nous pouvons penser aux densités à symétrie sphérique ou elliptique, ou à toute autre forme de symétrie plus générale telle que la symétrie centrale (pour laquelle (X X X − θθθ) et − (X X X − θθθ) ont la même distribution). La symétrie elliptique est une forme plus générale que la symétrie sphérique, et permet de construire des extensions non gaussiennes de la plupart des procédures d’analyse multivariée classique.

Nous avons dès lors choisi ce type de modèles pour qualifier notre hypothèse nulle. De nom-

breux auteurs (voir par exemple Arellano-Valle et al (2005), Azzalini et Capitanio (2003)) ont

récemment proposé des modèles asymétriques émergeant d’une perturbation de la symétrie ellip-

tique. Le modèle d’asymétrie étudié dans le dernier chapitre est une généralisation multivariée

du mod`ele du Chapitre 2.

(7)

1.2 Les mod` eles d’asym´ etrie univari´ es

Nous proposons deux classes de modèles univariés. Le premier de ces modèles est basé sur un développement d’Edgeworth, le second est basé sur l’argument intuitif qu’une fonction de densité pour laquelle on utilise un paramètre d’échelle différent pour les valeurs positives et négatives sera asymétrique. Dans les deux cas, il s’agit de tester l’hypothèse nulle de symétrie. Deux types d’hypothèses sont à examiner:

(a) l’hypoth`ese H

⁽ⁿ⁾_θ

de symétrie par rapport à un paramètre de position fixé θ ∈ R : sous H

⁽ⁿ⁾_θ

, les observations X

_i

ont une fonction de densit´e x 7→ f (x) :=

_σ¹

f

₁

(

^x⁻_σ^θ

) (toutes les densités considérées dans ce travail sont absolument continues par rapport à la mesure de Lebesgue), o` u σ ∈ R

⁺

0

est un paramètre d’échelle non spécifié, et f

₁

appartient à la classe des densités symétriques et standardisées

F

0

:= ⁿ f

1

: f

1

( − z) = f

1

(z) et Z

₁

−∞

f

1

(z) dz = 0.75 ^o

(nous évitons donc les conditions d’existence de moments classiques en définissant le paramètre d’échelle σ par la médiane des valeurs absolues | X

i

− θ | plutˆ ot que comme l’´ecart-type);

(b) l’hypoth`ese H

⁽ⁿ⁾

:= ^S

_θ_∈R

H

⁽ⁿ⁾_θ

de symétrie par rapport à un paramètre de position non spécifié.

La famille d’Edgeworth

Dans le premier chapitre, nous considérons la classe de modèles construits de la manière suivante.

Soit une fonction de densit´e standardis´ee f

₁

qui soit (i) sym´etrique par rapport `a l’origine, (ii) non nulle sur R et absolument continue (on pose φ

_f₁

:= − f ˙

₁

/f

₁

), (iii) fortement unimodale, (iv) dont les coefficients d’information

I (f

1

) :=

Z

₊_∞

−∞

φ

²_f₁

(z)f

1

(z)dz et J (f

1

) :=

Z

₊_∞

−∞

z

²

φ

²_f₁

(z)f

1

(z)dz correspondant à la position et à l’échelle, ainsi que

K (f

1

) :=

Z

₊_∞

−∞

z

⁴

φ

²_f₁

(z)f

1

(z)dz

correspondant `a l’asym´etrie, soient finis, et (v) telle qu’il existe β > 0 tel que Z

_∞

a

f

₁

(z) dz = O( | a |

⁻^β

) et φ

_f₁

(z) = o( | z |

^β/2⁻²

) quand z → ∞ (cette derni`ere condition est purement technique). La distribution de probabilit´e du n-uple X X X

⁽ⁿ⁾

:= (X

₁⁽ⁿ⁾

, . . . , X

n⁽ⁿ⁾

), n ∈ N o` u les X

_i

sont i.i.d. est caractérisée par la fonction de densité

f (x) = 1 σ f

₁

µ x − θ σ

¶

− ξ 1 σ f ˙

₁

µ x − θ σ

¶ Ãµ x − θ σ

¶

2

− κ(f

₁

)

!

I [ | x − θ | ≤ σ | z

^∗

| ] (1) +sign(ξ) 1

σ f

1

µ x − θ σ

¶

{ I [x − θ > sign( − ξ)σz

^∗

] − I [x − θ < sign(ξ)σz

^∗

] } ,

(8)

−4 −3 −2 −1 0 1 2 3 4 0

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

−4 −3 −2 −1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

−4 −3 −2 −1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

−4 −3 −2 −1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

Figure 1: Repr´esentation graphique de la famille (1) gaussienne (f

1

= φ

1

), pour ξ = 0, 0.05, 0.10, et 0.15.

o` u θ et σ sont les paramètres de position et d’échelle, ξ est une mesure de l’asymétrie, κ(f

₁

) :=

J (f

₁

)/ I (f

₁

) (qui est positif pour tout f

₁

défini ci-dessus) le coefficient d’aplatissement (kurtosis) généralisé, et z

^∗

est l’unique solution (pour ξ suffisamment petit) de f

₁

(z

^∗

) = ξ f ˙

₁

(z

^∗

)((z

^∗

)

²

− κ(f

₁

)). Cette fonction a (comme il se doit) une intégrale égale à 1, et est non-négative. Elle est de plus continue à condition que ˙ f

₁

(x) le soit, s’annule pour x ≤ θ + σz

^∗

si ξ > 0, pour x ≥ θ + σz

^∗

si ξ < 0, et est asymétrique à gauche ou à droite suivant que ξ < 0 ou ξ > 0. La racine z

^∗

tend vers −∞ quand ξ ↓ 0, vers ∞ quand ξ ↑ 0.

Dans le cas gaussien (c’est-`a-dire, f

1

(z) = φ

1

(z) := ^p a/2π exp( − az

²

/2)), avec ξ = n

⁻^1/2

τ , (1), donne (pour x ∈ [θ ± σz

^∗

]) le développement d’Edgeworth au premier ordre de la moyenne d’un n-uple de variables i.i.d. de moment d’ordre 3 égal à 6τ σ

³

. La Figure 1 donne une repr´e- sentation graphique de (1) dans le cas gaussien.

La famille de Fechner

La classe de modèles considérée dans le deuxième chapitre a été proposée pour la première fois en 1898 par Fechner. Considérons une fonction de densité standardisée f

1

qui soit (i) sym´etrique par rapport `a l’origine, (ii) non nulle sur R et absolument continue, (iii) fortement unimodale, (iv) dont les coefficients d’informations I (f

₁

), J (f

₁

) et

M (f

₁

) :=

Z

₊_∞

−∞

| z | φ

²_f₁

(z)f

₁

(z)dz

correspondant à la position, à l’échelle et à l’asymétrie, soient finis. La distribution de probabilité du n-uple X X X

⁽ⁿ⁾

:= (X

₁⁽ⁿ⁾

, . . . , X

_n⁽ⁿ⁾

), n ∈ N o` u les X

_i

sont i.i.d. est caractérisée par la fonction de densité

f

_θ,σ

(x) := 1 σ

h f

₁

^³ x − θ (1 + ξ)σ

´ I[x ≤ θ]+f

₁

^³ x − θ (1 − ξ)σ

´ I[x > θ] ⁱ = 1 σ f

₁

µ x − θ σ(1 − ξsign(x − θ))

¶

, x ∈ R (2) o` u θ ∈ R , σ ∈ R

⁺

et ξ ∈ ( − 1, 1) sont comme précédemment les paramètres de position, d’échelle et d’asymétrie respectivement. Dans ces familles, ξ = 0 correspond à la symétrie, ξ > 0 à une asymétrie à gauche, et ξ < 0 à une asymétrie à droite. Intuitivement, il s’agit ici de choisir un paramètre d’échelle différent pour les valeurs positives et négatives, et de recoller les deux morceaux de la courbe en zéro.

Une repr´esentation graphique de (2) dans le cas gaussien est donn´ee par la Figure 2.

(9)

−4 −3 −2 −1 0 1 2 3 4 0

0.05 0.1 0.15 0.2 0.25 0.3 0.35

−4 −3 −2 −1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

−4 −3 −2 −1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

Figure 2: Repr´esentation graphique de (2) pour f

1

= φ

1

, avec ξ = 0, 0.1, et 0.2.

1.3 La sym´ etrie elliptique

Comme évoqué précédemment, la définition de la symétrie dans un contexte multivarié n’est pas unique. La notion de symétrie la plus générale dans ce cadre est la symétrie centrale qui requiert que (X X X − θθθ) et − (X X X − θθθ) aient la même distribution. La famille de distributions définie dans le troisième chapitre contient comme cas particulier symétrique la famille traditionnelle à symétrie elliptique, ce qui justifie notre choix. Un vecteur aléatoire X X X dans R

^k

est à symétrie elliptique si elle est caractérisée par une fonction de densité de la forme

f(x x x) = c

_k;f₁

1 | Σ Σ Σ |

^1/2

f

₁

^µ³ (x x x − θθθ)

^′

Σ Σ Σ

⁻¹

(x x x − θθθ) ^´

^1/2

¶

, x x x ∈ R

^k

(3) o` u θθθ ∈ R

^k

est un param`etre de position, Σ Σ Σ = (Σ

_ij

) ∈ S

k

= { M ∈ R

^k^×^k

| M est sym´etrique et d´efinie positive } , est une matrice de dispersion et c

_k;f₁

est une constante assurant que l’int´egrale, sur R

^k

, de f (x x x), soit égale à un. Le paramètre f

1

: R

⁺₀

→ R

⁺

est une fonction presque partout strictement positive appel´ee densit´e radiale.

1.4 Le mod` ele d’asym´ etrie multivari´ e

Le modèle d’asymétrie que nous considérons dans le troisième chapitre de ce travail est une généralisation multivariée du modèle (2) du second chapitre. Soit X X X

⁽ⁿ⁾

:= (X X X

⁽ⁿ⁾₁

, . . . , X X X

⁽ⁿ⁾_n

), n ∈ N , un vecteur d’observations i.i.d. dans R

^k

, et soient d

⁽ⁿ⁾_i

= d

_i

(θθθ, Σ Σ Σ) := k Z Z Z

⁽ⁿ⁾_i

(θθθ, Σ Σ Σ) k les modules des observations centrées et sphéricisées Z Z Z

⁽ⁿ⁾_i

= Z Z Z

⁽ⁿ⁾_i

(θθθ, Σ Σ Σ) := Σ Σ Σ

⁻^1/2

(X X X

⁽ⁿ⁾_i

− θθθ), i = 1, . . . , n. Si les X X X

⁽ⁿ⁾_i

ont pour densit´e (3), nous pouvons montrer que les d

⁽ⁿ⁾_i

sont i.i.d., et sont caractérisés par les fonctions de densité et de répartition

r 7−→ f ˜

_1k

(r) := 1

µ

_k₋_1;f₁

r

^k⁻¹

f

₁

(r)I

_[r>0]

et r 7−→ F ˜

_1k

(r) :=

Z

_r

0

f ˜

_1k

(s)ds.

Consid´erons une fonction f

1

: R

⁺₀

→ R

⁺

qui soit (i) strictement positive presque partout, (ii) standardis´ee de telle sorte que les d

⁽ⁿ⁾_i

aient une m´ediane unitaire, (iii) absolument continue, (iv) telle que r 7→ φ

_f₁

(r) :=

⁻_f^f^˙¹^(r)

1(r)

soit strictement croissante et telle que (v) les coefficients I

k

(f

1

), J

k

(f

₁

) et M

k

(f

₁

) soient finis, o` u

J

k

(f

₁

) :=

Z

_∞

0

φ

²_f₁

(r)r

²

f ˜

_1k

(r) dr, I

k

(f

₁

) :=

Z

_∞

0

φ

²_f₁

(r) ˜ f

_1k

(r) dr et M

k

(f

₁

) :=

Z

_∞

0

φ

²_f₁

(r)r f ˜

_1k

(r) dr.

(10)

Le modèle considéré dans le troisième chapitre est le suivant. Soit le n-uple X X X

⁽ⁿ⁾

:=

(X X X

⁽ⁿ⁾₁

, . . . , X X X

⁽ⁿ⁾_n

), n ∈ N o` u les X X X

_i

sont des vecteurs i.i.d. k-vari´es; la distribution de probabilit´e des X X X

_i

est caractérisée par la fonction de densité

f(x x x) = 1

| Σ Σ Σ |

^1/2

f

₁

^µ³ (x x x − θθθ)

^′

Σ Σ Σ

⁻^1/2

B B B

_Σ_Σ⁻_Σ²_−1/2_(x_x_x

−θθθ)

Σ Σ Σ

⁻^1/2

(x x x − θθθ) ^´

^1/2

¶

, x x x ∈ R

^k

(4) o` u θθθ ∈ R

^k

est un param`etre de position, Σ Σ Σ ∈ S

k

, est une matrice de dispersion, de racine carr´ee Σ

Σ

^1/2

, la matrice B B B

_Z_Z_Z

est diagonale avec B B B

_Z_Z_Z,jj

:= (1 − sign(Z

_j

)ξ

_j

) o` u ξξξ = (ξ

₁

, . . . , ξ

_k

)

^′

∈ ( − 1, 1)

^k

est le param`etre d’asym´etrie. La fonction f

1

: R

⁺₀

→ R

⁺

est presque partout strictement positive.

Par la suite, nous l’appellerons densit´e radiale.

Dans ce contexte, les hypoth`eses nulles que nous testons sont

– l’hypoth`ese H

_θθθ⁽ⁿ⁾

de sym´etrie elliptique par rapport au centre de sym´etrie θθθ ∈ R

^k

fix´e:

pour un matrice sym´etrique et d´efinie positive Σ Σ Σ ∈ R

^k^×^k

(non sp´ecifi´ee), les X X X

_i

ont pour fonction de densit´e (3), o` u f

₁

fait partie de la classe des densit´es radiales standardis´ees

G

0

:= ⁿ f

₁

: R

⁺

0

→ R

⁺

, fonction p.p. strictement positive, telle que ˜ F

_1k

(1) = 1/2 ^o ;

– l’hypoth`ese H

⁽ⁿ⁾

:= ^S

_θθθ_∈Rk

H

_θθθ⁽ⁿ⁾

de symétrie elliptique par rapport à un centre non spécifié.

2 La th´ eorie de H´ ajek et Le Cam

Nous montrons dans ce travail que les modèles décrits dans la section précédente jouissent de la propriété de normalité locale asymptotique (LAN). Ceci nous permet par la suite de construire des procédures de test optimales (localement et asymptotiquement).

2.1 Normalit´ e locale asymptotique - Convergence des exp´ eriences statistiques et optimalit´ e

Nous établissons, pour chacun des modèles présentés, une propriété de normalité locale asymptotique uniforme par rapport à ϑ ϑ ϑ = (θ, σ, ξ)

^′

(ϑ ϑ ϑ := (θθθ

^′

, (vechΣ Σ Σ)

^′

, ξξξ

^′

)

^′

, dans le cas du mod`ele multivari´e) en (θ, σ, 0)

^′

((θθθ

^′

, (vechΣ Σ Σ)

^′

, 000

^′

)

^′

respectivement). Nous présentons dans la suite de cette sous-section, ainsi que la suivante, les résultats dans le cadre le plus général, multivarié.

Pour tout ϑ ϑ ϑ

⁽ⁿ⁾

:= (θθθ

⁽ⁿ⁾

, vech(Σ Σ Σ

⁽ⁿ⁾

), 000)

^′

tel que θθθ

⁽ⁿ⁾

− θθθ = O(n

⁻^1/2

) et Σ Σ Σ

⁽ⁿ⁾

− Σ Σ Σ = O(n

⁻^1/2

), et pour toute s´equence born´ee τττ

⁽ⁿ⁾

= (ttt

⁽ⁿ⁾

, sss

⁽ⁿ⁾

, rrr

⁽ⁿ⁾

)

^′

∈ R

2k+k(k+1)/2

, on a, sous P

⁽ⁿ⁾_ϑ_ϑ_ϑ_(n)_;f

1

, quand n → ∞ ,

Λ

⁽ⁿ⁾_ϑ_ϑ_ϑ_(n)_+n_−1/2_τττ_(n)_/ϑ_ϑ_ϑ_(n)_;f

1

:= log



 dP

⁽ⁿ⁾_ϑ_ϑ_ϑ_(n)_+n_−1/2_τττ_(n)_;f

1

dP

_ϑ⁽ⁿ⁾_ϑ_ϑ_(n)_;f

1





= τττ

⁽ⁿ⁾^′

∆ ∆ ∆

⁽ⁿ⁾_f₁

(ϑ ϑ ϑ

⁽ⁿ⁾

) − 1

2 τττ

⁽ⁿ⁾^′

Γ Γ Γ

_f₁

(ϑ ϑ ϑ)τττ

⁽ⁿ⁾

+ o

P

(1) (5)

(11)

et la suite centrale ∆ ∆ ∆

⁽ⁿ⁾_f

1

(ϑ ϑ ϑ

⁽ⁿ⁾

) = ((∆ ∆ ∆

⁽ⁿ⁾_f

1;1

(ϑ ϑ ϑ

⁽ⁿ⁾

))

^′

, (∆ ∆ ∆

⁽ⁿ⁾_f

1;2

(ϑ ϑ ϑ

⁽ⁿ⁾

))

^′

, (∆ ∆ ∆

⁽ⁿ⁾_f

1;3

(ϑ ϑ ϑ

⁽ⁿ⁾

))

^′

)

^′

est asymptotiquement normale de moyenne nulle et de matrice de variance-covariance Γ Γ Γ

_f₁

(ϑ ϑ ϑ). Cette matrice prendra, dans le contexte de ce travail, la forme g´en´erale

Γ Γ

Γ

f1

(ϑ ϑ ϑ) =



  Γ Γ

Γ

_f₁_;11

(ϑ ϑ ϑ) 000 Γ Γ Γ

_f₁_;13

(ϑ ϑ ϑ) 000 Γ Γ Γ

_f₁_;22

(ϑ ϑ ϑ) 000 Γ

Γ

^′_f₁_;13

(ϑ ϑ ϑ) 000 Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ)



  (6)

Pour interpréter ce résultat, considérons le modèle de position gaussien n N ^³ Γ Γ Γ

_f₁

(ϑ ϑ ϑ)τττ , Γ Γ Γ

_f₁

(ϑ ϑ ϑ) ^´ | τττ ∈ R

2k+k(k+1)/2

o

à une seule observation que nous notons ∆ ∆ ∆. Il est facile de vérifier que le logarithme du rapport de vraisemblance associé à la loi gaussienne N ^³ Γ Γ Γ

_f₁

(ϑ ϑ ϑ)τττ , Γ Γ Γ

_f₁

(ϑ ϑ ϑ) ^´ par rapport `a N ^³ 000,Γ Γ Γ

_f₁

(ϑ ϑ ϑ) ^´ est donn´e par

τττ

^′

∆ ∆ ∆ − 1

2 τττ

^′

Γ Γ Γ

_f₁

(ϑ ϑ ϑ)τττ

ce qui signifie (voir le second membre de (5)) que le logarithme du rapport de vraisemblance “lo- cal” en ϑ ϑ ϑ est asymptotiquement équivalent au logarithme du rapport de vraisemblance dans un modèle de position gaussien classique. Comme nous l’expliquons ci-dessous, ceci a d’importantes implications sur la construction de procédures localement et asymptotiquement optimales pour la suite d’expériences en question.

La normalité locale asymptotique entraˆıne, pour tout ϑ ϑ ϑ, la convergence faible de la suite d’expériences locales (localisées en ϑ ϑ ϑ)

E

⁽ⁿ⁾

:= ⁿ R

^nk

, B

^nk

, ⁿ P

⁽ⁿ⁾_ϑ_ϑ_ϑ+n_−1/2_τττ_;f

1

| τττ ∈ R

2k+k(k+1)/2

oo vers le mod`ele de position gaussien

E := ⁿ R

(2k+k(k+1)/2)

, B

(2k+k(k+1)/2)

, ⁿ N ^³ Γ Γ Γ

_f₁

(ϑ ϑ ϑ)τττ , Γ Γ Γ

_f₁

(ϑ ϑ ϑ) ^´ | τττ ∈ R

2k+k(k+1)/2

oo

;

nous noterons ∆ ∆ ∆ := ∆ ∆ ∆

_f₁

= (∆ ∆ ∆

^′₁

, ∆ ∆ ∆

^′₂

, ∆ ∆ ∆

^′₃

)

^′

l’unique observation associée à ce modèle limite. Ce concept de convergence est basé sur une pseudo-distance (dite distance de Le Cam) entre les ensembles des fonctions de risque (de R

(2k+k(k+1)/2)

dans R

⁺

) réalisables sous les expériences considérées, pour les fonctions de perte bornées. Dans ce contexte d’hypothèse de test, ceci signifie en quelque sorte que, lorque n → ∞ , toutes les courbes de puissance réalisables pour l’expérience E

⁽ⁿ⁾

convergent – ponctuellement en τττ, mais uniformément en l’ensemble des toutes les procédures de test possibles – vers les courbes de puissance associées au modèle limite gaussien E . A l’inverse, pour toute fonction de risque R réalisable dans le modèle E , il existe une suite de fonctions de risque associées à E

⁽ⁿ⁾

qui converge ponctuellement vers cette fonction de risque R.

Il suffit donc de connaˆıtre les tests qui sont optimaux dans le mod`ele limite, pour les (versions locales des) probl`emes de test ₍

H

₀

: ξξξ = 000

H

1

: ξξξ 6 = 000. (7)

Deux cas sont envisagés par la suite: le paramètre θθθ sera dans un premier temps fixé dans H

₀

,

puis restera non sp´ecifi´e. La construction du test optimal devra dans ce cas tenir compte de la

corr´elation dans E entre ∆ ∆ ∆

₁

et ∆ ∆ ∆

₃

.

(12)

Les mod` eles univari´ es

Dans le contexte de test de sym´etrie univari´ee, notons τ

₃

la partie correspondant au paramètre d’asymétrie ξ dans la perturbation. Considérons le problème de test unilatéral

( H

₀

: ξ = 0

H

₁

: ξ > 0. (8)

La forme locale de l’hypothèse nulle dans le modèle limite est donnée par µ = Γ

_f₁_;33

(ϑ ϑ ϑ)τ

₃

= 0 ou simplement τ

3

= 0. Consid´erons le probl`eme de test

( H

₀

: τ = 0 H

₁

: τ > 0.

Dans ce contexte, le test optimal dans le mod`ele limite est donn´e par

Γ

_f₁_;33

(ϑ ϑ ϑ)

⁻^1/2

∆

₃

> z

₁₋_α

(9) o` u z

₁₋_α

est le quantile d’ordre 1 − α associ´e `a la loi normale standard.

Si θ est non spécifié sous l’hypothèse nulle et que la covariance Γ

_f₁_;31

(ϑ ϑ ϑ) entre ∆

₃

et ∆

₁

(correspondant au param`etre de position) est non nulle, il faudra tenir compte du fait qu’une perturbation locale de la position a le mˆeme impact asymptotique sur ∆

3

qu’une perturbation locale de ξ. Ceci implique que le test optimal (le plus stringent) sera construit à partir du résidu de la régression de ∆

₃

par rapport `a ∆

₁

. Ce r´esidu prend la forme ∆

₃

− (Γ

_f₁_,11

(ϑ ϑ ϑ))

⁻¹

Γ

_f₁_,13

(ϑ ϑ ϑ)∆

₁

; le test le plus stringent est alors le test φ

^∗

rejetant l’hypoth`ese nulle si

(∆

₃

− (Γ

_f₁_,11

(ϑ ϑ ϑ))

⁻¹

Γ

_f₁_,13

(ϑ ϑ ϑ)∆

₁

)/(Γ

_f₁_,33

(ϑ ϑ ϑ) − (Γ

_f₁_,11

(ϑ ϑ ϑ))

⁻¹

Γ

²_f₁_,13

(ϑ ϑ ϑ))

^1/2

> z

₁₋_α

. (10) D´esignant par C

_α

la collection des tests de niveau α pour le problème considéré, le test φ

^∗

construit ci-dessus fait partie de C

_α

, et

sup

P∈H1

r

_φ^∗

(P) ≤ sup

P∈H1

r

_φ

(P), ∀ φ ∈ C

α

o` u le rejet r

_φ₀

(P) d’un test φ

0

en P ∈ H

1

, d´efini par r

_φ₀

(P) = ^h sup

φ∈Cα

E

_P

[φ] ⁱ − E

_P

[φ

₀

]

est le d´eficit de puissance de φ

₀

par rapport à la puissance la plus élevée qui peut être réalisée en P par les tests de la classe C

_α

.

Les mod` eles multivari´ es

Notons τττ

₃

la parties correspondant au paramètre d’asymétrie dans la perturbation. Dans le modèle limite, la forme locale de l’hypothèse nulle en (7), si θθθ est fixé, est µ µ µ := Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ)τττ

₃

= 000 ∈ R

^k

, ou, de mani`ere ´equivalente τττ

₃

= 000. Consid´erons alors le probl`eme de test

( H

0

: τττ

3

= 000

H

₁^c

: τττ

^′₃

Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ)τττ

₃

> c, c > 0 (11)

(13)

o` u τττ

^′₃

Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ)τττ

₃

= µ µ µ

^′

(Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ))

⁻¹

µ µ µ (sous H

₁^c

, µ µ µ est en dehors de l’ellipso¨ıde de forme Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ) et de “rayon” √

c). On peut montrer dans ce contexte que le test φ

^∗

rejetant H

0

d`es que

∆

∆ ∆

^′₃

(Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ))

⁻¹

∆ ∆ ∆

₃

> χ

²_k;1₋_α

, (12) o` u χ

²_k;1₋_α

désigne le quantile d’ordre 1 − α associé à la distribution chi-deux à k degrés de liberté, est maximin pour le problème (11), dans la classe des tests de niveau α. Ceci signifie que φ

^∗

est de niveau α, et que sa puissance satisfait

E

_P

[φ

^∗

] ≥ sup

φ:E_HO[φ]≤α

P

inf

∈H₁^c

E

_P

[φ], ∀ P ∈ H

₁^c

.

Il est à noter que la statistique de test en (12) ne dépend pas de c, malgré le rˆ ole joué par c dans la définition de la contre-hypothèse considérée.

Si θθθ n’est pas sp´ecifi´e, et que la covariance entre ∆ ∆ ∆

₃

et ∆ ∆ ∆

₁

est non nulle, le test optimal (le plus stringent) devra être construit à partir du résidu de la régression de ∆ ∆ ∆

₃

par rapport `a ∆ ∆ ∆

₁

. Ce r´esidu prend la forme

∆ ∆

∆

^∗

= ∆ ∆ ∆

3

− Γ Γ Γ

^′_f₁_,13

(ϑ ϑ ϑ)Γ Γ Γ

⁻_f₁¹_,11

(ϑ ϑ ϑ)∆ ∆ ∆

1

.

Le test le plus stringent est alors le test φ

^∗

qui rejette l’hypoth`ese nulle quand

∆ ∆ ∆

^∗^′

(Γ Γ Γ

^∗_f₁

(ϑ ϑ ϑ))

⁻¹

∆ ∆ ∆

^∗

> χ

²_k;1₋_α

, (13) o` u Γ Γ Γ

^∗_f₁

(ϑ ϑ ϑ) = Γ Γ Γ

_f₁_;33

(ϑ ϑ ϑ) − (Γ Γ Γ

_f₁_;11

(ϑ ϑ ϑ))

⁻¹

Γ Γ Γ

_f₁_;13

(ϑ ϑ ϑ).

2.2 Proc´ edures localement et asymptotiquement optimales

Il découle des deux sous-sections précédentes que la construction de procédures localement et asymptotiquement optimales pour les problèmes (7) et (8) peut être effectuée en rempla¸cant l’observation gaussienne ∆ ∆ ∆, dans (9), (10), (12) et (13), par la suite centrale ∆ ∆ ∆

⁽ⁿ⁾_f₁

(ϑ ϑ ϑ

⁽ⁿ⁾

) associ´ee

à la décomposition LAN (5). Cette construction est entièrement basée sur la propriété de normalité locale asymptotique pour les différents modèles considérés.

Les procédures décrites ci-dessus nécessitent la connaissance de f

₁

. Ces procédures sont donc hautement paramétriques. Or, ce paramètre est généralement inconnu, et doit donc être considéré comme un paramètre de nuisance. Afin d’éliminer cette nuisance, nous utilisons un principe d’invariance, et c’est dans ce cadre qu’apparaissent des outils tels que rangs et signes.

Nous passons en revue, dans la section suivante, les propriétés d’invariance des problèmes de test considérés.

3 La notion d’invariance et les statistiques de rangs sign´ es

Dans cette section, nous décrivons les procédures de rangs signés, et nous expliquons comment

les rangs signés sont généralisés au cas d’un modèle multivarié.

(14)

3.1 Invariance et efficacit´ e semi-param´ etrique

Les procédures non paramétriques (ou semi-paramétriques) permettent de faire l’économie d’une spécification – souvent artificielle et discutable – de la densité f

1

sous-jacente au modèle con- sidéré. Cette spécification qui, par opposition, engendre les procédures paramétriques, trouve en effet plus souvent son origine dans un besoin de commodité analytique que dans un réel souci de modélisation. Les procédures non paramétriques sont ainsi valides quelles que soit la densité f

₁

standardisée et symétrique. De plus, ces procédures ont de bonnes propriétés d’efficacité sous une large gamme de distributions, tout en cédant très peu (et même parfois rien) aux procédures paramétriques sous la densité auxquelles ces dernières sont adaptées.

Supposons l’existence d’un invariant maximal (dans la suite, il s’agira des rangs signés, uni- variés ou multivariés), pour le groupe générant l’hypothèse nulle de symétrie par rapport à un centre spécifié. Hallin et Werker (2003) montrent que la suite centrale semi-paramétriquement efficace est obtenue en réduisant l’information disponible dans l’expérience de départ en condi- tionnant par rapport à l’invariant maximal. L’inférence semi-paramétrique peut donc être fondée sur cette suite centrale. Dans ce contexte, o` u l’hypothèse nulle correspond à une hypothèse de symétrie, les procédures semi-paramétriques optimales sont construites à partir de rangs signés définis ci-dessous.

3.2 Les rangs sign´ es univari´ es

L’hypoth`ese nulle H

⁽ⁿ⁾θ

de symétrie par rapport à θ est engendrée par le groupe G

θ⁽ⁿ⁾

,

^◦

de toutes les transformations

^G_h

de R

ⁿ

telles que

^G_h

(x

₁

, . . . , x

_n

) := (h(x

₁

), . . . , h(x

_n

)), o` u lim

_x_→±∞

h(x) =

±∞ , et x 7→ h(x) est continue, monotone croissante et impaire par rapport ` a θ (c’est-à-dire h(θ − z) = − h(θ + z)). Dans ce type de situation, le principe d’invariance préconise le recours exclusif à des procédures qui ne varient pas le long des orbites du groupe G

θ⁽ⁿ⁾

,

^◦

, ce qui est le cas si et seulement si ces procédures sont mesurables en l’invariant maximal associé à G

_θ⁽ⁿ⁾

,

^◦

. Un invariant maximal pour ce groupe est le vecteur des signes (s

1

(θ), . . . , s

n

(θ)), avec le vecteur des rangs (R

⁽ⁿ⁾_+,1

(θ), . . . , R

⁽ⁿ⁾_+,n

(θ)), o` u s

i

(θ) est le signe de X

i

− θ et R

⁽ⁿ⁾_+,i

(θ) le rang de | X

i

− θ | parmi

| X

₁

− θ | , . . . , | X

_n

− θ | .

L’adhésion au principe d’invariance s’accompagne du corollaire suivant: les procédures in- variantes, pour peu que le groupe de transformations soit générateur pour le modèle considéré, sont libres. Il est donc aisé de construire des tests dont la dimension sous l’hypothèse nulle est uniformément égale au niveau nominal, quelle que soit la densité symétrique sous-jacente.

3.3 Les rangs sign´ es multivari´ es

Nous décrivons ici les propriétés d’invariance du problème de test (7). L’hypothèse de symétrie elliptique jouit également de propriétés d’invariance dont nous pourrons tirer profit afin de construire les procédures non paramétriques optimales. L’hypothèse H

_θθθ⁽ⁿ⁾

de symétrie elliptique par rapport à θθθ est engendrée par le groupe G

_θθθ⁽ⁿ⁾

,

^◦

de toutes les transformations

^G_h

de R

^nk

= R

^k

× . . . × R

^k

telles que

Gh

(X X X

₁

, . . . , X X X

_n

) := (θθθ + h(d

₁

(θθθ, Σ Σ Σ))Σ Σ Σ

^1/2

U U U

₁

(θθθ, Σ Σ Σ), . . . , θθθ + h(d

_n

(θθθ, Σ Σ Σ))Σ Σ Σ

^1/2

U U U

_n

(θθθ, Σ Σ Σ)),

o` u lim

r→∞

h(r) = ∞ , h(0) = 0 and x 7→ h(x) est continue et monotone croissante.

(15)

Un invariant maximal pour ce groupe est le vecteur des signes multivari´es (U U U

₁

(θθθ, Σ Σ Σ), . . . , U U U

_n

(θθθ, Σ Σ Σ)), avec le vecteur des rangs (R

⁽ⁿ⁾₁

(θθθ, Σ Σ Σ), . . . , R

⁽ⁿ⁾_n

(θθθ, Σ Σ Σ)), o` u R

⁽ⁿ⁾_i

(θθθ, Σ Σ Σ) est le rang de d

_i

(θθθ, Σ Σ Σ) :=

|| Σ Σ Σ ^b

⁻^1/2

(X X X

_i

− θθθ) || parmi d

₁

(θθθ, Σ Σ Σ), . . . , d

_n

(θθθ, Σ Σ Σ) et U U U

_i

:= Σ Σ Σ ^b

⁻^1/2

(X X X

_i

− θθθ)/d

_i

.

Les procédures semi-paramétriques optimales dans le contexte multivarié seront donc elles aussi construites à partir de rangs signés tels que définis ci-dessus.

4 Contenu de ce travail, chapitre par chapitre

Chacun des trois chapitres de ce travail est structur´e de la fa¸con suivante.

Après avoir décrit le modèle pour lequel nous construisons les procédures optimales pour tester l’hypothèse de symétrie, nous obtenons la propriété de normalité locale asymptotique.

Cette propriété est établie à l’aide du Lemme de Swensen (1985). Les conditions de ce lemme sont aisément vérifiées, pour autant que la racine carrée de la fonction de densité caractérisant le modèle soit différentiable en moyenne quadratique. Cette dernière condition est donc le point crucial à vérifier.

A partir de ce r´esultat, nous sommes capables de construire les tests param´etriques localement et asymptotiquement optimaux. Ces tests ne sont toutefois valides que si f

₁

est correctement sp´ecifi´ee, et sont donc difficilement applicables en pratique.

Nous adaptons donc ces tests afin de pouvoir tester H

_θ⁽ⁿ⁾

:= ^S

_g₁

H

⁽ⁿ⁾_θ;g₁

et H

⁽ⁿ⁾

:= ^S

_g₁

H

⁽ⁿ⁾^g1

, qui sont des hypoth`eses plus r´ealistes. Les tests que nous obtenons restent de plus localement et asymptotiquement optimaux sous f

₁

. Dans cette introduction, nous présentons les cas parti- culiers des tests pseudo-gaussiens correspondant à chacun des modèles. Ces tests sont optimaux sous des hypothèses gaussiennes (par hypothèse gaussienne, nous entendons f

₁

= φ

₁

dans (1), (2) ou (4) selon le cas), mais restent valides (ils nécessitent toutefois une condition sur les moments de la densité sous-jacente) si l’hypothèse de normalité n’est pas satisfaite.

A partir des propriétés d’invariance expliquées plus haut (voir Section 3), nous obtenons ensuite les tests de rangs signés localement et asymptotiquement optimaux sous f

₁

, et valides sous une vaste classe de densités. Nous présentons en particulier, dans cette introduction, les tests fondés sur les scores normaux (ou tests de van der Waerden), qui sont optimaux sous des hypothèses gaussiennes, tout en étant valides (sans condition de moments) sous une loi elliptique arbitraire.

Afin de comparer les performances des tests paramétriques et non paramétriques présentés, nous calculons les efficacités asymptotiques relatives des tests non paramétriques par rapport aux tests pseudo-gaussiens, sous une vaste classe de densités non-gaussiennes, et nous proposons quelques simulations.

4.1 Les tests classiques de sym´ etrie

Les tests de sym´etrie “classiques” font naturellement intervenir les moments d’ordre trois. Con- sid´erons m

⁽ⁿ⁾_k

(θ) := n

⁻¹

^P

ⁿ_i=1

(X

_i

− θ)

^k

et m

⁽ⁿ⁾_k

:= m

⁽ⁿ⁾_k

( ¯ X

⁽ⁿ⁾

), o` u ¯ X

⁽ⁿ⁾

:= n

⁻¹

^P

ⁿ_i=1

X

_i

. Quand le paramètre de position θ est spécifié, la statistique de test traditionnelle a la forme

n

^1/2

m

⁽ⁿ⁾₃

(θ)/(m

⁽ⁿ⁾₆

(θ))

^1/2

, (14)

(16)

dont la distribution sous l’hypothèse nulle de symétrie (à condition toutefois que les moments d’ordre six soient finis) est asymptotiquement une loi normale standard. Quand θ n’est pas spécifié, la procédure de test classique se base sur le coefficient empirique d’asymétrie b

⁽ⁿ⁾₁

:=

m

⁽ⁿ⁾₃

/s

³_n

, o` u s

_n

:= (m

⁽ⁿ⁾₂

)

^1/2

est l’écart-type empirique d’un échantillon de taille n. Plus précisémment, ce test est fondé sur la distribution asymptotique (normale standard) de

b

⁽ⁿ⁾₁

= n

^1/2

m

⁽ⁿ⁾₃

/(m

⁽ⁿ⁾₆

− 6s

²_n

m

⁽ⁿ⁾₄

+ 9s

⁶_n

)

^1/2

. (15) A nouveau, ce test requiert l’hypoth`ese lourde que les moments d’ordres six soient finis.

Les procédures non paramétriques (mais aussi les procédures paramétriques en ce qui con- cerne le Chapitre 2) construites dans les deux premiers chapitres de ce travail sont valides sous des hypothèses nettement moins contraignantes.

4.2 Chapitre 1

Dans ce chapitre, nous construisons les procédures (paramétriques, puis non paramétriques) optimales pour la classe de modèles d’Edgeworth (1). Avec les notations définies page 6, ξ, le paramètre d’asymétrie, est le paramètre d’intérêt. Le paramètre θ sera dans un premier temps spécifié sous l’hypothèse nulle, puis jouera le rˆ ole d’une nuisance, au même titre que l’échelle σ.

La construction de tests ne requiérant pas la spécification de la densité standardisée symétrique f

1

est un des points cruciaux de ce chapitre.

Nous montrons tout d’abord que (1) possède la propriété de normalité locale asymptotique

`a condition que

(i) f

1

∈ F

0

, la classe des densités symétriques standardisées définie plus haut;

(ii) il existe ˙ f

₁

tel que, pour tout z

₀

∈ R , f

₁

(z

₀

) = Z

_z₀

−∞

f ˙

₁

(z)dz > 0, o` u (iii) z 7→ φ

_f₁

(z) := − f ˙

₁

(z)/f

₁

(z) est monotone croissante, et

(iv) K (f

₁

) soit fini;

(v) il existe β > 0 tel que Z

_∞

a

f

₁

(z) dz = O( | a |

⁻^β

) et φ

_f₁

(z) = o( | z |

^β/2⁻²

) quand z → ∞ . La propri´et´e LAN fait intervenir la suite centrale

∆

∆ ∆

⁽ⁿ⁾_f

1

(ϑ ϑ ϑ) :=



 



∆

⁽ⁿ⁾_f

1;1

(ϑ ϑ ϑ)

∆

⁽ⁿ⁾_f

1;2

(ϑ ϑ ϑ)

∆

⁽ⁿ⁾_f

1;3

(ϑ ϑ ϑ)



 

 := n

⁻^1/2

X

n i=1



 

1

σ

φ

_f₁

(Z

_i

)

1

σ

(φ

_f₁

(Z

_i

)Z

_i

− 1) φ

_f₁

(Z

i

) ^¡ Z

_i²

− κ(f

1

) ^¢



 

et la matrice d’information Γ Γ

Γ

_f₁

(ϑ ϑ ϑ) =



 

σ

⁻²

I (f

₁

) 0 0

0 σ

⁻²

( J (f

₁

) − 1) 0

0 0 γ(f

1

)



 

o` u γ(f

₁

) := K (f

₁

) −

^J_I²_(f^(f₁¹₎⁾

.

(17)

Les tests param´etriques optimaux φ

^∗

pour tester H

₀

: ξ = 0 contre H

₁

: ξ > 0 rejettent l’hypoth`ese nulle quand

T

_f⁽ⁿ⁾

1

(θ, _b σ

_#

) := 1 p nγ(f

1

)

X

n i=1

φ

_f₁

(Z

_i

(θ, σ _b

_#

)) ^³ Z

_i²

(θ, σ _b

_#

) − κ(f

₁

) ^´ > z

₁₋_α

. (16) Si le paramètre de position θ est non spécifié sous l’hypothèse nulle, il convient de l’estimer dans (16).

Ces tests ne sont toutefois valides que si f

₁

a été correctement identifiée. Cette hypothèse peu réaliste doit être contournée, afin d’obtenir des tests valides sous une grande classes de densités, mais toujours optimaux si la densité sous-jacente a été choisie correctement. Nous montrons alors que la statistique du test pseudo-gaussien optimal (valide ` a condition que les moments d’ordre six soient finis et optimal localement et asymptotiquement sous des hypothèses gaussiennes) s’écrit

T

_φ⁽ⁿ⁾^⊙

1

(θ) := T

_φ⁽ⁿ⁾^⊙

1

(θ, σ) = 1 q

nγ

⁽ⁿ⁾^⊙

(φ

₁

) X

n i=1

(X

_i

− θ) ^³ (X

_i

− θ)

²

− 3m

⁽ⁿ⁾₂

(θ) ^´ ,

o` u γ

⁽ⁿ⁾^⊙

(φ

1

) := m

⁽ⁿ⁾₆

(θ) − 6m

⁽ⁿ⁾₂

(θ)m

⁽ⁿ⁾₄

(θ) + 9(m

⁽ⁿ⁾₂

(θ))

³

.

Si θ est non spécifié, il convient bien sˆ ur de l’estimer. Le test a été construit de telle sorte que cette estimation se fasse sans perte de puissance. Nous retrouvons alors le test (15) si θ est estimé par la moyenne ¯ X

⁽ⁿ⁾

.

Dans un contexte semi-param´etrique, il est souhaitable que la distribution sous l’hypoth`ese nulle de la statistique de test soit invariante sous des perturbations de σ, f

1

et θ dans le cas o` u ces paramètres ne sont pas spécifiés. Quand la position θ est spécifiée, cet objectif est atteint en basant les tests sur les signes s

⁽ⁿ⁾_i

des Z

_i

(θ, _b σ

_#

) := (X

_i

− θ)/ _b σ

_#

, i = 1, ..., n et les rangs R

⁽ⁿ⁾_+,i

de leurs valeurs absolues. Comme expliqué dans la section précédente, ces tests sont invariants sous toutes les transformations du groupe G

_θ⁽ⁿ⁾

,

^◦

. Quand θ est non spécifié, les signes et les rangs doivent être calculés à partir de Z

_i

( θ ^b

_#

, σ _b

_#

), i = 1, ..., n, o` u θ ^b

_#

= θ ^b

⁽ⁿ⁾_#

et σ _b

_#

= _b σ

⁽ⁿ⁾_#

sont des estimateurs racine-n convergents et discr´etis´es de θ et σ.

Ces tests non param´etriques sont localement et asymptotiquement optimaux au sens de Le Cam sous f

₁

. Par exemple, le test de van der Waerden, qui rejette l’hypoth`ese nulle pour les grandes valeurs de

T e

(n)

vdW

(θ) := 1 q

n γ e

(n)

(φ

1

) X

n i=1

s

_i

(θ)Φ

⁻¹

^³ n + 1 + R

⁽ⁿ⁾_+,i

(θ) 2(n + 1)

´³³ Φ

⁻¹

^³ n + 1 + R

_+,i⁽ⁿ⁾

(θ) 2(n + 1)

´´

2

− 3 ^´ , (17)

o` u Φ est la fonction de r´epartition de la loi normale standard et γ e

(n)

(φ

1

) := n

⁻¹

X

n r=1

Φ

⁻¹

^³ n + 1 + r 2(n + 1)

´³³ Φ

⁻¹

^³ n + 1 + r 2(n + 1)

´´

2

− 3 ^´

²

,

est libre sous l’hypothèse de symétrie par rapport à θ, asymptotiquement équivalent au test fondé

sur b

⁽ⁿ⁾₁

sous les densit´es gaussiennes, et asymptotiquement optimal contre des alternatives locales

de la forme (1) avec f

₁

= φ

₁

et ξ > 0. Nous montrons ´egalement que les efficacit´es asymptotiques

(18)

relatives de ce test non param´etrique par rapport au test fond´e sur b

⁽ⁿ⁾₁

sont, sous une vaste classe de densités non-gaussiennes, strictement supérieures à 1.

Quand θ n’est pas sp´ecifi´e, la statistique de test (score normal) prend la forme T

e

(n)∗

vdW

( θ) := ^b 1 q

n γ e

(n)∗

(φ

₁

) X

n i=1

s

_i

( θ)Φ ^b

⁻¹

^³ n + 1 + R

⁽ⁿ⁾_+,i

( θ) ^b 2(n + 1)

´³³ Φ

⁻¹

^³ n + 1 + R

⁽ⁿ⁾_+,i

( θ) ^b 2(n + 1)

´´

2

− κ e

(n)

(φ

₁

; θ) ^b ^´ ,

o` u γ e

(n)∗

(φ

₁

) := n

⁻¹

^P

ⁿ_r=1

Φ

⁻¹

^³

^n+1+r_2(n+1)

^´³³ Φ

⁻¹

^³

_2(n+1)^n+1+r

^´´

²

− κ e

(n)

(φ

₁

; θ) ^b ^´

²

.

La forme de cette statistique de test fait donc apparaˆıtre le probl`eme de l’estimation κ e

(n)

(φ

₁

; θ), ^b ou plus g´en´eralement κ

e

(n)

(f

₁

; θ) du param`etre ^b κ := J (f

₁

, g

₁

)/ I (f

₁

, g

₁

) o` u I (f

₁

, g

₁

) :=

Z

1 0

φ

_f₁

^³ F

₁⁻¹

(u) ^´ φ

_g₁

^³ G

⁻₁¹

(u) ^´ du, et J (f

₁

, g

₁

) :=

Z

1

0

(F

₁⁻¹

(u))

²

φ

_f₁

^³ F

₁⁻¹

(u) ^´ φ

_g₁

^³ G

⁻₁¹

(u) ^´ du

(les fonctions F

₁

(.) et G

₁

(.) sont les fonctions de répartition standardisées correspondant à f

₁

et g

1

). La construction de cet estimateur (et donc des estimateurs de J (f

1

, g

1

) et I (f

1

, g

1

)) est fondée principalement sur une propriété de linéarité asymptotique. Notons S

e

(n)

(θ) (et sa version discr´etis´ee S

e

(n)

#

(θ)) une suite arbitraire de statistiques faisant intervenir les rangs R

⁽ⁿ⁾_i

(θ) d’un n-tuple de r´esidus Z

_i⁽ⁿ⁾

(θ) qui, sous une collection de mesures de probabilit´e P

⁽ⁿ⁾_θ,σ;g₁

sont i.i.d., avec densit´e standardis´ee g

1

. Nous supposons que, sous P

⁽ⁿ⁾_θ,σ;g₁

, quand n → ∞ ,

(R1) S e

(n)

(θ) est un O

_P

(1) mais pas un o

_P

(1);

(R2) θ ^b est un estimateur de θ, racine-n convergent, avec une version discr´etis´ee θ ^b

_#

; (R3) pour tout t ∈ R , S

e

(n)

(θ + n

⁻^1/2

t) = S e

(n)

(θ) − tσ

⁻¹

J (g

₁

) + o

_P

(1), et (R4) σ est estimé de manière convergente par σ, de version discrétisée _b σ _b

_#

. Soit θ

e

(n)

(β) := θ ^b

_#

+ n

⁻^1/2

β σ _b

_#

S e

(n)

#

( θ ^b

_#

), β

⁻

:= min { β

_ℓ

:= ℓ/c | S

e

(n)

#

( θ e

(n)

(β

_ℓ+1

)) S e

(n)

#

( θ ^b

_#

) < 0 } et β

⁺

:= β

⁻

+ 1 c

o` u c > 0 est une constante de discr´etisation arbitraire et ℓ ∈ N . Avec l’hypoth`ese (R3) ci-dessus, nous obtenons

S e

(n)

#

( θ e

(n)

(β

^±

)) S e

(n)

#

( θ ^b

_#

) = (1 − J (g

₁

)β

^±

)( S e

(n)

#

( θ ^b

_#

))

²

+ o

_P

(1). (18) Definissons

J

⁽ⁿ⁾

(g

1

) := [β

^∗

]

⁻¹

:=



 

 β

⁻

+ 1 c

S e

(n)

#

( θ e

(n)

(β

⁻

)) S

e

(n)

#

( θ e

(n)

(β

⁻

)) − S e

(n)

#

( θ e

(n)

(β

⁺

))



 



−1

.

(19)

Nous pouvons alors montrer que J

⁽ⁿ⁾

(g

₁

) est un estimateur convergent de J (g

₁

) sous P

⁽ⁿ⁾_θ,σ;g

1

, quand n → ∞ . Un estimateur convergent de κ est dès lors obtenu en appliquant la procédure décrite ci-dessus afin d’obtenir les estimations de J (f

₁

, g

₁

) et I (f

₁

, g

₁

). En pratique, nous cherchons par une it´eration des valeurs de β, la plus petite valeur de β pour laquelle l’expression en (18) est n´egative.

4.3 Chapitre 2

Dans le deuxième chapitre, nous considérons à nouveau le problème consistant à tester la symétrie dans un modèle univarié. Le but est de construire des tests optimaux, au sens lo- cal et asymptotique, dans des familles de la forme (2). Nous testons donc l’hypothèse nulle ξ = 0 dans des familles de Fechner, o` u le paramètre d’échelle σ est non spécifié, et o` u la position θ et la densité standardisée f

₁

sont sp´ecifi´ees ou non. Si f

₁

est une nuisance, les tests doivent être adaptés en ayant recours, par exemple, aux rangs signés.

A nouveau, le point de départ de ce chapitre est la propriété LAN. Nous montrons que la famille (2) possède la propriété de normalité locale asymptotique à condition que (i) f

₁

∈ F

0

soit absolument continue, (ii) fortement unimodale (z 7→ φ

_f₁

(z) := − f ˙

1

(z)/f

1

(z) sera alors monotone croissante), et (iii) tel que J (f

₁

) < ∞ .

La suite centrale et la matrice d’information qui interviennent dans ce mod`ele sont

∆

⁽ⁿ⁾_f

1

(ϑ ϑ ϑ) =:



 



∆

⁽ⁿ⁾_f

1;1

(ϑ ϑ ϑ)

∆

⁽ⁿ⁾_f

1;2

(ϑ ϑ ϑ)

∆

⁽ⁿ⁾_f

1;3

(ϑ ϑ ϑ)



 

 = n

⁻^1/2

X

n i=1



 

1

σ

φ

_f₁

(Z

_i

)

1

σ

(φ

_f₁

(Z

_i

)Z

_i

− 1)

− φ

_f₁

(Z

i

) | Z

i

|



 

et

Γ Γ Γ

_f₁

(ϑ ϑ ϑ) =



 

σ

⁻²

I (f

₁

) 0 − σ

⁻¹

M (f

₁

) 0 σ

⁻²

( J (f

1

) − 1) 0

− σ

⁻¹

M (f

₁

) 0 J (f

₁

)



  . (19)

Le test paramétrique optimal pour tester l’hypothèse de symétrie autour de θ fixé est basé sur

T

_f⁽ⁿ⁾₁

(θ, σ) := − 1 p n J (f

1

)

X

n i=1

φ

_f₁

(Z

_i

(θ, σ)) | Z

_i

(θ, σ) | . (20) La fonction intervenant en (20), `a savoir h(z) = φ

_f₁

(z) | z | est une fonction impaire. La statistique (20) sera donc nulle si les Z

_i

(θ, σ) sont placés de fa¸con symétrique de part et d’autre de zéro.

Il est à noter que la matrice d’information (19) n’est pas diagonale. Le paramètre θ ne peut dès lors pas être simplement remplacé, dans (20), par un estimateur √

n-convergent et sa non-spécification entraˆınera un coˆ ut en terme de puissance. Le test le plus stringent est alors basé, comme expliqué dans la Section 3, sur

T

_f^∗₁⁽ⁿ⁾

(θ, σ) := 1 q nγ

_f^∗₁

X

n i=1

φ

_f₁

(Z

_i

(θ, σ)) (η(f

₁

) − | Z

_i

(θ, σ) | ) ,

o` u γ

^∗_f₁

:= J (f

₁

) − M

²

(f

₁

)/ I (f

₁

).

Optimal Tests for Symmetry

Faculté des Sciences Département de Mathématique Service de Statistique Mathématique