- - -
- - -
Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository
Thèse de doctorat/ PhD Thesis Citation APA:
Cassart, D. (2007). Optimal tests for symmetry (Unpublished doctoral dissertation). Université libre de Bruxelles, Faculté des Sciences – Mathématiques, Bruxelles.
Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/210693/4/c01383c1-2cde-4faa-8564-e89c9ffa745d.txt
(English version below)
Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université ([email protected]).
Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.
DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :
Le nom des auteurs, le titre et la référence bibliographique complète soient cités;
L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;
Le contenu ne soit pas modifié.
L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.
--- English Version ---
This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University ([email protected]).
If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.
DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.
Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:
The authors, title and full bibliographic details are credited in any copy;
The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;
The content is not changed in any way.
It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.
D 03478
Université libre de Bruxelles Faculté des Sciences Département de Mathématique Service de Statistique Mathématique
Optimal Tests for Symmetry
Thèse présentée en vue de l’obtention du grade de Docteur en Sciences, orientation statistique.
Promoteurs: Marc Hallin et Davy Paindaveine
Année académique 2006-2007 Delphine CASSART
Université Libre de Bruxelles
Faculté des Sciences Département de Mathématique Service de Statistique Mathématique
Optimal Tests for Symmetry
Thèse présentée en vue de l’obtention du grade de Docteur en Sciences, orientation statistique.
Promoteurs: Marc Hallin et Davy Paindaveine
Année académique 2006-2007 Delphine CASSART
Ce travail a été effectué sous la direction de Monsieur le Professeur Marc Hallin et de Monsieur le Professeur Davy Paindaveine. Je les remercie pour leur aide et leurs nombreux conseils, pour tout le temps qu’ils ont passé à lire mes manuscrits, et pour l’intérêt et le soutient qu’ils m’ont portés durant ces quatre années. Je tiens également à exprimer ma gratitude aux membres du jury.
Je voudrais remercier Catherine Dehon pour sa patiente et son écoute, ainsi que pour tous les moments agréables que nous avons passés en travaillant ensemble, et Catherine Vermandele qui a été le témoin des instants de joie ou de frustration qui ont rythmés ces années de recherche.
Je remercie mes collègues, et en particulier Nézar pour son amitié, et Thomas pour son aide ces derniers mois.
Je voudrais remercier mes parents pour leur patience ces 28 dernières années, et mes amis
pour leur présence et leur soutient.
Introduction 5
1 Les classes de modèles d’asymétrie... 5
1.1 Problématique: qu’est-ce que la symétrie, qu’est-ce que l’asymétrie?... 5
1.2 Les modèles d’asymétrie univariés... 6
1.3 La symétrie elliptique... 8
1.4 Le modèle d’asymétrie multivarié... 8
2. La théorie de Hâjek et Le Cam... 9
2.1 Normalité locale asymptotique - Convergence des expériences statistiques et optimalité... 9
2.2 Procédures localement et asymptotiquement optimales... 12
3. La notion d’invariance et les statistiques de rangs signés... 12
3.1 Invariance et efficacité semi-paramétrique... 13
3.2 Les rangs signés univariés ... 13
3.3 Les rangs signés multivariés... 13
4 Contenu de ce travail, chapitre par chapitre... 14
4.1 Les tests classiques de symétrie... 14
4.2 Chapitre 1... 15
4.3 Chapitre 2... 18
4.4 Chapitre 3... 20
1 A Class of Optimal Tests for Symmetry Based on Edgeworth Approximations 23 1.1 Introduction... 23
1.1.1 Testing for symmetry... 23
1.1.2 Outline of the paper... 25
1.2 A class of locally asymptotically normal familles of asymmetric distributions. . . 26
1.2.1 Familles of asymmetric densities based on Edgeworth approximations. . . 26
1.2.2 Uniform local asymptotic normality (ULAN)... 29
1.3 Optimal parametric tests ... 30
1.3.1 Optimal parametric tests: specified density... 30
1.3.2 Optimal parametric tests: unspecified density... 31
1.3.3 Pseudo-Gaussian tests... 36
1.4 Rank-based tests for symmetry... 37
1.4.1 Signed-rank versions of the central sequence... 37
1.4.2 Optimal signed-rank tests of symmetry: specified location... 38
1.4.3 Optimal signed-rank tests of symmetry: unspecified location... 39
1.4.4 The van der Waerden, Wilcoxon, and Laplace tests of symmetry... 40
1.5 Asymptotic relative efficiencies and finite-sample performance... 43
1.5.1 Asymptotic relative efficiencies... 43
1.5.2 Simulation results... 44
1.6 Appendix... 47
1.6.1 Proof of Proposition 1.2.1... 47
1.6.2 Asymptotic linearity. ... 49
2 Optimal Détection of Fechner-Asymmetry 57 2.1 Introduction... 57
2.1.1 Testing for symmetry... 57
2.1.2 Outline of the paper... 59
2.2 Fechner families of skewed densities... 60
2.3 Uniform local asymptotic normality (ULAN) and parametrically optimal tests. . 62
2.3.1 ULAN... 62
2.3.2 Optimal paxametric tests: specified density, specified location... 63
2.3.3 Optimal parametric tests: specified density, unspecified location... 64
2.3.4 Optimal parametric tests: unspecified density, specified location... 65
2.3.5 Optimal parametric tests: unspecified density, unspecified location... 66
2.3.6 Pseudo-Gaussian tests... 68
2.4 Rank-based tests for symmetry... 70
2.4.1 Signed rank versions of the central sequence... 70
2.4.2 Optimal signed rank tests of symmetry: specified location... 71
2.4.3 Optimal signed rank tests of symmetry: unspecified location... 71
2.4.4 Wilcoxon, sign, and normal score tests of symmetry... 73
2.4.5 Estimation of cross-information quantities... 74
2.4.6 Asymptotic relative efficiencies... 76
2.4.7 Simulation results... 77
2.5 Appendix... 81
2.5.1 Proof of Proposition 2.3.1... 81
2.5.2 Asymptotic linearity... 83
3 A CI êiss of Tests for Elliptical Symmetry 88 3.1 Introduction... 88
3.1.1 Testing for symmetry... 88
3.1.2 Outline of the paper... 90
3.2 A class of multivariate asymmetric distributions based on the model of Arellano- Valle... 91
3.3 Uniform local asymptotic normality (ULAN) and parametrically optimal tests. . 92
3.3.1 Local asymptotic normality... 92
3.3.2 Optimal parametric tests: specified density, specified location... 94
3.3.3 Optimal parametric tests: specified density, unspecified location... 94
3.3.4 Optimal parametric tests: unspecified density, specified location... 96
3.3.5 Optimal parametric tests: unspecified density, unspecified location... 98
3.3.6 Pseudo-Gaussian tests...100
3.4 Rank-based tests for symmetry... 101
3.4.1 Signed-rank versions of the central sequence...101
3.4.3 Optimal signed rank tests of symmetry: unspecified location... 103
3.4.4 Normal-score tests of symmetry...104
3.4.5 Estimation of cross-information quantities... 105
3.4.6 Asymptotic relative efficiencies...107
3.4.7 Simulation results... 110
3.5 Appendix... 110
3.5.1 Proof of Proposition 3.3.1... 110
3.5.2 Proof of Proposition 3.4.1... 113
3.5.3 Asymptotic linearity... 114
Dans ce travail, nous proposons des procédures de test paramétriques et nonparamétriques localement et asymptotiquement optimales au sens de Hâjek et Le Cam, pour trois modèles d’asymétrie (les deux premiers sont des modèles univariés tandis que le dernier est multi
varié). La construction de modèles d’asymétrie est un sujet de recherche qui a connu un grand développement ces dernières années, et l’obtention des tests optimaux (pour trois modèles différents) est une étape essentielle en vue de leur mise en application. Notre approche est fondée sur la théorie de Le Cam d’une part, pour obtenir les propriétés de normalité asymptotique, bases de la construction des tests paramétriques optimaux, et la théorie de Hâjek d’autre part, qui, via un principe d’invariance, permet d’obtenir les procédures nonparamétriques.
1 Les classes de modèles d’asymétrie
1.1 Problématique; qu’est-ce que la symétrie, qu’est-ce que l’asymétrie?
La notion de symétrie dans un contexte univarié ne présente aucune ambiguïté: la variable aléatoire X est symétrique par rapport à û si X — û ^ —(X — û), où = désigne l’égalité en distribution. La notion d’asymétrie est plus vague. Cette négation de la symétrie peut en effet prendre des formes diverses. Nous considérons dans ce travail deux classes de distributions univariées asymétriques, l’une fondée sur un développement d’Edgeworth (décrit en Section ), et l’autre construite en utilisant un paramètre d’échelle différent pour les valeurs positives et négatives (le modèle de Fechner, décrit en Section ).
La notion de symétrie multivariée, quant à elle, n’est pas unique. Nous pouvons penser aux densités à symétrie sphérique ou elliptique, ou à toute autre forme de symétrie plus générale telle que la symétrie centrale (pour laquelle
(X— &) et
—(X—
0)ont la même distribution). La symétrie elliptique est une forme plus générale que la symétrie sphérique, et permet de constru
ire des extensions non gaussiennes de la plupart des procédures d’analyse multivariée classique.
Nous avons dès lors choisi ce type de modèles pour qualifier notre hypothèse nulle. De nom
breux auteurs (voir par exemple Arellano-Valle et al (2005), Azzalini et Capitanio (2003)) ont récemment proposé des modèles asymétriques émergeant d’une perturbation de la symétrie ellip
tique. Le modèle d’asymétrie étudié dans le dernier chapitre est une généralisation multivariée
du modèle du Chapitre 2.
1.2 Les modèles d’asymétrie univariés
Nous proposons deux classes de modèles univariés. Le premier de ces modèles est basé sur un développement d’Edgeworth, le second est basé sur l’argument intuitif qu’une fonction de densité pour laquelle on utilise un paramètre d’échelle différent pour les valeurs positives et négatives sera asymétrique. Dans les deux cas, il s’agit de tester l’hypothèse nulle de symétrie. Deux types d’hypothèses sont à examiner:
(a) l’hypothèse de symétrie par rapport à un paramètre de position fixé 0 G M: sous les observations Xi ont une fonction de densité x /(x) := (toutes les densités considérées dans ce travail sont absolument continues par rapport à la mesure de Lebesgue), où < t G M q paramètre d’échelle non spécifié, et /i appartient à la classe des densités symétriques et standardisées
^0 {fl ■ fi{-z) = /i(^) et [ fi{z)dz = 0.75}
(nous évitons donc les conditions d’existence de moments classiques en définissant le paramètre d’échelle a par la médiane des valeurs absolues \Xi — 6\ plutôt que comme l’écart-type);
(b) l’hypothèse 77^"^ UeeR ^1»"^ ele symétrie par rapport à un paramètre de position non spécifié.
La famille d’Edgeworth
Dans le premier chapitre, nous considérons la classe de modèles construits de la manière suivante.
Soit une fonction de densité standardisée f\ qui soit (i) symétrique par rapport à l’origine, (ii) non nulle sur R et absolument continue (on pose (f)f^ := —fi/fi), (ni) fortement unimodale, (iv) dont les coefficients d’information
/ +00 4’}A^)fi{z)dz et J{fi):=. f + OO (j)\{z)Ji{z)dz
-OO
J—OO
correspondant à la position et à l’échelle, ainsi que
/
+00
z‘^(j)\{z)fi{z)dz
-OO
çoo
correspondant à l’asymétrie, soient finis, et (v) telle qu’il existe /? > 0 tel que / f\{z) dz = 0(|a| ^)
J a
et 4>fi{z) = o(|z|^/^~^) quand z ^ OO (cette dernière condition est purement technique). La distribution de probabilité du n-uple := ... ,X„”^), n G N où les Xi sont i.i.d. est caractérisée par la fonction de densité
-fsign(0^/i ^ > sign(-^)o-2:*] - I[x - 9 < sign(^)CTZ*]} ,
(1)
Figure 1: Représentation graphique de la famille (1) gaussienne (fi — (f>i), pour^ = 0, 0.05, 0.10, et 0.15.
où 0 et (7 sont les paramètres de position et d’échelle, ^ est une mesure de l’asymétrie, k (/ i ) :=
j7(/i)/î(/i) (qui est positif pour tout fi défini ci-dessus) le coefficient d’aplatissement (kurtosis) généralisé, et 2:* est l’unique solution (pour ^ suffisamment petit) de /i(^;*) = ~
k (/ i )). Cette fonction a (comme il se doit) une intégrale égale à 1, et est non-négative. Elle est de pins continue à condition que fi{x) le soit, s’annule pour x < 6 + az* si Ç > 0, pour
X >
9 + az* si ^ < 0, et est asymétrique à gauche ou à droite suivant que ^ < 0 ou Ç > 0. La racine z* tend vers —00 quand ^ i 0, vers 00 quand O 0.
Dans le cas gaussien (c’est-à-dire, fi{z) = (j)i{z) \/a/27rexp(—02^/2)), avec ^
(1), donne (pour x G [0 ± az*\) le développement d’Edgeworth au premier ordre de la moyenne d’un n-uple de variables i.i.d. de moment d’ordre 3 égal à 6rcr^. La Figure 1 donne nne repré
sentation graphique de (1) dans le cas gaussien.
La famille de Fechner
La classe de modèles considérée dans le deuxième chapitre a été proposée pour la première fois en 1898 par Fechner. Considérons une fonction de densité standardisée fi qui soit (i) symétrique par rapport à l’origine, (ii) non nulle sur K et absolument continue, (iii) fortement unimodale, (iv) dont les coefficients d’informations X(/i), J{fi) et
/ +00 -00
correspondant à la position, à l’échelle et à l’asymétrie, soient finis. La distribution de probabilité du n-uple := (x{"\ ..., n G N où les X{ sont i.i.d. est caractérisée par la fonction de densité
(1
9
a \cr(l — ^sign(x — 0))
XG (2) où 0 G cr G M'*' et ^ G (—1,1) sont comme précédemment les paramètres de position, d’échelle et d’asymétrie respectivement. Dans ces familles, ^ = 0 correspond à la symétrie, ^ > 0 à une asymétrie à gauche, et Ç < 0 à une asymétrie à droite. Intuitivement, il s’agit ici de choisir un paramètre d’échelle différent pour les valeurs positives et négatives, et de recoller les deux morceaux de la courbe en zéro.
Une représentation graphique de (2) dans le cas gaussien est donnée par la Figure 2.
Figure 2: Représentation graphique de (2) pour fi = (pi, avec ^ = 0, 0.1, et 0.2.
1.3 La symétrie elliptique
Comme évoqué précédemment, la définition de la symétrie dans un contexte multivarié n’est pas unique. La notion de symétrie la plus générale dans ce cadre est la symétrie centrale qui requiert que (X
— 6)et
—{X—
0)aient la même distribution. La famille de distributions définie dans le troisième chapitre contient comme cas particulier symétrique la famille traditionnelle à symétrie elliptique, ce qui justifie notre choix. Un vecteur aléatoire
Xdans est à symétrie elliptique si elle est caractérisée par une fonction de densité de la forme
où 0 G M*’ est un paramètre de position, E = i^ij) G >5fc = {M G est symétrique et définie positive }, est une matrice de dispersion et Ck ji est une constante assurant que l’intégrale, sur M*’, de /(x), soit égale à un. Le paramètre /i : M q fonction presque partout strictement positive appelée densité radiale.
1.4 Le modèle d’asymétrie multivarié
Le modèle d’asymétrie que nous considérons dans le troisième chapitre de ce travail est une généralisation multivariée du modèle (2) du second chapitre. Soit := n G N, un vecteur d’observations i.i.d. dans R*, et soient d\"'^ = di{6,H) := \\zf^\d,Yi)\\ les modules des observations centrées et sphéricisées := ~ i = l, ■ ■ ■ ,n. Si les ont pour densité (3), nous pouvons montrer que les sont i.i.d., et sont caractérisés par les fonctions de densité et de répartition
r I—> /ifc(r) := —-—fi{r)I[r>o] et r<—^ Fik{r) := [ fik{s)ds.
Considérons une fonction /i : R q —+ R+ qui soit (i) strictement positive presque partout, (ii) standardisée de telle sorte que les aient une médiane unitaire, (iii) absolument continue, (iv) telle que r
h-> </>yj(r) := soit strictement croissante et telle que (v) les coefficients Ikifi),
•Jkifi) et À4k{fi) soient finis, où
foo _ foo _ roo ^
Jkifi) ■■= 4>}i{r)r^fik{r)dr, Ikifi) ~ (pp{r)fik{r) dr et Mk{fi) := (p\{r)rfik(r)dr.
Le modèle considéré dans le troisième chapitre est le suivant. Soit le n-uple
n G N où les Xi sont des vecteurs i.i.d. fc-variés; la distribution de proba
bilité des Xi est caractérisée par la fonction de densité
m = j^/i . I g R» (4)
OÙ
0 G est un paramètre de position, E G <Sfc, est une matrice de dispersion, de racine carrée la matrice Bz est diagonale avec Bzjj ■■= (1 - sign(Zj)^j) où ^ = (^i,..., ^k)' e (-1,1)'' est le paramètre d’asymétrie. La fonction /i : M q —> est presque partout strictement positive.
Par la suite, nous l’appellerons densité radiale.
Dans ce contexte, les hypothèses nulles que nous testons sont
- l’hypothèse de symétrie elliptique par rapport au centre de symétrie 0 G K*’ fixé:
pour un matrice symétrique et définie positive E G (non spécifiée), les Xi ont pom:
fonction de densité (3), où /i fait partie de la classe des densités radiales standardisées Go ■= {/i ^0 R"*", fonction p.p. strictement positive, telle que jPifc(l) = 1/2|;
- l’hypothèse de symétrie elliptique par rapport à un centre non spécifié.
2 La théorie de Hâjek et Le Cam
Nous montrons dans ce travail que les modèles décrits dans la section précédente jouissent de la propriété de normalité locale asymptotique (LAN). Ceci nous permet par la suite de construire des procédures de test optimales (localement et asymptotiquement).
2.1 Normalité locale asymptotique - Convergence des expériences statistiques et optimalité
Nous établissons, pour chacun des modèles présentés, une propriété de normalité locale asymp
totique uniforme par rapport à (i? := (0', (vechE)',^')', dans le cas du modèle multivarié) en {9,a,0)' ((0', (vechE)',0')' respectivement). Nous présentons dans la suite de cette sous-section, ainsi que la suivante, les résultats dans le cadre le plus général, multivarié.
Pour tout := (0("\ vech(E(”)),0)' tel que —9 = 0(n~^/^) et Ef’^f — E = 0(n“^/^), et pour toute séquence bornée rf”) = (<("),G R2fc+^(fc+i)/2^ on a, sous quand n —> oo.
a W log
. <à.,A .
r(n)/A(")(^(n)) _ + op(l) (5)
et la suite centrale asymptotique
ment normale de moyenne nulle et de matrice de variance-covariance Cette matrice prendra, dans le contexte de ce travail, la forme générale
/ 0 ry,;x3(tî) \
rf,{ê)=\ 0 0 (6)
V 0 r^,;33(t9) )
Pour interpréter ce résultat, considérons le modèle de position gaussien
{A^(ry,(t9)T,r/j(t?))|r G M2fc+fc(fc+l)/2|
à une seule observation que nous notons A. Il est facile de vérifier que le logarithme du rapport de vraisemblance associé à la loi gaussienne Af(r(i?)r, F(i?)^ par rapport à M(
o, F(i?)^ est donné par
r'A-lr'F;,(i9)r
ce qui signifie (voir le second membre de (5)) que le logarithme du rapport de vraisemblance “lo
cal” en i9 est asymptotiquement équivalent au logarithme du rapport de vraisemblance dans un modèle de position gaussien classique. Comme nous l’expliquons ci-dessous, ceci a d’importantes implications sur la construction de procédxrres localement et asymptotiquement optimales pour la suite d’expénences en question.
La normalité locale asymptotique entraîne, pour tout ’â, la convergence faible de la suite à' expériences locales (localisées en t?)
vers le modèle de position gaussien
£ ~
|K(2fc+fc(fc+l)/2)^g(2fc+fc(fc+l)/2)^ {Aé(F/j(l?)T,F/j(t?))|T G R2fc+fc(fc+l)/2jj.nous noterons A := A/j = (A'x,A2,A3)' l’unique observation associée à ce modèle limite. Ce concept de convergence est basé sur ime pseudo-distance (dite distance de Le Cam) entre les ensembles des fonctions de risque (de ^(^k+k{k+i)/
2) réalisables sous les expériences considérées, pour les fonctions de perte bornées. Dans ce contexte d’hypothèse de test, ceci signifie en quelque sorte que, lorque n ^ oo, toutes les courbes de puissance réalisables pour l’expérience convergent - ponctuellement en r, mais tmiformément en l’ensemble des toutes les procédures de test possibles - vers les courbes de puissance associées au modèle limite gaussien £. A l’inverse, pour toute fonction de risque R réalisable dans le modèle £, il ex
iste une suite de fonctions de risque associées à qui converge ponctuellement vers cette fonction de risque R.
Il suffit donc de connaître les tests qui sont optimaux dans le modèle limite, pour les (versions locales des) problèmes de test
Ho :^=0
iïi : ^ ^ 0. (7)
Deux cas sont envisagés par la suite; le paramètre 0 sera dans un premier temps fixé dans H
q,
puis restera non spécifié. La construction du test optimal devra dans ce cas tenir compte de la
corrélation dans £ entre Ai et A3.
Les modèles univariés
Dans le contexte de test de symétrie univariée, notons la partie correspondant au paramètre d’asymétrie ^ dans la perturbation. Considérons le problème de test unilatéral
Ho
La forme locale de l’hypothèse nulle dans le modèle limite est donnée par fi = T^ j ;33( i ?) t 3 = 0 ou simplement T3 = 0. Considérons le problème de test
Ho :
t= 0 H
i:
t>0.
Dans ce contexte, le test optimal dans le modèle limite est donné par
> Zi-a
où zi-a est le quantile d’ordre 1 — a associé à la loi normale standard.
Si 6 est non spécifié sous l’hypothèse nulle et que la covariance T/j;3i(r?) entre A3 et Ai (correspondant au paramètre de position) est non nulle, il faudra tenir compte du fait qu’une perturbation locale de la position a le même impact asymptotique sur A3 qu’une perturbation locale de Ceci implique que le test optimal {le plus stringent) sera construit à partir du résidu de la régression de A3 par rapport à Ai. Ce résidu prend la forme A3 — (Tji(t9))“^r/j_i3(iî)Ai;
le test le plus stringent est alors le test (j)* rejetant l’hypothèse nulle si
(A3 - (r^„ii(,?))-ir/„i3(i9)Ai)/(ry,.33(^5) - (r/,n(i?))-'r}^,i3(tî))i/2 > (lo) Désignant par Ca la collection des tests de niveau a pour le problème considéré, le test 4>*
construit ci-dessus fait partie de C'a, et
(9) (8)
sup r,^*(P) < sup r,^(P), V(/) 6 Pei/i Pei/i
où le rejet r,;èo(P) d’un test (j')o en P € iïi, défini par
= f sup Ep[</)]] - Ep[(po]
est le déficit de puissance de 4>o par rapport à la puissance la plus élevée qui peut être réalisée en P par les tests de la classe Ca-
Les modèles multivariés
Notons T3 la parties correspondant au paramètre d’asymétrie dans la pertmrbation. Dans le modèle limite, la forme locale de l’hypothèse nulle en (7), si 0 est fixé, est fi F/ i ;33( i ?) t 3 = 0 € R*’, ou, de manière équivalente T3 = 0. Considérons alors le problème de test
Ho : T3 = 0
Hl ■ T3r/i;33(ï?)T3 > C, C> 0 (11)
où r'^rf^-
3si‘à)T
3= /x'(r/j;33(i9)) V (sous Hf, fl est en dehors de l’ellipsoïde de forme Ffy,
33{‘à) et de “rayon” ^/c). On peut montrer dans ce contexte que le test (p* rejetant H
qdès que
A^(r/,;33(i?))-'A3>xla_„, (12)
où désigne le quantile d’ordre \ —a associé à la distribution chi-deux à k degrés de liberté, est maximin pour le problème (11), dans la classe des tests de niveau a. Ceci signifie que <p* est de niveau a, et que sa puissance satisfait
Ep[</>*] > sup inf Ep[(/>], VP 6 Ff.
Il est à noter que la statistique de test en (12) ne dépend pas de c, malgré le rôle joué par c dans la définition de la contre-h3rpothèse considérée.
Si 6 n’est pas spécifié, et que la covariance entre A3 et Ai est non nulle, le test optimal (le plus stringent) devra être construit à partir du résidu de la régression de A3 par rapport à Ai.
Ce résidu prend la forme
Le test le plus stringent est alors le test p* qui rejette l’hypothèse nulle quand
A*’{Tliê))-^A*>xla-., (13)
où r^i^) =
2.2 Procédures localement et asymptotiquement optimales
Il découle des deux sous-sections précédentes que la construction de procédures localement et asymptotiquement optimales pour les problèmes (7) et (8) peut être effectuée en remplaçant l’observation gaussienne A, dans (9), (10), (12) et (13), par la suite centrale A^”^(tî^"^) associée à la décomposition LAN (5). Cette construction est entièrement basée sur la propriété de normalité locale asymptotique pour les différents modèles considérés.
Les procédures décrites ci-dessus nécessitent la connaissance de f\. Ces procédures sont donc hautement paramétriques. Or, ce paramètre est généralement inconnu, et doit donc être considéré comme un paramètre de nuisance. Afin d’éliminer cette nuisance, nous utilisons un principe d’invariance, et c’est dans ce cadre qu’apparaissent des outils tels que rangs et signes.
Nous passons en revue, dans la section suivante, les propriétés d’invariance des problèmes de test considérés.
3 La notion d’invariance et les statistiques de rangs signés
Dans cette section, nous décrivons les procédures de rangs signés, et nous expliquons comment
les rangs signés sont généralisés au cas d’un modèle multivarié.
3.1 Invariance et efficacité semi-paramétrique
Les procédures non paramétriques (ou semi-paramétriques) permettent de faire l’économie d’une spécification - souvent artificielle et discutable - de la densité /i sous-jacente au modèle con
sidéré. Cette spécification qui, par opposition, engendre les procédures paramétriques, trouve en effet plus souvent son origine dans un besoin de commodité analytique que dans un réel souci de modélisation. Les procédures non paramétriques sont ainsi valides quelles que soit la densité fl standardisée et symétrique. De plus, ces procédures ont de bonnes propriétés d’efficacité sous une large gamme de distributions, tout en cédant très peu (et même parfois rien) aux procédimes paramétriques sous la densité auxquelles ces dernières sont adaptées.
Supposons l’existence d’un invariant maximal (dans la suite, il s’agira des rangs signés, uni
variés ou multivariés), pour le groupe générant rh3rpothèse nulle de symétrie par rapport à un centre spécifié. Hallin et Werker (2003) montrent que la suite centrale semi-paramétriquement efficace est obtenue en réduisant l’information disponible dans l’expérience de départ en condi
tionnant par rapport à l’invariant maximal. L’inférence semi-paramétrique peut donc être fondée sur cette suite centrale. Dans ce contexte, où l’hypothèse nulle correspond à une hypothèse de symétrie, les procédures semi-paramétriques optimales sont construites à partir de rangs signés définis ci-dessous.
3.2 Les rangs signés univariés
L’hypothèse nulle de symétrie par rapport à 9 est engendrée par le groupe ° de toutes les transformations de M" telles que e/i(xi,..., x„) := (fi(xi),..., h{xn)), où limi_±oo h{x) =
±oo, et X H-» h{x) est continue, monotone croissante et impaire par rapport à 6 (c’est-à-dire h{6 — z) = —h{9 + z)). Dans ce type de situation, le principe d’invariance préconise le recours exclusif à des procédures qui ne varient pas le long des orbites du groupe Gg^] ce qui est le cas si et seulement si ces procédures sont mesurables en l’invariant maximal associé à Gff^]°- Un invariant maximal pour ce groupe est le vecteur des signes (si(0), •.., s„(0)), avec le vecteur des rangs (R^j(0),...,
oùSi(9) est le signe de Xi — 9 et R^\{9) le rang de \Xi — 9\ parmi
\Xi-9\,.’..,\Xn-e\.’
L’adhésion au principe d’invariance s’accompagne du corollaire suivant: les procédures in
variantes, pour peu que le groupe de transformations soit générateur pour le modèle considéré, sont libres. Il est donc aisé de construire des tests dont la dimension sous l’hypothèse nulle est uniformément égale au niveau nominal, quelle que soit la densité symétrique sous-jacente.
3.3 Les rangs signés multivariés
Nous décrivons ici les propriétés d’invariance du problème de test (7). L’hypothèse de symétrie elliptique jouit également de propriétés d’invariance dont nous pourrons tirer profit afin de construire les procédures non paramétriques optimales. L’hypothèse Hg ’ de symétrie elliptique
(n)par rapport à B est engendrée par le groupe Gg^l » de toutes les transformations g^ de M"*’ = R*’ X ... X R*’ telles que
g^iXi, ...,Xn):^{B + ù(di(0,E))Si/2t/i(0,S), ...,e + /i(d„(0,E))Ei/2[/„(0,E)),
où limr-,oo h{r) = oo, h{0) = 0 and x >—> h(x) est continue et monotone croissante.
Un invariant maximal pour ce groupe est le vecteur des signes multivariés (Ui (0, E),..., S)), avec le vecteur des rangs , R^\d,'E)), où
rI^\
o,'E) est le rang de di(0,E) :=
- 0)11 parmi di(0, E),..., d„(0,E) et Ui := - 0)/d,-.
Les procédures semi-paramétriques optimales dans le contexte multivarié seront donc elles aussi construites à partir de rangs signés tels que définis ci-dessus.
4 Contenu de ce travail, chapitre par chapitre Chacun des trois chapitres de ce travail est structuré de la façon suivante.
Après avoir décrit le modèle pour lequel nous construisons les procédures optimales pour tester l’hypothèse de symétrie, nous obtenons la propriété de normalité locale asymptotique.
Cette propriété est établie à l’aide du Lemme de Swensen (1985). Les conditions de ce lemme sont aisément vérifiées, pour autant que la racine carrée de la fonction de densité caractérisant le modèle soit différentiable en moyenne quadratique. Cette dernière condition est donc le point crucial à vérifier.
A partir de ce résultat, nous sommes capables de construire les tests paramétriques locale
ment et asymptotiquement optimaux. Ces tests ne sont toutefois valides que si f\ est correcte
ment spécifiée, et sont donc difficilement applicables en pratique.
Nous adaptons donc ces tests afin de pouvoir tester ;= Ugi qui sont des hypothèses plus réalistes. Les tests que nous obtenons restent de plus localement et asymptotiquement optimaux sous /i. Dans cette introduction, nous présentons les cas parti
culiers des tests pseudo-gaussiens correspondant à chacun des modèles. Ces tests sont optimaux sous des hypothèses gaussiennes (par hypothèse gaussienne, nous entendons f\ = (j>\ dans (1), (2) ou (4) selon le cas), mais restent valides (ils nécessitent toutefois une condition sur les moments de la densité sous-jacente) si l’hypothèse de normalité n’est pas satisfaite.
A partir des propriétés d’invariance expliquées plus haut (voir Section ), nous obtenons ensuite les tests de rangs signés localement et asymptotiquement optimaux sous /i, et valides sous une vaste classe de densités. Nous présentons en particulier, dans cette introduction, les tests fondés sur les scores normaux (ou tests de van der Waerden), qui sont optimaux sous des hypothèses gaussiennes, tout en étant valides (sans condition de moments) sous une loi elliptique arbitraire.
Afin de comparer les performances des tests paramétriques et non paramétriques présentés, nous calculons les efficacités asymptotiques relatives des tests non paramétriques par rapport aux tests pseudo-gaussiens, sous une vaste classe de densités non-gaussiennes, et nous proposons quelques simulations.
4.1 Les tests classiques de symétrie
Les tests de symétrie “classiques” font naturellement intervenir les moments d’ordre trois. Con
sidérons := n~^ Z)?=i(-^i ~ et *^1”^ où := n~^ ^i- Quand
le paramètre de position 9 est spécifié, la statistique de test traditionnelle a la forme
(14)
dont la distribution sous l’hypothèse nulle de symétrie (à condition toutefois que les moments d’ordre six soient finis) est asymptotiquement une loi normale standard. Quand 9 n’est pas spécifié, la procédure de test classique se base sur le coefficient empirique d’asymétrie 6^"^ :=
où Sn := est l’écart-type empirique d’un échantillon de taille n. Plus précisémment, ce test est fondé sur la distribution asymptotique (normale standard) de
6^"^ = (15)
A nouveau, ce test requiert l’hypothèse lourde que les moments d’ordres six soient finis.
Les procédures non paramétriques (mais aussi les procédures paramétriques en ce qui con
cerne le Chapitre 2) construites dans les deux premiers chapitres de ce travail sont valides sous des hypothèses nettement moins contraignantes.
4.2 Chapitre 1
Dans ce chapitre, nous construisons les procédures (paramétriques, puis non paramétriques) optimales pour la classe de modèles d’Edgeworth (1). Avec les notations définies dans la Section , le paramètre d’asymétrie, est le paramètre d’intérêt. Le paramètre 6 sera dans un premier temps spécifié sous l’hypothèse nulle, puis jouera le rôle d’une nuisance, au même titre que l’échelle a. La construction de tests ne requiérant pas la spécification de la densité standardisée symétrique f\ est un des points cruciaux de ce chapitre.
Nous montrons tout d’abord que (1) possède la propriété de normalité locale asymptotique à condition que
(i) /i G .Fo, la classe des densités symétriques standardisées définie plus haut;
/ ^o . fi{z)dz > 0, où
-OO
(iii) 2 ■= ~/i(^)//i(^) 6st monotone croissante, et (iv) /C(/i) soit fini;
roo
(v) il existe /3 > 0 tel que / fi{z) dz = 0(|a|“^) et quand 2 —> oo.
Ja
La propriété LAN fait intervenir la suite centrale
Aÿjê) :=n-V^X:
t=i et la matrice d’information
r/.(iî)
où 7(/i)
/ a-2j(/i) 0 0 \
0 rr-2(J^(/i) - 1) 0
V 0 0 7(/i) J
Les tests paramétriques optimaux (jf pour tester H
q: ^ = 0 contre : ^ > 0 rejettent l’hypothèse nulle quand
:= (zf{e,â#)-^{f^)) > zi_„. (i6)
Si le paramètre de position 6 est non spécifié sous l’hypothèse nulle, il convient de l’estimer dans (16).
Ces tests ne sont toutefois valides que si /i a été correctement identifiée. Cette hypothèse peu réaliste doit être contournée, afin d’obtenir des tests valides sous une grande classes de densités, mais toujours optimaux si la densité sous-jacente a été choisie correctement. Nous montrons alors que la statistique du test pseudo-gaussien optimal (valide à condition que les moments d’ordre six soient finis et optimal localement et asymptotiquement sous des hypothèses gaussiennes) s’écrit
ji(n)0/^\ rp{n)Q
(6, a) 1
yÇi7fi*)®(0Ï)
où 7^”^®((?!> i ) := m^\9) — 6rn^^\9)rri'^\9) + 9{m^\9))^.
Si 9 est non spécifié, il convient bien sûr de l’estimer. Le test a été construit de telle sorte que cette estimation se fasse sans perte de puissance. Nous retrouvons alors le test (15) si 9 est estimé par la moyenne
Dans un contexte semi-paramétrique, il est souhaitable que la distribution sous l’hypothèse nulle de la statistique de test soit invariante sous des perturbations de a, f\ et 9 dans le cas où ces paramètres ne sont pas spécifiés. Quand la position 0 est spécifiée, cet objectif est atteint en basant les tests sur les signes des Zi{9,d^) := {Xi — 0)/fi^, i — l-, et les rangs de leurs valeurs absolues. Comme expliqué dans la section précédente, ces tests sont invariants sous toutes les transformations du groupe o. Quand 9 est non spécifié, les signes et les rangs doivent être calculés à partir de Zi{9^,â^), i = l,...,n, où 9^ = et sont des estimateurs racine-n convergents et discrétisés de 9 et a.
Ces tests non paramétriques sont localement et asymptotiquement optimaux au sens de Le Cam sous fi- Par exemple, le test de van der Waerden, qui rejette l’hypothèse nulle pour les grandes valeurs de
{n)
vdW
/ - r-E
y n'^y^){(j)i) i=i
Si V 2(n-fl) )((■ $
_i ,n+l + R^+\{9)
V 2(n-bl) ))'-3), (17)
où est la fonction de répartition de la loi normale standard et := n ' n -I- 1 d- r
2(n + l) )((^-‘( n -I- 1 -f- r 2(n + l)
est libre sous l’hypothèse de symétrie par rapport à 9, asymptotiquement équivalent au test fondé
sur sous les densités gaussiennes, et asymptotiquement optimal contre des alternatives locales
de la forme (1) avec /i = et ^ > 0. Nous montrons également que les efficacités asymptotiques
relatives de ce test non paramétrique par rapport au test fondé sur b\ sont, sous une vaste (n) classe de densités non-gaussiennes, strictement supérieures à 1.
Quand 9 n’est pas spécifié, la statistique de test (score normal) prend la forme
rp (n)*
£ vdW
iô)
.^
î=i
/n-f 1 -t- R^+l(9)
2(n + l) ')(( $
-1/Tî + 1 + V 2{n+l)
La forme de cette statistique de test fait donc apparaître le problème de l’estimation
k((/>i ; 9), ou plus généralement K^'^\fi',9) du paramètre
k:= où
I{h,gi) := £cl>f,[F{^{u))<f>g,{G^Hu))du, et J(fi,gi) := j\F{\u))%,{F,-Hu))cl>g,(G^\u))du
(les fonctions -Fi(.) et Gi(.) sont les fonctions de répartition standardisées correspondant à /i et gi). La construction de cet estimateur (et donc des estimateurs de J{fi,gi) et F{fi,gi)) est fondée principalement sur une propriété de linéarité asymptotique. Notons S^'^\9) (et sa version discrétisée S^^\9)) une suite arbitraire de statistiques faisant intervenir les rangs d’un n-tuple de résidus Z^’^\9) qui, sous une collection de mesures de probabilité sont i.i.d., avec densité standardisée gi. Nous supposons que, sous quand n —> oo,
(RI) 5^"^(0) est un Op(l) mais pas un op(l);
(R2) 9 est un estimateur de 9, racine-n convergent, avec une version discrétisée 9#;
(R3) pour tout t G M, S^^^9 + = S^^^(9) — ta~^J'(gi) + op(l), et (R4) CT est estimé de manière convergente par a, de version discrétisée Soit 0W(/3):=%+n-'/2/?â# 5^"^(%),
r min{^f := ijc \ sf S%\h) < 0} et (3^ - ^ ^
où c > 0 est une constante de discrétisation arbitraire et ^ G N. Avec l’hypothèse (R3) ci-dessus, nous obtenons
Sf{9j^\(3^))sf{9#) = (1 - J{gi)!3^){ÿi\h)f + «?(!) (18) Définissons
J^^\gx) := IPT' ■■=
sÿ{9^^\/3-)) T -1
r + §5^^(£(")(/3-)) - 5^^(£(")(/?+)) («)/
Nous pouvons alors montrer que est un estimateur convergent de J{g\) sous
quand n —> oo. Un estimateur convergent de
kest dès lors obtenu en appliquant la procédure décrite ci-dessus afin d’obtenir les estimations de J{fi,g\) et I{fi,gi). En pratique, nous cherchons par une itération des valeurs de (3, la plus petite valeur de (3 pour laquelle l’expression en (18) est négative.
4.3 Chapitre 2
Dans le deuxième chapitre, nous considérons à nouveau le problème consistant à tester la symétrie dans un modèle univarié. Le but est de construire des tests optimaux, au sens lo
cal et asymptotique, dans des familles de la forme (2). Nous testons donc l’hypothèse nulle
^ = 0 dans des familles de Fechner, où le paramètre d’échelle a est non spécifié, et où la position d et la densité standardisée f\ sont spécifiées ou non. Si f\ est une nuisance, les tests doivent être adaptés en ayant recoins, par exemple, aux rangs signés.
A nouveau, le point de départ de ce chapitre est la propriété LAN. Nous montrons que la famille (2) possède la propriété de normalité locale asymptotique à condition que (i) f\ G soit absolument continue, (ii) fortement unimodale {z h -» <f)f^{z) ■.= — f\{z)/f\{z) sera alors monotone croissante), et (iii) tel que J{f\) < oo.
La suite centrale et la matrice d’information qui interviennent dans ce modèle sont
J i=l
/ V
\ ) et
r/.(i?)
^ a ^T(/i) 0 -O-
0 ^“"(J(/i) - 1) 0
0 J(/i)
(19) Le test paramétrique optimal pour tester l’hypothèse de symétrie autour de 0 fixé est basé sin
■■= ^^rf^J2<l>hiZi{e,o))\Zi{e,a)\. (20) V nj (/i)
La fonction intervenant en (20), à savoir h{z) = 4>f^{z)\z\ est une fonction impaire. La statistique (20) sera donc nulle si les Zi{6,a) sont placés de façon symétrique de part et d’autre de zéro.
Il est à noter que la matrice d’information (19) n’est pas diagonale. Le paramètre 6 ne peut dès lors pas être simplement remplacé, dans (20), par un estimateur y^-convergent et sa non-spécification entraînera un coût en terme de puissance. Le test le plus stringent est alors basé, comme expliqué dans la Section , sur
r;W(0,a) := -^^■f2cf>f,{Zii0,a)) (rjih) - \Zi(0,a)\),
où 7;, :=
Quand 0 est spécifié, nous montrons que le test pseudo-gaussien est basé sur
== -.--/- -f:sign(X, - 9){Xi - fff.
Ce test possède l’avantage non négligeable sur (15) qu’il ne requiert que des moments d’ordre 4 finis, plutôt que l’hypothèse classique de moments d’ordre six finis.
Nous considérons ensuite le cas 9 non spécifié. Une difficulté supplémentaire dans ce cas est liée à nouveau à la non-diagonalité de la matrice d’information. Le test pseudo-gaussien prend alors la forme
Y:U{Xj~9){2m\^^\9)-\X,-9\)
\Jn{m^^\9)) — -f- i{rn[^'^\9)ym,^\9)
où m*f}'^\9) := n~^ Z)F=i \^i ~ Les deux tests pseudo-gaussiens ainsi construits sont valides sous une vaste classe de densités non gaussiennes, et sont asymptotiquement optimaux contre des alternatives locales de la forme (2) avec /i = </>i et ^ > 0.
Nous construisons dans un deuxième temps les tests non paramétriques optimaux. Ces tests (à nouveau basés sur les rangs signés) sont localement asymptotiquement les plus puissants (ou localement asymptotiquement les plus stringents, si la position 9 doit être estimée) au sens de Le Cam, sous des densités /i correctement spécifiées. Par exemple, le test de van der Waerden, dans le cas 9 spécifié, s’écrit
1
•J
i=ln + l + R^^}{9) 2(n+ 1)
où '■= n ^ ^("(n^))) • Cette statistique fait à nouveau intervenir une fonction impaire, et elle s’annulera donc dès lors que les données sont placées symétriquement de part et d’autre de 9.
Quand le paramètre 9 n’est pas spécifié dans l’hypothèse nulle, le test de van der Waerden prend la forme
q-i (n)
ivdW (9) := -
—^ - /
7Î "h1 + jR^ (0) \ / /
'(
_,^n+l + <i(9) 2(n+ 1) ))•
où 2 (")(<^,) := n-‘ E;. i (*-‘(it!AS7))"(3<">Wi; ») “ (üSS))"^ Le problème lié à l’estimation ~ ■^{h,9\)/1{h^9i) où
M{h,9i) ■■= £ \F{\u)\4>f, (Gr'(n)) du
(ici, avec f\ = </>i) est résolu d’une façon similaire à celle que nous avons décrite pour le Chapitre 1.
Nous montrons, par le calcul d’efficacités asymptotiques relatives, les excellentes perfor
mances de ces tests non paramétriques par rapport aux tests pseudo-gaussiens et aux tests
classiques.
4.4 Chapitre 3
Dans ce chapitre, nous abordons une problématique très peu étudiée par le passé. Nous généralisons le modèle étudié dans le chapitre 2, et construisons des procédures permettant de tester l’hypothèse nulle de symétrie elliptique. Ces procédures sont optimales (localement et asymptotiquement) dans les familles de la forme (4).
Nous testons l’hypothèse nulle ^ = 0 (ce qui revient à tester l’hypothèse de symétrie ellip
tique). Avec les notations définies dans la Section , ^ est donc le paramètre d’intérêt, S est un paramètre de nuisance, tout comme 6, si ce paramètre de position est non spécifié. La den
sité radiale /i sera dans un premier temps spécifiée, puis sera considérée elle aussi comme une nuisance.
Nous montrons tout d’abord que la famille (4) jouit de la propriété de normalité locale asymptotique si
(i) /i : R q ^ ®st strictement positive presque partout et est telle que Afc(l) = 1/2 (ii) il existe f\ telle que pour tout ro G R^, fi{ro) = /o° fi{r)dr > 0,
(iii) r H-> 0y-j(r) := est monotone croissante, et si (iv) v7fc(/i) < oo.
La suite centrale et la matrice d’information intervenant dans la propriété LAN sont
et
ou
<
n /= n-/^E
V y
i=l y( r/,;ii(i?)
r/.(^?) 0
V
r/,;ii(t?) = iîfc(/i)E-i, I
-(j>fi{di)diSu^
0 r/,;i3(i?)
0 r/i;33(î?) 0
3
k{k -t- 2) Jk{h)Ik, r/.32(tf) = \Pt ( e ®") 1-1/2 Jk(fl)
{Ik2 + Kk + Jk)—Jk et
k{k + 2)
rfvM'd) = -S“^’'^A4fc(/i)cfc si fc > 2,
^2®2y
-1/2( 21 )
avec Ck := Sfj=i(eiej)®(eje() (e/ est le /ème vecteur de la base canonique de R*=) et Jfc := ® (eie') = (vec /fc)(vec /*,)'.
Le test paramétrique localement et asymptotiquement optimal (pour tester l’hypothèse de symétrie elliptique par rapport à un centre fixé) est le test rejetant l’hypothèse nulle de symétrie elliptique quand
■■= InMh) hMi)<t>h{di)didiS'u,Su, > xl
;l-aoù Si/. = (([/ii)^sign(l7ii)... {Uik)^sign{Uik)Y et x| i-a désigne le quantile d’ordre 1 —a associé à la loi chi-deux à k degrés de liberté.
La matrice d’information (21) n’étant pas bloc-diagonale, le fait de ne pas spécifier le paramètre 6 sous l’hypothèse nulle ici encore a un coût. Le test paramétrique le plus strin- gent est fondé sur
n
4>fi{di)(j)f^{dj){kckr}k{fi)Ui - diSu^)'{kckr]k{hWj ~ djSu.).
îj=i
Les tests établis précédemment ne sont valides que si f\ a été correctement choisi. Les tests pseudo-gaussiens que nous proposons par la suite sont, eux, optimaux (localement et asympto
tiquement) sous l’hypothèse de normalité, et valides même si cette hypothèse n’est pas satisfaite (à la condition toutefois que les moments d’ordre 4 soient finis). Si le paramètre de position
0dans l’hypothèse nulle est spécifié, le test pseudo-gaussien est basé sur la statistique de test Q£^(^,S) := k{k -|- 2)
^ dUe,è)d^,i0,è)s'u^Su,, i,j=ï
OÙ := n~^ Z)”=i d{(0,^) est le moment empirique d’ordre j des distances dj(0,E) et ’^k(-) est la fonction de répartition de la loi chi-deux à k degrés de liberté. Ce test a été construit de façon à être valide sous une grande variété de densités (à la condition que les moments d’ordre 4 soient finis), et optimal sous fi = </)i dans (4) avec ^ ^ 0.
Si
0n’est pas spécifié, la statistique de test doit être adaptée de sorte à permettre l’estimation de
0.Cette construction est basée sur le troisième lemme de Le Cam. Le test pseudo-gaussien dans ce cas est obtenu de la façon suivante. Soit
:= n~^/^J2^kdi(ck(k + l)mj"^£7i - di5f;,).
i=l
Nous définissons la statistique de test par
où ;= >)4a.
Dans un contexte semi-paramétrique, les tests invariants sont fondés sur les signes multivariés f/J”) de
Zi(0,S#),i
spécifié, les signes et les rangs doivent être calculés à partir des Zj(0^,S^), i = l,...,n, où S# = sont des estimateurs, -y/n-convergents et discrétisés, de la position 0 et de la matrice S.
Le statistique de test de van der Waerden optimal prend la forme suivante quand
0est spécifié:
l,J = l
et les rangs des distances Quand
0est non
Nous montrons (à partir d’nn calcul d’efficacités asymptotiques relatives et de simulations) que ce test a de bonnes performances, par rapport au test pseudo-gaussien ().
Quand la position 0 sous l’hypothèse nulle est non spécifiée, le test de van der Waerden est construit de la façon suivante. Soit
i=\ n-t y
La statistique de test non paramétrique permettant de tester l’hypothèse de symétrie elliptique par rapport à une position non spécifiée est
'lévdW ou
1/2
r=l
-I--- k{k + 2)
A nouveau, le problème délicat de l’estimation de r]k{fi,9i) ■= ■Mk{fi,9i)/Ikifi>9i)
OU
^kifi,9i) ■= <Ph{^rkiu))<f>gi [ô^ki^Ÿjdu, et Mk(fi,9i) := F-,\u)4>f,(F{-,\u))cP,,(G-,\u))du
(ici, avec fi = (f>i) sera basé sur une propriété de linéarité asymptotique. Nous renvoyons au
texte pour les détails de la construction de cet estimateur.
A Class of Optimal Tests for Symmetry Based on Edgeworth Approximations
Abstract
The objective of this paper is to provide, for the problem of univariate symmetry (with respect to specified or unspecified location), a concept of optimality, and to construct parametric and signed rank tests achieving such optimality. This requires embedding symmetry into adéquate families of asymmetric (local) alternatives. We construct such families by considering non- Gaussian generalizations of classical first-order Edgeworth expansions indexed by a measure of skewness such that (i) location, scale and skewness play well-separated rôles (diagonality of the corresponding information matrices), and (ii) the classical tests based on the Pearson-Fisher coefficient of skewness are optimal in the vicinity of Gaussian densities. The signed-rank tests we are proposing are based on an original estimator of cross-information quantities, and axe distribution-free (asymptotically distribution-free, in the case of unspecified location) under an extremely broad class of symmetric densities. Asymptotic relative efficiencies with respect to the classical Gaussian procedure are particularly high when Gaussian scores are considered, and uniformly larger than one, for instance, over the whole class of Student and power-exponential densities.
AMS 1980 subject classification : 62M15, 62G35.
Key words and phrases : Skewed densities, Edgeworth expansion, Ranks, Local asymptotic normality, Locally asymptotically most powerful tests. Tests for symmetry.
1.1 Introduction.
1.1.1 Testing for symmetry.
Symmetry is one of the most important and fundamentaJ structural assumptions in statistics, playing a major rôle, for instance, in the identifiability of location or intercept under nonpara- metric conditions: see Stein (1956), Beran (1974) and Stone (1975). This importance explains the huge variety of existing testing procedures of the null hypothesis of symmetry in an i.i.d.
sample Ai,..., A„.
Glassical tests of the null hypothesis of symmetry—the hypothesis under which X\ — Q ^
—(Al — d) for some location 0 G K, where = stands for equality in distribution—are based
on third-order moments. Let := ~ •= where X(n) . = n ^ ^i- When the location 9 is specified, the test statistic is
( 1 . 1 ) the null distribution of which, under finite sixth-order moments, is asymptotically standard normal. When 6 is unspecified, the classical test is based on the empirical coefficient of skewness 6^"^ := /s^, where s„ := stands for the empirical standard error in a sample of size n. More precisely, this test relies on the asymptotic standard normal distribution (still under finite moments of order six) of
(1.2) These two tests are generally considered as Gaussian procedures, although Gaussian assumptions are not required—and despite the fact that none of them can be considered optimal in any Gaussian sense, as asymmetric alternatives clearly cannot belong to the Gaussian world. Despite the long history of the problem, the optimality features of existing procedures thus are ail but clear, and optimality issues remain essentially unexplored.
Symmetry however typically is a nonparametric hypothesis. Nonparametric tests of symme
try based on empirical distribution fonctions hâve been proposed as early as Butler (1969) (with a test statistic of the Kolmogorov-Smirnov type), by Rothman and Woodrofe (1972) and Hill and Rao (1977) (with a test statistic of the Cramér-von Mises type). As usual in such context, some arbitrary distance is adopted on the space of distribution fonctions, but no optimality issues are considered; consistency rates moreover are nonparametric.
The null hypothesis of symmetry on the other hand also enjoys a rich group invariance structure, that should not remain unexploited. Maximal invariance arguments in this con
text naturally bring signs and signed-ranks into the picture. The most popular nonparametric signed-rank tests of symmetry (with respect to the origin or any specified location) are the sign test, based on the binomial distribution of the number of négative signs in a sample of size n, and Wilcoxon’s signed-rank test, based on the exact or asymptotic null distribution of 5^^ := Sr=i where si,...,s„ dénoté the signs, and • • •,the ranks of absolute values in a sample of size n. Again, these tests are not optimal in any satisfactory sense against asymmetry: actually, they are locally asymptotically one-sided optimal against location shifts—under otherwise unspecified density for the sign test, under logistic densities for the Wilcoxon one. There is no way such tests can be adapted to an unspecified location context.
And the sign test is completely insensitive to nonsymmetric alternatives preserving the médian.
Another signed-rank test based on signs is the runs test proposed by McWilliams (1990) and further investigated by Henze (1993). Although not addressing any well-identified alternative, this test has low sensitivity against location shifts. The triples test by Randles et al. (1980) is location-invariant, and also based on signs. Those signs however are those of quantifies of the form Xi -|- Xj — 2Xk, l<i<j<n, i^k^j, which do not follow from any concept of group invariance and are not distribution-free. Optimality properties again are unclear, though performances in simulations appear to be very good (Section 1.5.2).
The main objective of this paper is to provide this classical problem with a concept of
optimality that coincides with practitioners’ intuition, and to construct parametric and signed-
rank tests achieving such optimality. This requires embedding the null hypothesis of symmetry
into adéquate families of asymmetric alternatives. We therefore define local (in the Le Cam
sense) alternatives indexed by a measure of skewness such that (i) location, scale, and skewness play well separated rôles (diagonality of the corresponding information matrices), and (ii) the traditional tests based on b\ become locally and asymptotically optimal in the vicinity of
(n)Gaussian densifies. As we shall see, this objective is achieved by considering local first-order Edgeworth approximations of the form
(j){x — 9) + — 9)4>{x — 9){{x — 9Ÿ — «), (1-3) where 4> as usual stands for the standard normal density, k (=3) is the Gaussian kurtosis coeffi
cient, 0 is a location parameter and ^ is a measure of skewness, and non-Gaussian generalizations thereof (see (1-5)). The resulting tests (for specified as for unspecified location 9) are valid under a broad class of symmetric densifies, and parametrically efficient at some reference (standard- ized) density fi. Of particular interest are the pseudo-Gaussian tests (with Gaussian reference density), which appear to be closely related with the test based on 6) .
These tests however are still of a parametric nature, and often require undesirably strong distributional assumptions such as (for the pseudo-Gaussian case) finite moments of order six.
Based on the group invariance features of the problem, we also construct signed-rank coun- terpaxts, which are distribution-free (asymptotically distribution-free in case of an unspecified location), and hence remain valid under much milder distributional assumptions (for the speci
fied location case, they are valid in the absence of any distributional assumption), while retaining optimality features at correctly specified densifies.
For instance, the normal score signed-rank test rejecting the null hypothesis of symmetry for large values of
T^;^{9) := ^/n + 1 + R+}{9)
V 2(n + l) )((
_iV 2{n+l) + 1 + )f-3), (1.4)
where 4> is the standard normal distribution fonction, Si{9) and R^^\{9) stand for the signs and ranks of the absolute values of Zi{9) ~ Xi — 9, and
:= n »+ 1 + rx// i/n + l + r
2(n-fl)/vV
V2(n-t-l)
is distribution-free under the hypothesis of symmetry with respect to 9, asymptotically équivalent to the test based on under Gaussian densifies, hence asymptotically most powerful against local alternatives of the form (1.3) with ^ > 0. And, under a very broad class of non-Gaussian densifies (containing, among many others, ail Student and power-exponential ones), the ARE (see Section 1.5.1) of this signed-rank test is strictly larger than one with respect to the test based on
1.1.2 Outline of the paper.
The problem we are considering throughout is that of testing the null hypothesis of symmetry.
In the notation of the previous section, ^ (see (1.5) for a more précisé définition) is thus the
parameter of interest, while the location 9 and the standardized null symmetric density /i either
are specified or play the rôle of nuisance parameters; as for the scale cr, we always treat it as a
nuisance.
The paper is organized as follows. In Section 1.2.1 we describe the Edgeworth-type families of local alternatives, extending (1.3), we are considering. Section 1.2.2 establishes the local and asymptotic normality (with respect to the location, scale and asymmetry parameters) resuit that provides the main theoretical tool of the paper. The classical Le Cam theory then allows for developing asymptotically optimal procedures for testing symmetry = 0), with specified or unspecified location 6.
A parametric (as opposed to rank-based) approach of the problem is considered first. Sec
tion 1.3.1 rapidly solves the unrealistic case of a specified standaxdized density /i, with specified or unspecified location 6. The more practical case of an unspecified /i is treated in Section 1.3.2, where we obtain versions of the optimal (at given /i) tests that remain valid under gi ^ /i, for specified (Section 1.3.2) and unspecified (Section 1.3.2) location 0, respectively. The particular case of pseudo-Gaussian procedures (optimal for Gaussian /i but valid under any symmetric density with finite moments of order six) is studied in detail in Section 1.3.3 and their link with classical tests of symmetry is discussed.
The assumption of finite sixth-order moments however places a rather severe limitation on the validity of pseudo-Gaussian methods. Less restrictive conditions can be expected from non- parametric methods based on signed ranks. Such methods are investigated in Section 1.4. A signed-rank version of the LAN resuit of Section 1.2.2 is constructed in Section 1.4.1. In Sec
tion 1.4.2, we propose nonparametric signed-rank (hence completely distribution-free) versions of the optimal procedures defined in Section 1.3.1 for specified location 6. The case of unspec
ified 0 is treated in Section 1.4.3, and requires the délicate estimation of a cross-information quantity of the same type as those appearing in in the asymptotic variance of R-estimators.
This estimation problem is discussed extensively in Section 1.4.5, where we develop a simple and original solution. Some spécial cases (van der Waerden, Wilcoxon, and Laplace versions) of the rank-based statistics are described in Section 1.4.4.
Finally, Section 1.5 is devoted to measures of performance: asymptotic relative efficiencies (Section 1.5.1) and simulations (Section 1.5.2) ail indicate the superiority of the signed-rank procedures over the pseudo-Gaussian ones. An appendix (Section 1.6) collects technical proofs.
1.2 A class of locally asymptotically normal families of asym- metric distributions.
1.2.1 Families of asymmetric densities based on Edgeworth approximations.
Dénoté by := (x{"\ ..., n G N an i.i.d. n-tuple of observations. The null hypothèses we are interested in are
(a) the hypothesis of symmetry with respect to specified location 0 G R: under the Xi’s hâve density function x h -> f{x) := ^/i(^^) (ail densities are over the real line, with respect to the Lebesgue measure), for some unspecified a G R q > where fi belongs to the class of symmetric standardized densities
^0