• Aucun résultat trouvé

Tests de type fonction caractéristique en inférence de copules

N/A
N/A
Protected

Academic year: 2021

Partager "Tests de type fonction caractéristique en inférence de copules"

Copied!
158
0
0

Texte intégral

(1)

par

Tarik Bahraoui

Thèse présentée au Département de mathématiques en vue de l'obtention

du grade de Docteur ès science (Ph.D.)

FACULTÉ DES SCIENCES

UNIVERSITÉ DE SHERBROOKE

(2)

Lejury a accepté la thèse de M. Tarik Bahraoui dans saversion nale.

Membres du jury

ProfesseurTaouk Bouezmarni

Directeur de recherche

Département de mathématiques

ProfesseurJean-FrançoisQuessy

Co-directeur de recherche

Départementde mathématiqueset informatique(UQTR)

Professeur PierreLafayede Micheaux

Membre externe

School of Mathematics and Statistics(UNSW)

Professeur MhamedMesoui

Membre interne

Départementde mathématiqueset informatique(UQTR)

Professeur ÉricMarchand

Président-rapporteur

(3)

Au terme de ce travail de thèse, je tiens à exprimer ma profonde gratitude et mes

re-merciements sincères à mon directeur de recherche, Taouk Bouezmarni, professeur au

Départementdemathématiquesàl'UniversitédeSherbrooke,ainsiqu'àmonco-directeur

de recherche, Jean-François Quessy, professeur au Département de mathématiques et

d'informatiquede l'Université de Québec à Trois-Rivières. Je leur suis particulièrement

reconnaissant de tout le temps qu'ils m'ont consacré, de leurs précieux conseils et de la

qualité de leur encadrement durantles quatre dernières années.

Je remercie les membres du jury, Pierre Lafaye de Micheaux, professeur au School of

Mathematics and Statistics (UNSW), Mhamed Mesoui, professeur au Département de

mathématiques et d'informatique de l'UQTR, ainsi que Éric Marchand, pour avoir

ac-cepté de lire et d'évaluer ma thèse. Je tiens aussi à remercier Éric pour avoir, en plus,

accepté d'agir à titre de président-rapporteur. Les commentaires émis par les membres

du jury, très pertinents, ont permis d'améliorer grandement la version nale de cette

thèse. Je veux enn exprimer ma gratitude envers mes amis Mohamed Belalia, Khelifa

Reggas etFélixCamirand-Lemyrepour les belles discussions que nous avons eues.

Mesétudes de doctorat ontété nancées en partie par une bourse individuelledu Fonds

de recherche québécois sur lanatureet lestechnologies(FRQNT)ainsi que par des

sub-ventions de recherche individuelles octroyées à MM. Jean-François Quessy et Taouk

Bouezmarnipar leFRQNT etpar leConseilnationalde recherche en sciences naturelles

et en génie du Canada (CRSNG). Je remercie également l'Institut des sciences

mathé-matiques du Québec (ISM) pour les bourses d'études qu'ilsm'ont accordées.

La viecontinue ...

(4)

Lamodélisationde ladépendancedansdesvecteursaléatoiresàl'aidedecopulesaconnu

un essor fulgurant aucoursdes dernières années. Notamment,des avancéesimportantes

ont été eectuées auniveau de l'estimation de paramètres etde lasélection de modèles.

Alors que les premières contributions se situaient généralement dans un cadre standard

d'observationsi.i.d.,lescopulesontdepuisprouvéleur utilitédans desapplicationstelles

lastatistique spatiale,l'analyse de séries chronologiques etla classication.

Pour expliquerunphénomènedanslequel

d

variablesaléatoiressontenjeu,ons'intéresse souventàconstruireune loimultidimensionnelle. Pourquelechoixnalsoitbien justié

auniveau théorique,onprocède àl'aide de tests statistiquesformels. Unefaçonde faire

consiste à employer un test d'adéquation. De telles procédures ont été proposées par

Genestetal.(2006)etMesouietal.(2009). Cesdeux travauxsontsimilairesausensoù

ils sont basés sur des projections fournies par les fonctionsde dépendance de Kendallet

de Spearman, respectivement. L'article de Genest etal.(2009) est devenu une référence

dans le domaine dans la mesure où il eectue un tour d'horizon assez exhaustif sur les

méthodesquiétaientalorsdisponiblesetqu'ilpropose quelquesnouveauxtests. D'autres

contributions ont été eectuées depuis, par exemple Bahraoui and Quessy (2014), dont

lestests sont basés sur lesC-puisssances quel'on peut associer à une copule.

(5)

forme paramétrique particulière de la copule, mais plutôt à une caractéristique qui est

relativeàsaforme. Parexemple,onpourraitvouloirtesterquelacopuled'unepopulation

multidimensionnelle faitpartie de lafamillegénérale des extrêmes, ou encorequ'elle est

symétrique. Beaucoupd'autres hypothèses de ce typeappartiennent à cette catégorie.

Dans cette thèse, de nouvelles procédures de test pour les copules multidimensionnelles

sontproposées. D'une part, des d'adéquation seront développées, ce qui constituera une

famille de procédures concurrentes aux tests populaires basés sur la copule empirique.

D'autre part, quelques procédures pour tester des hypothèses de forme relatives à

di-verses propriétés de symétrie de copule sont suggérées. Ce qui lie ces contributions est

l'utilisationdelafonctioncaractéristiquedecopule;cettedernièreestsimplementla

fonc-tion caractéristique usuelle, mais calculée à partir de la fonction de dépendance d'une

loimultidimensionnelle. On verra quelesoutils statistiques ainsiproposés mènent à des

testspuissantsetecacesdu pointdevuecomputationnel. Ilssontainsi desalternatives

intéressantes auxméthodologiesbasées sur la copuleempirique.

LeChapitre1estunarticleacceptédansleScandinavianJournalofStatisticsdanslequel

de nouveaux tests d'adéquation pour des famillesparamétriques de copules bivariées et

multidimensionnellessontproposés. Lesstatistiquesdetest utiliséesàcettens'écrivent

comme des distances fonctionnelles de type

L

2

entre des estimateurs non-paramétrique etsemi-paramétriquedelafonctioncaractéristiquedecopule. Leurcomportementlimite

est ensuite établi en montrant, dans un premier lieu, qu'elles sont asymptotiquement

équivalentes à des

V

-statistiques d'ordre quatre, et ensuite en faisant appel àla théorie standard quel'on retrouvepar exemple dans Lee (1990). Lavalidité d'uneprocédure de

bootstrapparamétriquepour l'obtention de p-valeursest égalementformellementétablie.

Enn, la pertinence et l'ecacité de ces tests sont démontrées à l'aide d'une étude de

(6)

contributions'attarde àl'hypothèsenullequ'unecopulepossède lapropriétéde symétrie

radiale. Formellement,ons'intéresseàtesterl'hypothèsenullequesilaloide

pU

1

, . . . , U

d

q

est une certaine copule

C

, alors le vecteur

p1 ´ U

1

, . . . , 1

´ U

d

q

suit également la loi

C

. Cettepropriété est partagée, entre autres,par lescopuleselliptiques,donc en particulier

parlescopulesNormaleetStudent. Lestestsproposéss'appuientsurlefaitquelapartie

imaginaire de la fonction caractéristique associée à la copule est nulle sous l'hypothèse

de symétrie radiale. À l'instar des tests proposés auChapitre 1, lesstatistiquesutilisées

ont un comportement asymptotiqueéquivalent àdes

V

-statistiquesd'ordrequatre. Une contributiondecettearticlequi,d'unecertainemanière,estd'unintérêtindépendant,est

lafaçond'eectuerun ré-échantillonnagejudicieux;en eet, lebootstrapparamétriquene

peutplusêtreemployéicidanslecadred'unehypothèsedeforme. L'étudedesimulations

est assezconvaincantequant àlaqualitédes nouveaux tests,notammentleursupériorité

par rapportaux tests de Genest and Ne²lehová (2014)basés sur lacopule empirique.

Enn,leChapitre3proposedetesterl'hypothèsequ'unecopulebivariée

C

estsymétrique ausensoù

C

pu

1

, u

2

q “ Cpu

2

, u

1

q

pour tout

pu

1

, u

2

q P p0, 1q

2

. Ces testsvisent doncà

con-currencerceuxproposésparGenestetal.(2012)baséssurlacopuleempirique. Lesoutils

pour parvenir à identier les loislimites des statistiqueset àfaire du ré-échantillonnage

sont similairesàceux utilisés auChapitre 2 de la thèse. Ainsi, onmontre que les

statis-tiquesdetestappartenantàunefamilledefonctionnelles

L

2

delafonctioncaractéristique empiriquede copulesontasymptotiquementassimilablesàdes

V

-statistiquesdégénérées. Ensuite, l'identication explicite de la forme de la limite permet de construire des

ver-sions multiplicateurs des statistiques de test pour le calcul de p-valeurs. À l'instar du

Chapitre 2, l'étude de simulations montrent clairement la supériorité de l'approche par

(7)

Remerciements iii

Résumé v

TABLE DES MATIÈRES viii

LISTE DES TABLEAUX xiii

LISTE DES FIGURES xvii

INTRODUCTION 1

CHAPITRE 1  A family of goodness-of-t tests for copulas based on

characteristic functions 9

1.1 Introduction . . . 10

1.2 Explicit expressions for the test statistics . . . 13

1.2.1 Generalformula . . . 13

(8)

1.3 Asymptoticresults . . . 16

1.3.1 Large-sample behaviorof

S

ω

n

under

H

0

. . . 16

1.3.2 Discussion onthe assumptions . . . 18

1.3.3 Validityof a parametricbootstrap. . . 20

1.3.4 Consistency . . . 21

1.4 Samplingproperties of the tests . . . 22

1.4.1 Generalities onthe simulations . . . 22

1.4.2 Size, power, and choice of the smoothing parameter . . . 24

1.4.3 Comparisons withthe test based on

S

C

n

. . . 28

1.5 Illustrationona multivariate data set . . . 29

1.5.1 Some copulamodels suitable for multivariatemodeling . . . 29

1.5.2 Analysisof the Australian Institute of Sport data set . . . 31

CHAPITRE 2  Tests of radial symmetry for multivariatecopulas based on the copula characteristic function 35 2.1 Introduction . . . 36

2.2 Test statistics . . . 39

2.3 Large-samplebehaviorof

R

n,ω

underthe nullhypothesisofradial symmetry 42 2.4 Computationof p-values . . . 43

(9)

2.4.3 Implementation issues . . . 46

2.5 Investigationof the size and power of the tests . . . 47

2.5.1 The bivariate case. . . 47

2.5.2 Comparisons witha test by Genestand Ne²lehová (2014) . . . 50

2.5.3 More on the bivariate Normalweight function . . . 51

2.5.4 Performance of the tests inhigher dimensions . . . 52

CHAPITRE3  Characteristic-function testsof bivariatecopula symme-try 64 3.1 Introduction . . . 65

3.2 New statistics forbivariatecopula symmetry . . . 67

3.2.1 A generalclass of test statistics . . . 67

3.2.2 Large-sample distributionunder the null hypothesis . . . 69

3.3 Performing the tests . . . 71

3.3.1 Multiplierbootstrapversions. . . 71

3.3.2 Formulas for the implementationof the tests . . . 73

3.4 Simulationstudy . . . 74

3.4.1 Generalconsiderations . . . 74

3.4.2 Size of the tests . . . 74

(10)

3.5 Discussion . . . 78

CONCLUSION 86 ANNEXE A  Matériel supplémentaire pour le Chapitre 1 88 A.1 Proof of Lemma1 . . . 88

A.2 Proof of Lemma2 . . . 89

A.3 Proof of Lemma3 . . . 90

A.4 Proof of Proposition1 . . . 91

A.5 Proof of Proposition2 . . . 95

A.6 Proof of Proposition3 . . . 96

A.7 Supporting information: additionaltablesand gures . . . 97

ANNEXE B  Matériel supplémentaire pour le Chapitre 2 105 B.1 Proofs . . . 105 B.1.1 Proof of Lemma 4. . . 105 B.1.2 Proof of Proposition4 . . . 106 B.1.3 Proof of Proposition5 . . . 108 B.1.4 Proof of Proposition6 . . . 110 B.1.5 Proof of Lemma 5. . . 114 B.2 Complementarycomputations . . . 116

(11)

B.2.2 Example 2continued . . . 117

B.2.3 Detailson atest of symmetry by Genest and Ne²lehová (2014) . . 117

ANNEXE C  Matériel supplémentaire pour le Chapitre 3 120 C.1 Proofs of the main results . . . 120

C.1.1 Proof of Lemma 6. . . 120

C.1.2 Proof of Proposition7 . . . 122

C.1.3 Proof of Proposition8 . . . 127

C.1.4 Proof of Lemma 7. . . 130

C.2 Detailsona test by Genestet al.(2012) . . . 131

(12)

1.1 Percentages of rejection, as estimated from 1000 replicates, of the null

hypothesisofaClaytoncopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 150

for the tests based on

S

N

n,N,λ

and

S

DE

n,N,λ

. . . 25

1.2 Percentages of rejection, as estimated from 1000 replicates, of the null

hypothesisofaGumbelcopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 150

for the tests based on

S

N

n,N,λ

and

S

DE

n,N,λ

. . . 26

1.3 Percentages of rejection, as estimated from 1000 replicates, of the null

hypothesisof aNormalcopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 150

for the tests based on

S

N

n,N,λ

and

S

DE

n,N,λ

. . . 27

1.4 Percentages of rejection, as estimated from 1000 replicates, of the tests

basedon

S

N

n,N,4

and

S

C

n,N

when

n

“ 150

forthenull hypothesesof Clayton (C

`

),Gumbel (Gu) and Normal (N)copula familieswhen

N

“ 1000

. . . 29

(13)

basedon

S

N

n,N,4

and

S

C

n,N

when

n

“ 150

forthenull hypothesesof Clayton (C

`

),Gumbel (Gu) and Normal (N)copula familieswhen

N

“ 1000

. . . 30 1.6 P-values(in%) asestimatedfrom

B

“ 1000

parametricbootstrapsamples

forthegoodness-of-ttestsbasedon

S

N

n,N,4

and

S

DE

n,N,4

for

d

“ 5

continuous variables in the Australian Institute of Sport data set; the models under

the nullhypothesis are the Normal (N),Student (

T

ν

)and chi-square (

χ

2

µ

) copulas. . . 34

2.1 Familiesof radiallysymmetric bivariatecopulas . . . 54

2.2 Percentages of rejection, as estimated from 1 000 replicates, for the tests

basedon

R

N

n

,

R

DE

n

,

R

DG

n

and

R

bivN

n

underthebivariateFrank(Fr),Normal (N),Plackett (P

`

) and Student (

T

4

) copulaswhen

n

“ 125

. . . 59 2.3 Percentages of rejection, as estimated from 1 000 replicates, for the tests

basedon

R

N

n

,

R

DE

n

,

R

DG

n

and

R

bivN

n

underthebivariateFrank(Fr),Normal

(N),Plackett (P

`

) and Student (

T

4

) copulaswhen

n

“ 250

. . . 60 2.4 Familiesof radiallyasymmetricbivariate copulas. . . 61

2.5 Percentages of rejection, as estimated from 1 000 replicates, for the tests

basedon

R

N

n

,

R

DE

n

,

R

DG

n

(

σ

“ 1q

,

R

bivN

n

(

σ

“ 5

)and

S

n

underthebivariate Gumbel (Gu), Clayton (C

`

), chi-square (

χ

2

) and skew-

T

4

(ST

4

) copulas; upper panel:

n

“ 125

; middlepanel:

n

“ 250

; bottom panel:

n

“ 500

. . 62 2.6 Percentages of rejection, as estimated from 1 000 replicates, for the tests

basedon

R

N

n

underthe

d

-variateNormal(N),Student(

T

4

),chi-square(

χ

2

)

(14)

bivariate copula symmetry based on the characteristic function statistics

S

N

n,σ

and

S

DE

n,σ

when

σ

P t1, 3, 5u

under the symmetric Clayton, Gumbel, Normal and chi-square copulas. . . 80

3.2 Percentages ofrejection,asestimatedfrom1000replicates,forthe testsof

bivariate copula symmetry based on the characteristic function statistics

S

N

n,σ

and

S

DE

n,σ

when

σ

P t1, 3, 5u

and

n

“ 500

underthesymmetricClayton, Gumbel,Normal and chi-square copulas . . . 81

3.3 Percentages ofrejection, asestimated from1000 replicates, of the tests of

bivariate copula symmetry based on the characteristic function statistics

S

N

n,σ

and

S

DE

n,σ

when

σ

“ 3

and theCramérvonMises statistic

S

CvM

n

un-der the asymmetric KhoudrajiClayton, KhoudrajiGumbel, Khoudraji

Normal and chi-square copulas. . . 82

3.4 Percentages ofrejection, asestimated from1000 replicates, of the tests of

bivariatecopulasymmetrybased ontheCramérvonMises statistic

S

CvM

n

when

`

n

“ k{

?

n

with

k

P t1, 2, 3u

under the asymmetric Khoudraji Clayton, KhoudrajiGumbel,KhoudrajiNormaland chi-square copulas . 83

A.1 Percentages of rejection, as estimated from 1000 replicates, of the null

hypothesisofaClaytoncopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 300

for the tests based on

S

N

n,N,λ

and

S

DE

(15)

hypothesisofaGumbelcopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 300

for the tests based on

S

N

n,N,λ

and

S

DE

n,N,λ

. . . 99

A.3 Percentages of rejection, as estimated from 1000 replicates, of the null

hypothesisof aNormalcopulaunderClayton(C

`

),Gumbel(Gu),Normal (N),Plackett(P

`

),Student(

T

3

)andFrank(Fr)alternativeswhen

n

“ 300

for the tests based on

S

N

n,N,λ

and

S

DE

n,N,λ

. . . 100

A.4 Percentages of rejection, as estimated from 1000 replicates, of the tests

basedon

S

N

n,N,4

and

S

C

n,N

when

n

“ 300

forthenull hypothesesof Clayton (C

`

),Gumbel (Gu) and Normal (N)copula familieswhen

N

“ 500

. . . 101 A.5 Percentages of rejection, as estimated from 1000 replicates, of the tests

basedon

S

N

n,N,4

and

S

C

n,N

when

n

“ 300

forthenull hypothesesof Clayton (C

`

),Gumbel (Gu) and Normal (N)copula familieswhen

N

“ 1000

. . . 102

(16)

1.1 Pair plots of ve variables in the Australian Institute of Sport data set;

upper triangle: originalobservations; lowertriangle: standardizedranks . 33

2.1 Scatterplots of

n

“ 10 000

simulated pairs from the radially asymmetric Gumbel,Clayton, chi-squareandskew-

T

4

bivariatecopulasforthreelevels of dependence . . . 55

2.2 Curvesof

L

C

pt

1

, 10

q

(inblue),

L

C

pt

1

, 20

q

(inblack)and

L

C

pt

1

, 30

q

(inred) as afunction of

t

1

P r´40, 40s

for the radiallyasymmetric Gumbel, Clay-ton, chi-square and skew-

T

4

bivariate copulasfor three levelsof dependence 56

2.3 Power of the tests based on

R

N

n

(line),

R

DE

n

(dashed line),

R

DG

n

(dotted lime) and

R

bivN

n

(dots) as a function of the smoothing parameter

σ

P

r.5, 7s

forthe radiallyasymmetricGumbel,Clayton, chi-squareand

skew-T

4

bivariate copulas for three levelsof dependence; blue curves:

n

“ 125

; blackcurves:

n

“ 250

. . . 57

2.4 Powerofthetestbasedon

R

bivN

n

asafunctionof

ρ

P p´1, 1q

fortheradially asymmetricGumbel,Clayton,chi-squareandskew-

T

4

bivariatecopulasfor three levelsof dependence; blue curve:

n

“ 125

;black curve:

n

“ 250

. . 58

(17)

3.1 Scatterplotsof

n

“ 5000

simulatedpairsfromtheasymmetricKhoudraji Clayton, KhoudrajiGumbel,KhoudrajiNormaland chi-square copulas . 84

3.2 Probabilitiesofrejection,asestimatedfrom1000 replicates,ofthe testsof

bivariate copula symmetry based on the characteristic function statistics

S

N

n,σ

(line) and

S

DE

n,σ

(dashed line) as a function of

σ

P t.5, 1, . . . , 5u

, when

n

“ 100

for the twelve asymmetriccopulamodels ofFigure 3.1 . . . 85

A.1 Realpart(left)andimaginarypart(right)of

ψ

C

ptq

forthebivariate Clay-ton (top panels), Gumbel (middle panels) and Normal (bottom panels)

copulaswhen

τ

pCq “ .6

. . . 103 A.2 Realpart(left)andimaginarypart(right)of

ψ

C

ptq

forthebivariate

Plack-ett (top panels), Student with

ν

“ 3

degrees of freedom (middle panels) and Frank(bottom panels) copulaswhen

τ

pCq “ .6

. . . 104

(18)

1. Copules

Lamodélisationde ladépendanceestun sujetderecherchequiaattiréetquicontinuede

susciter lacuriosité de plusieurs chercheurs, et ce dans diérents domaines. En eet, on

sedemandesouventlaquestionsideuxouplusieursvariablesaléatoiresontde l'inuence

lesunes sur lesautres. Danslescas oùil y ades liens signicatifsentre ces variables,on

cherche àmesurer etàidentiercette dépendance etsurtout,àdéterminersaforme. Par

exemple,onpourraitsedemandersicettedépendanceestforteoufaible,sielleatendance

àêtre plus marquéepourde grandesvaleursdes variables en questions,etainsi de suite.

À titre d'exemple, les analystes nanciers étudient souvent la relation entre le prix de

certainsindicesetletauxde change,alorsqu'enhydrologie,ons'intéresseparfoisàl'eet

de la température sur les niveaux de précipitations. Une façon populairede mesurer la

forcede ladépendance entre des variablesconsisteà considérerdes paramètres réels tels

le coecient de corrélation, le coecient de corrélation de rangs, ou encore le tau de

Kendall. Ceux-ci sont facilement interprétables. Cependant, ils ne fournissent qu'une

informationfragmentairesur ladépendance, car ilsne renseigne pas sur sa forme.

Durant lesquelque trentedernières années, lescopules sesontimposéescomme un outil

très pratique et, par le fait même très populaire, pour étudier la dépendance entre des

(19)

cette dépendance. Le point de départ de cette théorie est un célèbre théorème dû à

Sklar (1959), qui indique que toute fonction de répartition multidimensionnelle peut

être décomposée selon ses distributions marginales et une fonction appelée copule qui

contienttoute l'informationsur la dépendance. Formellement,supposons un vecteur de

variablesaléatoires

X

“ pX

1

, . . . , X

d

q

dontlaloiconjointes'écrit

F

px

1

, . . . , x

d

q “ PpX

1

ď

x

1

, . . . , X

d

ď x

d

q

pour tout

px

1

, . . . , x

d

q P R

d

. Alors un résultat maintenant reconnu

comme très important en statistique mathématique indique qu'il existe une fonction

C :

r0, 1s

d

Ñ r0, 1s

appellée copule telle que

F

px

1

, . . . , x

d

q “ C tPpX

1

ď x

1

q, . . . , PpX

d

ď x

d

qu .

(1)

Quandlesvariables

X

1

, . . . , X

d

sontcontinues,ce quiest souventlecas enpratique,alors

C

est unique. Ainsi, l'écriture à l'équation(1) met en relief le faitque le comportement aléatoirede

X

estconstitué, d'unepart,des comportementsmarginauxde

X

1

, . . . , X

d

,et d'autrepartdesliensd'interdépendanceentrelesdiérentescomposantesde

X

,expliqués par

C

. Autrement dit,

C

contient toute la dépendance, sans égard aux comportements stochastiques marginaux. On peut dégager deux grands avantages quant à l'utilisation

des copules en analyse multidimensionnelle:

(i) La possibilité de construire des modèles multivariés de façon exible, car on peut

choisir une structure de dépendance

C

et des marges désirées

F

1

, . . . , F

d

de telle sorte que

F

px

1

, . . . , x

d

q “ CtF

1

px

1

q, . . . , F

d

px

d

qu

. On peut ainsi s'aranchir des modèles usuels commela loiNormale, laloi de Student, etc.

(ii) La possibilité de mesurer le niveau dépendance en se concentrant uniquement sur

la copule

C

d'un vecteur aléatoire, indépendamment de ses marges. Par exemple, les versions théoriques du tau de Kendall et du coecient de corrélation de rangs

(20)

Pour l'estimer, on peut adopter une approche semi-paramétrique ou non-paramétrique.

Cettedernièreméthodenerequiertpasdemodèleprédéterminé,maisquesaperformance

diminueenfonctiondunombrede variablesàétudier. Enrevanche,lapremièreapproche

suppose au préalable une certaine famille de copules paramétriques, et donc une étape

crucialeconsisteàvaliderformellementcechoixdemodèle. Danscettethèse,denouveaux

outils méthodologiquespour lechoix d'unmodèle adéquatde copules seront développés.

Plus spéciquement, onproposera denouvelles approchespourtester l'adéquationd'une

copule,lasymétrieradiale,ainsiquelasymétriediagonale. Lesméthodesproposéessont

novatrices dans la mesureoù elles sebasentsur lafonction caractéristiquede copule.

2. Fonctions caractéristiques et V-statistiques

Lesméthodologiesdéveloppées danscette thèse reposent principalementsur l'utilisation

d'une fonction caractéristique basée sur les rangs des observations. Dans ce cadre, on

constateraquelanotiondeV-statistiquesapparaîtdemanièrenaturelle. Ilconvientdonc

d'orir un bref rappelsur les fonctions caractéristiquesainsi que sur les V-statistiques.

De façon générale, les fonctions caractéristiques jouent un rôle fondamental en théorie

desprobabilités. Enpratique,cesfonctionspeuventêtreestiméesparlesfonctions

carac-téristiques empiriques, voir par exemple Parzen (1962). Leurs propriétés asymptotiques

ont été étudiées, entre autres, par Feuerverger and Mureika (1977)et Csörg® (1981);on

peut également consulter les ouvrages de Lukacs (1970) et Ushakov (1999). F

ormelle-ment,la fonction caractéristique d'un vecteur aléatoire

X

“ pX

1

, . . . , X

d

q

de loi

P

est la fonction àvaleurscomplexes dénie pour tout

t

P R

d

par

φ

X

ptq “ E

`

e

i t X

˘

ż

R

d

e

i t X

dP

pxq.

(21)

φ

n

ptq “

1

n

n

ÿ

j“1

e

i t X

j

.

Un grand nombre de méthodes d'inférence basées sur la fonction caractéristiques ont

été proposées. Par exemple, Baringhaus and Henze (1988) l'ont utilisée pour tester la

normalitémultidimensionnelle. Danscettelignée,destestsd'adéquationapplicablesdans

un cadre plus général ont été proposés, par exemple, par Koutrouvelis and Kellermeier

(1981),Jiménez-Gameroetal.(2009)etMeintanisetal.(2015). Destestsd'indépendance

multidimensionnelle basés sur la fonction caractéristique ont été étudiés, entre autres,

par Bakirov et al. (2006) et plus récemment par Fan et al. (2017). On retrouve aussi

de tels tests dans les travaux de Bilodeau and Lafaye de Micheaux (2005) et Meintanis

and Iliopoulos (2008). Enn, des tests de symétrie ont été considérés, entre autres, par

Neuhaus and Zhu(1998), Henze et al.(2003) etHenze et al.(2014).

Soit maintenant

h

px

1

, . . . , x

k

q

, une fonction measurable et symétrique selon toutes ses composantes, où

x

1

, . . . , x

k

P R

d

. Si

X

1

, . . . , X

n

est un échantillon de données dans

R

d

,

alors la V-statistiqued'ordre

k

basée sur le noyau

h

est dénie par

V

n

phq “

1

n

k

n

ÿ

i

1

,...,i

k

“1

h

pX

i

1

, . . . , X

i

k

q .

En fait,cette V-statistique est intimement liéeàla U-statistiquede noyau

h

, à savoir

U

n

phq “

ˆ

n

k

˙

´1

ÿ

1

ďi

1

㨨¨ăi

k

ďn

h

pX

i

1

, . . . , X

i

k

q .

Lorsque laprojection de

h

dénie par

H

pxq “ Ethpx, X

2

, . . . , X

d

qu

est non-dégénéréeau sensoù

Var

tHpXqu P p0, 8q

,alors

?

n

pU

n

´EU

n

q

et

?

n

pV

n

´EV

n

q

sontasymptotiquement normales. Autrement, dans le cas où

H

est dégénérée, les comportements limites sont plutôt caractérisés par une somme pondérée de variables aléatoiresde loi khi-deux. Ce

(22)

les monographiesde Lee (1990) et Koroljukand Borovskich(1994). On peut citer aussi

lesrécentes avancées de Yoshihara(2014), Leucht (2012) et Dehling etal.(2017).

3. Tests d'adéquation pour les copules

Soit

F

“ tC

θ

, θ

P Θ Ď R

p

u

une familleparamétrique de copules. Sur la base d'un échan-tillon

X

1

, . . . , X

n

provenant d'une certaine population

d

-dimensionnelle, on s'intéresse à savoir si leur stucture de dépendance, c'est-à-dire leur copule commune

C

, appartient ou non à

F

. Autrement dit, on souhaite confronter les hypothèses nulle et alternative

H

0

: C

P F

et

H

1

: C

R F

. Pour ce faire, onemploie généralement un test d'adéquation. Un certainnombre de procédures de ce typeont été proposées dans la littérature.

Lepremierpas danscette directiona étéeectué parGenest andRivest (1993). Ceux-ci

se sont basés sur la transformationintégralede probabilité que l'on peut associer à une

copule

C

, à savoir

K

C

ptq “ PtCpUq ď tu

, où

U

„ C

. Cette procédure a été formalisée plus tard par Wang and Wells(2000) et Genest etal. (2006); ces derniers ont obtenu le

comportement asymptotique de statistiques de tests d'adéquation et mis au point une

méthode de ré-échantillonnage, à savoir le bootstrap paramétrique, qui contrairement

à la méthode proposée par Wang and Wells (2000), est valide. Une autre contribution

notable est celle de Genest et al. (2009), dont plusieurs des tests décrits sont basés sur

lacopule empirique,à savoir,

C

n

puq “

1

n

n

ÿ

j“1

I

ˆ

R

j1

n

` 1

, . . . ,

R

jd

n

` 1

˙

,

R

jk

est lerangdel'observations

X

jk

parmil'échantillon

X

1

k

, . . . , X

nk

. Des procédures d'adéquation ont été proposées par Fermanian (2005), Dobri¢ and Schmid (2005), Berg

(2009), Mesouiet al.(2009) etKojadinovic and Yan(2012).

(23)

basées sur la copule empirique. En eet, les tests proposés adopterons une approche

de type fonction caractéristique, à l'opposé de la façonusuelle basée sur ladistribution,

c'est-à-dire la copule. Cette façon de faire est originale, dans la mesure où elle n'a pas,

outrès peu, été abordéedans un contexte de modélisationpar copules.

Formellement, on dénit la familleparamétrique de fonctions caractéristiques associées

à

F

“ tC

θ

, θ

P Θ Ă R

p

u

, à savoir

Ψ

“ tψ

θ

: θ

P O Ă R

p

u

, où

ψ

θ

est la fonction carac-téristique de

C

θ

. En raison de la bijection qui existe entre une fonction caractéristique et une fonction de répartition (fdr), et parce qu'une copule est en fait une fdr, on peut

reformuler les hypothèses nulle et alternative par

H

0

: ψ

C

P Ψ

et

H

1

: ψ

C

R Ψ

, où

ψ

C

est la fonction caractéristique de copule associée à la copule

C

de la population. Pour testerces hypothèses, ondénitd'abordun estimateur non-paramétrique

ψ

n

de

C

,quià l'instardelacopuleempiriqueest basésur lesrangs desobservations. Ensuite,ondénit

une classe générale de statistiquesde laforme

S

n

ω

“ n

ż

R

d

n

ptq ´ ψ

θ

n

ptq|

2

ω

ptq dt,

ω : R

d

Ñ R

`

est une certaine fonction de poids.

Le Chapitre 1 est un article consacré au traitement complet de cette famille de

statis-tiques d'adéquation. Dans un premier temps, des formules explicites et utiles pour

S

ω

n

sont obtenues. Ensuite, il est démontré que

S

ω

n

se comporte asymptotiquement comme une V-statistique dégénérée dont le noyau possède quatre composantes; ceci permet de

déduire qu'à la limite, les statistiques de test proposées se représentent par une somme

pondérée de variables khi-deux. En outre, on démontre la validité d'une méthode de

(24)

Dans une optique de modélisation par copules, on s'intéresse parfois à tester des

hy-pothèses dites de forme. Vérier formellement de telles hypothèses avant des étapes de

modélisationplus ranées peut être très utile. Ainsi,sion arriveà exclure certainstype

de structures de dépendance, on peut plus facilement cibler de bons modèles potentiels.

Dansd'autressituations,l'objectifest simplementde mieuxsaisircertainescaractériques

inhérentesàunjeudedonnées. AuxChapitres2et3,onseconcentresurdeuxhypothèses

de forme, àsavoir

(i) lasymétrie radiale multidimensionnelle;

(ii) lasymétrie diagonale, habituellement appelée simplement lasymétrie de copule.

Lasymétrieradialed'unecopuleest intimementliéeàlanotiondesymétried'unvecteur

aléatoire. D'abord, on rappelle qu'un vecteur

X

“ pX

1

, . . . , X

d

q

est symétrique autour d'unpoint

µ

P R

d

silaloide

X

´µ

estlamêmequecellede

µ

´X

. Delà,onpeutmontrer que

X

est symétrique si et seulement les

d

lois marginales sont symétriques autour de

µ

1

, . . . , µ

d

etquelacopulepossèdelapropriétéde symétrieradiale. Cettedernièrenotion veutdire que

C

est tellequesi

U

„ C

,alors

1

´ U „ C

. Danslecasbivarié,celarevient à

C

pu

1

, u

2

q “ u

1

` u

2

´ 1 ` Cp1 ´ u

1

, 1

´ u

2

q

pour tout

pu

1

, u

2

q P p0, 1q

2

.

Au Chapitre 2, on développpe des tests pour vérier si la copule

C

d'une population possède la propriété de symétrie radiale. Les statistiques de tests comparent les

fonc-tionscaractériquesempiriquesassociées respectivementàlacopuleetàsaversionsurvie.

Tout comme auChapitre 1, lesstatistiques secomportement asymptotiquementcomme

des sommes de khi-deux pondérées. Par contre, une distinction importante est à

sig-naler: comme le modèle de copules n'est pas spécié sous l'hypothèse nulle, lebootstrap

(25)

de

P

-valeurs sur une adaptation de la méthode de ré-échantillonnage du multiplicateur, dontlavaliditéest démontrée. Enn, lessimulationsquisont rapportées sontassez

con-vaincantesquantàl'ecacitédesnouveaux tests,notammentconcernantleursupériorité

face àdes procédures récemment proposées par Genest and Ne²lehová(2014).

Le troisième chapitre de la thèse est un peu semblable au Chapitre 2 au sens où il

s'intéresseégalementàunecaractéristiquedesymétried'unecopule. D'abord,onrappelle

qu'unepaire

pX

1

, X

2

q

estéchangeablesisaloiestlamêmequecellede

pX

2

, X

1

q

. Àl'instar de lasymétrieusuelle,l'échangeabilitéfaitapparaîtreune notiondesymétrie concernant

la copule

C

de

pX

1

, X

2

q

. En eet, dire que

pX

1

, X

2

q

est échangeable est équivalente à l'égalité en loi de

X

1

et

X

2

, et à

C

pu

1

, u

2

q “ Cpu

2

, u

1

q

. Le Chapitre 3 développe donc des tests pour vérier qu'une copule

C

possède cette dernière propriété. Pour ce faire, on emprunte un chemin semblable à celui du Chapitre 2 en ce sens que les statistiques

sont basées sur la fonction caractéristiqueempirique etque le calcul de

P

-valeurs utilise laméthode du multiplicateur. Les tests proposés sont des concurrents àceux de Genest

et al.(2012) fondés sur la copuleempirique.

Avant de conclure, quelques remarques s'imposent concernant l'utilisationde la

métho-de du multiplicateur dans un contexte de fonctions caractéristiques de copules. À nos

yeux, cet apport de la thèse est d'un intérêt indépendant, car il montre comment on

peut faire du ré-échantillonnage en présence de V-statistiques calculées sur les rangs

des observations. En outre, contrairement aux méthodes très populaires basées sur la

copuleempirique,notreapprochenenécessitepasl'estimationdesdérivéespartiellesdela

copules. Cet aspectmérited'être souligné,car cetteestimation estvalidéesous certaines

hypothèses et qu'en plus, ellenécessite le choix pas toujours évident d'un paramètre de

(26)

A family of goodness-of-t tests for

copulas based on characteristic

functions

T. Bahraoui, T. Bouezmarni &J.-F. Quessy (2017)

ScandinavianJournal of Statistics, sous presse

Résumé: Une classe générale de statistiques de rangs basées sur la fonction

caractéris-tique est introduite an de tester l'hypothèse composite d'appartenance à une famille

de copules multidimensionnelles. Ces statistiques d'adéquation sont dénies comme des

distances fonctionnelles de type

L

2

pondérées entre une version nonparamétrique et une version semi-paramétrique de la fonction caractéristique que l'on peut associer à une

copule. Il est démontré que ces statistiques de test se comportent asymptotiquement

commedes

V

-statistiquesdégénérées d'ordrequatre etque leurslois limitess'expriment en termes de sommes pondérées de variables khi-deux indépendantes. La convergence

(27)

sous des taillesd'échantillonsfaiblesetmodéréesest étudié àl'aidede simulationsetest

comparé àceluid'un testconcurrentfondé sur lacopuleempirique. Laméthodologieest

nalementillustrée sur un jeu de données à cinqdimensions.

Abstract: A general class of rank statistics based on the characteristic function is

in-troducedfortestinggoodness-of-thypothesesaboutthe copulaofacontinuous random

vector. These statisticsare dened as

L

2

weighted functionaldistances between a non-parametricestimatorandasemi-parametricestimatorofthecharacteristicfunction

asso-ciatedto acopula. It isshown that these statisticsbehave asymptoticallyasdegenerate

V

-statisticsoforderfourandthatthelimitdistributionshaverepresentationsintermsof weighted sums of independent chi-square variables. The consistency of the tests against

general alternatives is established and an asymptotically valid parametric bootstrap is

suggestedforthe computationofthecriticalvaluesof thetests. Thebehaviorofthe new

tests insmalland moderatesamplesizes isinvestigated withthe helpof simulationsand

compared to a competing test based on the empirical copula. Finally, the methodology

is illustrated ona ve-dimensionaldata set.

1.1 Introduction

Let

X

“ pX

1

, . . . , X

d

q

be a

d

-variate random vector with joint distribution function

F

pxq “ PpX ď xq

, where

x

“ px

1

, . . . , x

d

q P R

d

. If the marginal distributions

F

j

pxq “

P

pX

j

ď xq

,

j

P t1, . . . , du

,are continuous, thenSklar's Theoremensures thatthereexists auniquecopula

C :

r0, 1s

d

Ñ r0, 1s

suchthatforall

x

P R

d

,

F

pxq “ CtF

1

px

1

q, . . . , F

d

px

d

qu

. In fact,

C

corresponds to the joint distribution of

U

“ pU

1

, . . . , U

d

q

, where for all

`

P t1, . . . , du

,

U

`

“ F

`

pX

`

q

. Therefore,

C

is a distribution function on

r0, 1s

d

with

(28)

An important step in copula modeling based on i.i.d. copies

X

1

, . . . , X

n

of

X

is the selection of an appropriate copula that ts the dependence structure properly. Usually,

one assumes a parametric family

tC

θ

: θ

P O Ă R

p

u

, where

θ

“ pθ

1

, . . . , θ

p

q

J

is a vector

of unknown parameters. A goodness-of-t test is a thorough statistical procedure for

choosing between the composite null hypothesis

H

0

: C

P tC

θ

: θ

P O Ă R

p

u

and its alternative

H

1

: C

R tC

θ

: θ

P O Ă R

p

u

. Many strategies have been proposed for

that purpose. For example, Genest et al. (2006) based their test on the probability

integral transformation

K

θ

ptq “ PtC

θ

pUq ď tu

, where

U

„ C

θ

. A similar approach using the Spearman dependence function

S

θ

ptq “ PpU

1

ˆ ¨ ¨ ¨ ˆ U

d

ď tq

was proposed by Mesoui et al. (2009). Tests based on kernel estimation of copula densities were

consideredbyFermanian(2005),Scaillet(2007)andOmelkaetal.(2009). Intheirreview

and simulation study of many goodness-of-t tests for copulas, Genest etal. (2009) put

a particular attention to omnibusprocedures based on the empiricalcopula

C

n

pu

1

, . . . , u

d

q “

1

n

n

ÿ

j“1

d

ź

`“1

I

´

U

p

j`

ď u

`

¯

,

where for each

j

P t1, . . . , nu

,

U

p

j

“ p p

U

j1

, . . . , p

U

jd

q

is the vector of pseudo-observations such that for

`

P t1, . . . , du

,

U

p

j`

“ F

n`

pX

j`

q

in terms of the univariate empirical dis-tribution function

F

n`

of the

`

-th variable. Test statistics based on functionals of

C

n

are therefore distribution-oriented in the sense that they focus on an estimation of the

distribution function

C

. A particular case is the CramérvonMises statistic

S

n

C

“ n

ż

r0,1s

d

tC

n

puq ´ C

θ

n

puqu

2

du,

where

θ

n

“ pθ

n1

, . . . , θ

np

q

J

is a consistent estimator of

θ

. When

θ

is real-valued,

θ

n

can be based on the inversion of an association measure like Kendall's tau or Spearman's

rho, while a semi-parametric maximum-likelihood may be used in the general case of a

(29)

Insteadoftakinganapproachbasedon

C

,onecouldalternativelyworkwithitsassociated characteristic function. In standard univariate and multivariate modeling, this avenue

has been used extensively; see, for instance, the early contributions by Feuerverger and

Mureika(1977)and Eppsand Pulley(1983),andmore recently thoseofFan(1994), Fan

(1997) and Jiménez-Gamero et al. (2009). However, this approach has been ignored in

the case of copula modeling, except maybe by Quessy (2016), where tests for bivariate

and multivariate symmetry hypotheses, as well as various types of equality of copulas

are considered. As waspointed out inthis work,tests basedonthe copulacharacteristic

function are generally more powerful than those based onthe copula.

Thispaperinvestigatesageneralclassofgoodness-of-ttestsbasedonthecopula

charac-teristic function for the choice of anappropriate dependence structure. Letting

i

2

“ ´1

and dening

xt, uy “ t

1

u

1

` ¨ ¨ ¨ ` t

d

u

d

astheusual innerproductbetween

t

“ pt

1

, . . . , t

d

q

and

u

“ pu

1

, . . . , u

d

q

, the copula characteristic functionis dened by

ψ

C

ptq “ E texp pixt, Uyqu “

ż

r0,1s

d

exp

pixt, uyq dCpuq.

Because

ψ

C

characterizes the distribution of

U

, the null and alternative goodness-of-t hypothesescan beequivalently reformulatedas

H

0

: ψ

C

P tψ

θ

: θ

P O Ă R

p

u

and

H

1

: ψ

C

R tψ

θ

: θ

P O Ă R

p

u ,

(1.1)

where

ψ

θ

is the characteristic function of

C

θ

. An empiricalversion of

ψ

C

is

ψ

n

ptq “

ż

r0,1s

d

exp

pixt, uyq dC

n

puq “

1

n

n

ÿ

j“1

exp

´

i

xt, p

U

j

y

¯

.

A natural testing procedure would consist in rejecting the null hypothesis

H

0

for large valuesofsomedistancebetween thecomplex-valuedempiricalfunctions

ψ

n

and

ψ

θ

n

. This work focuses onstatisticsof the generalform

S

n

ω

“ n

ż

R

d

n

ptq ´ ψ

θ

n

ptq|

2

ω

ptq dt,

(1.2)

(30)

where

ω : R

d

Ñ R

`

is an integrable weight function and

| ¨ |

denotes the modulus of a complex number. The test statistics in (1.2) are common for those familiar with

char-acteristic function based procedures. However, their investigation here is non-standard

since

S

ω

n

is based onthe ranks instead of the observations themselves. Sincethe focus is put on

L

2

-functionals of the empirical process

Z

n

ptq “

?

n

n

ptq ´ ψ

θ

n

ptqq

,

t

P R

d

, one

can avoid the non-trivial investigation of the asymptotic behavior of

Z

n

in a complex-valued space of functions. Indeed, the asymptotic behavior of

S

ω

n

as well as that of parametricbootstrapversionswillbeestablishedusingtoolsinthe theoryof

V

-statistics adapted to rankstatistics.

The remainingofthe articleisorganized asfollows. In Section2,explicitexpressions for

the test statisticsthat are convenient fortheir computer implementationare derived. In

Section 3, the asymptotic behavior of

S

ω

n

under

H

0

is obtained; the consistency of the test based on

S

ω

n

under general alternatives and the validity of a parametric bootstrap procedureare established aswell. Section4investigatesthe size and powerof the newly

introduced tests and compare their performance to the test based on

S

C

n

. In Section 5, the procedure is illustrated ona multivariate data set, where the t to the multivariate

Normal, Student and chi-square copulafamiliesis considered.

1.2 Explicit expressions for the test statistics

1.2.1 General formula

Consider

X

1

, . . . , X

n

i.i.d. from some

d

-dimensionaldistribution function

F

whose mar-ginal distributions

F

1

, . . . , F

d

are continuous and whose unique copula is

C

. The goalis toformallytestthat

C

belongstoagivenparametricfamilyofcopulas. Theteststatistic

(31)

p

U

1

, . . . , p

U

n

dened in the Introduction; this is the subject of the next lemma. Before stating it,dene for

a

“ pa

1

, . . . , a

d

q P R

d

the function

β

ω

paq “

ż

R

d

cos

pxt, ayq ωptq dt.

Lemma 1 For

U

„ C

θ

n

and

U

„ C

θ

n

independent, one has

S

n

ω

1

n

n

ÿ

j,j

1

“1

β

ω

´

p

U

j

´ p

U

j

1

¯

` n E

U

,U

ω

pU

´ Uqu ´ 2

n

ÿ

j“1

E

U

!

β

ω

´

p

U

j

´ U

¯)

.

1.2.2 Product weight functions

In the literature about characteristicfunction tests, popularchoicesfor

ω

are those that can be expressed as a product of univariate densities. As will be shown in Lemma 2,

easily computable formulas arise in that case. Specically, let

g

be a univariate density that is symmetric around zero and let

λ

ą 0

be a scale parameter. Then, dene the product weightfunction

ω

λ

ptq “

d

ź

`“1

"

g

ˆ

t

`

λ

˙*

2

.

(1.3)

In view of Lemma 1, the computation of the statistic

S

ω

λ

n

associated to

ω

λ

necessitates evaluating

β

ω

λ

, for which a simpleformulaisprovided next.

Lemma 2 If

ω

“ ω

λ

isa product weight function basedon a symmetric density

g

and a scale parameter

λ

ą 0

, then

β

ω

λ

paq “

d

ź

`“1

r

β

λ

g

pa

`

q,

where for

a

P R

,

β

r

g

λ

paq “

ş

R

cos

ptaqtgpt{λqu

2

dt

.

(32)

When

g

isthe standardnormal(N)and double-exponential(DE)density,anapplication of Lemma 2yields

r

β

λ

N

paq “

λ

2

?

π

exp

ˆ

´

λ

2

a

2

4

˙

and

β

r

DE

λ

paq “

λ

4

` λ

2

a

2

.

(1.4)

1.2.3 Link with copula density estimators

A relationship can be derived between the test statistic

S

ω

n

and a Cramérvon Mises statistic based on copula density estimators. To see this, consider a kernel

K

: R

d

Ñ R

thatissymmetricaroundzeroandsquareintegrable. Following,forinstance,Gijbelsand

Mielniczuk (1990),a kernel estimatorof the copula density is given by

pc

K

n

puq “

1

n

n

ÿ

j“1

1

|H|

K

"

H

´1

´

u

´ p

U

j

¯

J

*

,

(1.5) where

H

P R

dˆd

is a xed and non-singular symmetric matrix of smoothing parameters

and

|H|

isitsdeterminant. Nowassumethat

K

admitsaFouriertransformthatvanishes ona set of nullLebesgue measure, namely

G

ptq “

1

p2πq

d{2

ż

R

d

exp

pixt, zyq Kpzq dz.

(1.6)

The next lemma shows that the test statistic

S

r

ω

n

,with

ω

r

ptq “ tGpHtqu

2

, can bewritten

as aCramérvon Mises statistic based oncopuladensity estimators.

Lemma 3 The test statistic

S

r

ω

n

with weight function

ω

r

ptq “ tGpHtqu

2

, where

G

is dened in Equation (1.6),can be written as

S

n

ω

r

“ n

ż

r0,1s

d

pc

K

n

puq ´ c

K

θ

n

puq

(

2

du,

where

c

K

θ

n

isthe convolution of the density

c

θ

n

of

C

θ

n

with respect to

K

, i.e.

c

K

θ

n

puq “

1

|H|

ż

r0,1s

d

K

H

´1

pu ´ vq

J

(

c

θ

n

pvq dv.

(33)

density estimatorsisasubsetofthenewly introducedfamilyof rank-basedcharacteristic

function statistics

S

ω

n

. Note that if

g

is a univariate density that can be written as the Laplacetransformof somesymmetricfunction

κ

,thenfromasimplecalculation,one has for

K

pzq “

ś

d

`“1

κ

pz

`

{λq

that

ω

λ

ptq “

d

ź

`“1

"

g

ˆ

t

`

λ

˙*

2

1

p2πq

d

R

d

exp

pixt, zyq Kpzq dz

*

2

.

It is the case, inparticular, when

g

is the standard Normal distribution.

1.3 Asymptotic results

Again,let

X

1

, . . . , X

n

bei.i.d. froma

d

-dimensionaldistributionfunction

F

with contin-uousmarginaldistributions

F

1

, . . . , F

d

andcopula

C

. InSubsection1.3.1,the asymptotic behavior of

S

ω

n

is characterized. The assumptions leading tothis large-sample result are

discussed in Subsection 1.3.2. In Subsection 1.3.3, the validity of a parametric

boot-strap method is derived, while the consistency of the test based on

S

ω

n

under general alternatives isestablished in Subsection 1.3.4.

1.3.1 Large-sample behavior of

S

ω

n

under

H

0

The following two propositions concern the asymptotic behavior of

S

ω

n

under the null

hypothesis that

C

belongs to the parametric family

tC

θ

; θ

P O Ă R

p

u

of copulas. The

arguments leading to these results are in some sense similar to those of de Wet and

Randles(1987)and Jiménez-Gameroetal.(2003),except thathere, thetest statistic

S

ω

n

is computed from the ranks of the observations, which adds anotherlevelof complexity

(34)

In the sequel,

θ

0

P O

is the true value of the parameter under

H

0

and for each

j

P

t1, . . . , nu

,

U

j

“ pF

1

pX

j1

q, . . . , F

d

pX

jd

qq

. In addition,

ψ

θ

is the gradient of

ψ

θ

, i.e.

p∇ψ

θ

ptqq

`

“ B ψ

θ

ptq{Bθ

`

, and

D

R

θ

“ pD

R

θ,1

, . . . , D

R

θ,p

q

,

D

I

θ

“ pD

I

θ,1

, . . . , D

I

θ,p

q

are the real and imaginaryparts of

ψ

θ

, respectively. Now consider the followingassumptions:

A

1

. There exists a score function

J

θ

0

“ pJ

θ

0

,1

, . . . , J

θ

0

,p

q

J

such that for

U

„ C

θ

0

, one has for each

`

P t1, . . . , pu

that

E

tJ

θ

0

,`

pUqu “ 0

,

Var

tJ

θ

0

,`

pUqu ă 8

,

p∇J

θ

0

q

`

BJ

θ

0

,`

{Bu

`

exists and is continuous on

p0, 1q

d

and

E

t}p∇J

θ

0

qpUq}

2

u ă 8

, and such that

Θ

n

?

n

n

´ θ

0

q “

1

?

n

#

n

ÿ

j“1

J

θ

0

pU

j

q `

´

p

U

j

´ U

j

¯

J

θ

0

pU

j

q

+

` o

P

p1q.

A

2

.

D

R

θ

and

D

I

θ

are such that

ż

R

d

´›

›D

R

θ

0

ptq

2

`

›D

I

θ

0

ptq

2

¯

ω

ptq dt ă 8.

Inaddition,forany



ą 0

,onecanndaneighborhood

N

of

θ

0

andfunctions

γ

R

,

γ

I

satisfying

ş

R

d

R

ptqu

2

ω

ptq dt ă 

,

ş

R

d

I

ptqu

2

ω

ptq dt ă 

such that for any

θ

P N

,

›D

R

θ

ptq ´ D

R

θ

0

ptq

› ď γ

R

ptq

and

›D

I

θ

ptq ´ D

I

θ

0

ptq

› ď γ

I

ptq.

A

3

. The weightfunction

ω

issuch that

tt P R

d

: ω

ptq “ 0u

has Lebesgue measure zero,

ż

R

d

ω

ptq dt ă 8

and

ż

R

d

pxt, tyq

2

ω

ptq dt ă 8.

The next resultstatesthat

S

ω

n

isasymptoticallyequivalenttoa

V

-statisticoforderfour. Before stating it, dene for each

pu

1

, u

2

, t

q P r0, 1s

2

d

ˆ R

d

the function

Υ

θ

0

pu

1

, u

2

, t

q “

r

Υ

θ

0

pu

1

, u

2

, t

q ` r

Υ

θ

0

pu

2

, u

1

, t

q

, where for

I

pu

2

ď u

1

q “ pIpu

21

ď u

11

q, . . . , Ipu

2

d

ď u

1

d

qq

,

r

Υ

θ

0

pu

1

, u

2

, t

q “ exppixt, u

1

yq ´ ψ

θ

0

ptq ` i exppixt, u

1

yq xt, Ipu

2

ď u

1

q ´ u

1

y

(35)

Proposition 1 If Assumptions

A

1



A

3

hold, then

S

ω

n

“ V

n

ω

` o

P

p1q

, where

V

n

ω

1

n

3

n

ÿ

j,j

1

,k,k

1

“1

Φ

θ

0

pU

j

, U

j

1

, U

k

, U

k

1

q

is a V-statistic with symmetric kernel of degree four given by

Φ

θ

0

pu

1

, u

2

, u

3

, u

4

q “

1

12

ż

R

d

Υ

θ

0

pu

1

, u

2

, t

q Υ

θ

0

pu

3

, u

4

,

´tq ωptq dt

`

12

1

ż

R

d

Υ

θ

0

pu

1

, u

3

, t

q Υ

θ

0

pu

2

, u

4

,

´tq ωptq dt

`

12

1

ż

R

d

Υ

θ

0

pu

1

, u

4

, t

q Υ

θ

0

pu

2

, u

3

,

´tq ωptq dt.

(1.7)

One can now invoke classical arguments on

V

-statistics that one can nd in Sering (1980) and Lee (1990) inorder toobtain anexplicit expression forthe limitof

S

ω

n

. This is the subject of the next proposition. Before stating it, let

U

„ C

θ

0

and dene, for

γ

θ

0

pu, tq “ EtΥ

θ

0

pu, U, tqu

,

Ψ

θ

0

pu

1

, u

2

q “

ż

R

d

γ

θ

0

pu

1

, t

q γ

θ

0

pu

2

,

´tq ωptq dt.

Proposition 2 If Assumptions

A

1



A

3

hold, then

S

ω

n

convergesin distribution under

H

0

to a random variable

S

ω

that admits the representation

S

ω

“ E tΨ

θ

0

pU, Uqu `

8

ÿ

κ“1

λ

κ

`

Z

κ

2

´ 1

˘

,

where

tZ

κ

u

8

κ“1

arei.i.d.

N

p0, 1q

and

κ

u

8

κ“1

aretheeigenvaluesof

η

ÞÑ EtΨ

θ

0

pu, Uq ηpUqu

.

1.3.2 Discussion on the assumptions

Assumption

A

1

holdsforthemostcommonly-usedestimators. Inparticular,itissatised by the pseudo maximum-likelihood estimator under general conditions on the copula

(36)

an inversion of Kendall's tau and Spearman's rho. While explicit expressions for

ψ

θ

may rarely be available, Assumption

A

2

holds if the gradient

c

θ

of the copula density

c

θ

puq “ B

d

C

θ

puq{Bu

1

¨ ¨ ¨ Bu

d

, provided that the latter exists, satises some conditions. Specically, if one can nd functions

ρ

1

, . . . , ρ

p

:

r0, 1s

d

Ñ R

such that

|p∇c

θ

puqq

`

| ď

ρ

`

puq

and

ş

r0,1s

d

ρ

`

puq du “ K

`

ă 8

, then the rst part of Assumption

A

2

holds with

ρ

R

“ ρ

I

“ K “ pK

1

, . . . , K

p

q

because

ˇ

ˇD

R

θ

0

,`

ptq

ˇ

ˇ “

ˇ

ˇ

ˇ

ˇ

ż

r0,1s

d

cos

pxt, uyq p∇c

θ

0

puqq

`

du

ˇ

ˇ

ˇ

ˇ

ď

ż

r0,1s

d

|p∇c

θ

0

puqq

`

| du ď

ż

r0,1s

d

ρ

`

puq du “ K

`

and

ş

R

d

}K}

2

ω

ptq dt ă 8

. Thesecondpartof

A

2

willbesatisedaslongas

ω

isintegrable and for any



ą 0

,there is aneighborhood

N

of

θ

0

suchthat for any

θ

P N

,

}∇c

θ

puq ´ ∇c

θ

0

puq} ď ρpuq

and

ż

r0,1s

d

ρ

puq du ă

?



Odż

R

d

ω

ptq dt .

In that case,

›D

R

θ

ptq ´ D

R

θ

0

ptq

› “

ż

r0,1s

d

cos

pxt, uyq t∇c

θ

puq ´ ∇c

θ

0

puqu du

ď

ż

r0,1s

d

}t∇c

θ

puq ´ ∇c

θ

0

puqu} du

ď

ż

r0,1s

d

ρ

puq du

ă

?



Odż

R

d

ω

ptq dt .

Letting

γ

R

ptq :“

?



{

R

d

ω

ptq dt

, one has

ş

R

d

R

ptqu

2

ω

ptq dt “ 

, as required by As-sumption

A

2

; the same arguments hold for the imaginary part. Finally note that As-sumption

A

3

is satised by product weight functions involving a non-vanishing density on

R

with nite moment of order four. This is obviously the case for weight functions based onthe standard normal,double-exponential and double-gammadensities.

Figure

Figure 1.1: Pair plots of ve variables in the Australian Institute of Sport data set; upper
Figure 2.1: Scatterplots of n “ 10 000 simulated pairs from the radially asymmetric
Figure 2.2: Curves of L C p t 1 , 10 q (in blue), L C p t 1 , 20 q (in black) and L C p t 1 , 30 q (in red) as
Figure 2.3: Power of the tests based on R N n (line), R DE n (dashed line), R DG n (dotted lime)
+6

Références

Documents relatifs

We propose multivariate parametric and nonparametric (distribution-free) tests for the hypothesis of elliptical symmetry (with respect to some specified location θθθ) which (based on

In this case the statistic h(g(T n )) extends the notion of log-likelihood ratio and the test based on this statistic is asymptotically equivalent to first order to robust versions

De mani`ere g´en´erale, on d´efinit le niveau (ou seuil) d’un test comme P (rejeter H 0 | H 0 vraie), la probabilit´e de rejeter l’hypoth`ese nulle dans le cas o` u elle est

la fonction f admet alors une infinité de

On suppose qu'il eectue 10 6 opérations élémentaires suc- cessives, que les erreurs commises pour chacune sont indépendantes, de loi uniforme sur [−1/2 10 −J , 1/2 10 −J ] et

dans le monde de (H 0 ) (les pots de glace ne présentent pas de risque d’intoxication), on peut se tromper en choisissant (H 1 ) et en disant que la glace peut être dangereuse pour

A multivariate Gamma model using Gaussian copula is proposed and its performances are evaluated for texture classification. The experiments results show that the

weighted empirial harateristi funtion (PWECF), introdued reently in Meintanis et