• Aucun résultat trouvé

Représentation uniforme des lois multidimensionnelles et mesures de dépendance

N/A
N/A
Protected

Academic year: 2021

Partager "Représentation uniforme des lois multidimensionnelles et mesures de dépendance"

Copied!
25
0
0

Texte intégral

(1)Représentation uniforme des lois multidimensionnelles et mesures de dépendance Younès Hillali. To cite this version: Younès Hillali. Représentation uniforme des lois multidimensionnelles et mesures de dépendance. [Rapport de recherche] RR-3704, INRIA. 1999. �inria-00072964�. HAL Id: inria-00072964 https://hal.inria.fr/inria-00072964 Submitted on 24 May 2006. HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés..

(2) INSTITUT NATIONAL DE RECHERCHE EN INFORMATIQUE ET EN AUTOMATIQUE. Repr´esentation uniforme des lois multidimensionnelles et mesures de d´ependance Youn`es Hillali. N ˚ 3704 Juin 1999 ` THEME 4. ISSN 0249-6399. apport de recherche.

(3)

(4) Repr´esentation uniforme des lois multidimensionnelles et mesures de d´ependance Youn`es Hillali Th`eme 4 — Simulation et optimisation de syst`emes complexes Projet SODAS Rapport de recherche n ˚ 3704 — Juin 1999 — 21 pages R´ esum´ e : D’apr`es Sklar (1973), toute loi de probabilit´e multidimensionnelle dont les marges sont continues peut s’´ecrire   de fac¸on unique par une fonction de r´epartition dont la masse est concentr´ee sur , appel´ee copule ( Sklar 1973, Schweizer et Sklar 1983); “fonction de d´ependance” (Galombos, 1978), et “repr´esentation uniforme” (Kimeldorf et Sampson, 1975). Dans ce travail, on s’int´eresse a` une famille particuli`ere de copules, dites copules archim´ediennes. Nous donnons les conditions sous lesquelles une copule archim´edienne multidimensionnelle d´efinit une fonction de r´epartition de dimension et nous pr´esentons une g´en´eralisation d’une famille particuli`ere de copules archim´ediennes bidimensionnelles en dimension . Nous examinons ses propri´et´es et nous montrons qu’il existe une correspondance naturelle entre les param`etres de cette famille et deux coefficients de d´ependance multivari´ee. Cette correspondance servira a` pr´esenter deux proc´edures d’estimation de ces param`etres. Mots-cl´ es : Copules archim´ediennes, d´ependance multivari´ee, lois multidimensionnelles, repr´esentation uniforme..

(5). (Abstract: pto). Email : Younes.Hillali@inria.fr. Unit´e de recherche INRIA Rocquencourt Domaine de Voluceau, Rocquencourt, BP 105, 78153 LE CHESNAY Cedex (France) T´el´ephone : 01 39 63 55 11 - International : +33 1 39 63 55 11 T´el´ecopie : (33) 01 39 63 53 30 - International : +33 1 39 63 53 30.

(6) Uniform representation of multivariate distributions and measures of association Abstract: By Sklar (1973), every n-variate distribution function continuous.   with with uniform marginals can be represented by a distribution function on marginals, referred to as a “copulas” ( Sklar 1973, Schweizer and Sklar 1983); a “dependence function” (Galombos, 1978), and a “uniform representation” (Kimeldorf and Sampson, 1975). This paper is concerned with a special class of copulas called “Archimedean”, which includes the uniform representation of many multivariate distributions. In the bivariate case this family will be examined by Genest and Mackay (1986). We gives a generalization of the bivariate Archimedean copulas in the multivariate case. We also provide a generalization of Frank’s family which include as limiting cases the Fr´echet upper bound (Fr´echet, 1951) and the independence distribution, and we suggests two nonparametric estimation procedures of its parameters, based on the measures of association between random variables. Key-words: Archimedean copulas, multivariate distributions, multivariate concordance, uniform representation..

(7) 3. 1 Introduction Ces derni`eres ann´ees, plusieurs auteurs se sont int´eress´es a` la construction de fonctions de r´epartition multivari´ees dont les marges sont fix´ees. On peut citer, par exemple, les travaux de Krummenauer (1998), Johnson et al (1997), Chakak (1995), Koehler et Symanowski (1995), et Cuadras (1992). En effet, dans plusieurs situations, une mod´elisation par une distribution multivari´ee dont les marges sont des lois de Weibull, de Pareto, ou de Gamma, est plus justifi´ee qu’une loi normale multidimensionnelle dont la construction est plus simple ; pensons par exemple aux probl`emes des valeurs extrˆemes multivari´ees. L’objectif commun, alors, a` tous ces travaux et au nˆotre est celui de diversifier le choix de distributions possibles pour la mod´elisation ou la simulation de donn´ees multidimensionnelles correspondant a` de telles situations.   Sklar (1973), toute loi de probabilit´e multidimensionnelle F de marges  Selon  , a` savoir une continues correspond de mani`ere unique a` une copule  fonction de r´epartition dont la masse est concentr´ee sur et dont les marges sont uniformes. Cette copule est d´etermin´ee par la formule :.        

(8) 

(9)   

(10).  (1)  #        o`u  

(11) repr´esente l’infinimum de l’ensemble   

(12)  "!. La fonction  repr´esente la d´ependance entre les lois marginales et ne pr´esente .    

(13) . aucune restriction sur leur nature. Dans cet article, nous nous int´eressons a` une classe particuli`ere de copules multidimensionnelles, a` savoir les copules archim´ediennes multidimensionnelles, qui ont e´ t´e largement e´ tudi´ees dans le cas bidimensionnel par Genest et Mackay (1986). Nous donnons les conditions sous lesquelles ces copules repr´esentent des fonctions de r´epartition multidimensionnelles. Pour simplifier les difficult´es d’ordre th´eorique ou d’ordre pratique engendr´ees par la construction des lois multidimensionnelles a` marges unidimensionnelles, nous allons concentrer la deuxi`eme partie de cet article a` la g´en´eralisation d’une copule archim´edienne bidimensionnelle particuli`ere, dite copule de Frank (voir Genest (1987)), qui a suscit´e beaucoup d’int´erˆet dans la mod´elisation de lois bivari´ees. Nous pr´esentons une e´ tude d´etaill´ee de cette famille de lois multidimensionnelles, ainsi que des algorithmes permettant d’estimer ses param`etres.. RR n ˚ 3704.

(14) 4. Y. Hillali. ` la section 2, nous pr´esentons Le reste de notre article se compose de cinq parties. A une g´en´eralisation des copules archim´ediennes bidimensionnelles au cas multidimensionnel et nous traitons des propri´et´es math´ematiques de cette nouvelle famille ` la section 3, nous nous int´eressons a` un cas particude lois multidimensionnelles. A ` la section 4 nous pr´esentons deux m´ethodes d’eslier, a` savoir la famille de Frank. A timation des param`etres de la famille de Frank en dimension 3, bas´ees sur les coefficients de corr´elation g´en´eralis´es de Spearman et de Kendall. Nous d´ecrivons, entre autres, un algorithme permettant de simuler des copules archim´ediennes multidimensionnelles. Nous finirons par quelques remarques sur la g´en´eralisation d’autres familles de copules archim´ediennes bidimensionnelles, ainsi que les r´esultats de la comparaison des deux proc´edures d’estimation des param`etres de la famille de Frank en dimension 3.. 2 Copules archim´ediennes multidimensionnelles Par souci de simplification nous limitons notre discussion a` la construction  de  . lois multidimensionnelles dont les marges sont uniformes sur le carr´e unit´e Une g´en´eralisation a` d’autres formes de fonctions de r´epartition est ediate    imm´. en appliquant le principe de translation de Nataf (1962). Soient   , va- riables al´eatoires uniformes variant simultan´ement sur le carr´e unit´ e , et   leur a` valeurs   loi  jointe. Soit  la classe des applications d´efinies sur 

(15) dans  .   , continues, strictement d´ecroissantes et convexes, pour lesquelles   Consid´erons les fonctions  d´efinies sur le rectangle par :. .

(16) .  ". 

(17)   et ". .  . 

(18)   

(19)   

(20)

(21).    

(22)  

(23)   

(24). (2). o`u  appartient a`  si  Pour qu’une   fonction , il faut et  de la forme (2) soit une fonction de r´epartition sur le carr´e unit´e il suffit que   (voir le th´eor`eme 6.3.6 de Schweizer et Sklar (1983)).  est appel´ee copule archim´  e

(25) dienne de dimension 2 (voir Genest et Mackay (1986)), associ´e eau dont les fonctions de r´epartition marginales sont uniformes  couple  . Pour simplifier les notations, nous noterons simplement  une copule sur archim´edienne  . Une premi`ere g´en´eralisation intuitive de  de la forme (2) a` l’ordre  pourrait eˆ tre de la forme :. .     

(26) .  . .  .      

(27) . .       

(28)

(29). . . (3). INRIA.

(30) 5 D’apr`es le th´eor`eme (6.3.6) de Schweizer et Sklar (1983), l’application de la forme     (3) est une fonction de r´epartition pour tout si et seulement si  est compl`etement monotone, c’est-`a-dire :. . .

(31). .  . .  .  

(32)        . (4). Cependant, une mod´elisation des lois multidimensionnelles par une application de la forme (3) n’aura pas beaucoup d’int´erˆet, puisque chaque e´ l´ement de cette famille est d´efini par une mˆeme application   et  donc les d´ependances entre les sous ! ne sont pas mises en valeurs, ensembles de variables al´eatoires de  seule une d´ependance globale est prise en compte. Pour cette raison, nous proposons d’´etudier une famille, not´ee , de copules archim´ediennes a` l’ordre   , propos´ee pour la premi`ere fois par Joe (1993), de toutes les d´ependances     qui tient compte. note  la copule archim´edienne de entre les variables al´eatoires  .  Si on

(33) , alors cette famille est d´efinie par : dimension n du vecteur al´eatoire .    

(34)               

(35) 

(36)   

(37) 

(38)  .  

(39)   .  . (5)                

(40)

(41)    

(42) 

(43) o`u        

(44)              #   avec. . .    et l’application   pour appartient a` la classe .

(45). L’objet principal de cet article est de construire une copule  qui soit une fonction de r´epartition de dimension  . D’apr`es un r´esultat de Joe (1993), la copule  de type (5) est une fonction de # r´ e partition si et seulement si elle v´ e rifie la condition suivante : pour tout tel que  #       et toute d´ strictement positive, l’application efinie sur     constante     a` valeurs dans telle que : 

(46)        

(47) 

(48) 

(49) est une transform´ee de Laplace. Cette condition est g´en´eralement tr`es difficile a` v´erifier, mais grˆace a` un th´eor`eme de Feller (1966) elle devient beaucoup plus simple et se r´esume par la proposition suivante : Proposition 1 : Une application  pour   de type (5) est une fonction de    

(50)  

(51) .  r´epartition si et seulement si les applications   o  , ...,   o  sont compl`etement monotones. La d´emonstration de ce r´esultat se d´eduit du th´eor`eme de Feller (1966) et de la condition propos´ee par Joe (1993).. RR n ˚ 3704.

(52) 6. Y. Hillali. 2.1 Propri´ et´ es des copules archim´ ediennes multidimensionnelles de la famille Pour faciliter la compr´ehension des propri´et´es des copules de la forme (5), appartenant a` la famille , on va se limiter a` la dimension trois. Soit  une copule de  dimension trois de type (5) engendr´ee par deux applications  et   appartenant a`   et dont les lois marginales unidimensionnelles sont uniformes sur l’intervalle . D’apr`es la proc´edure de construction des copules appartenant a` la famille (voir e´ quation (5)),  est d´efinie par :.   . . . . 

(53) . .  .  . . . 

(54)    .   

(55)    

(56) . .   . .   

(57)

(58).  .   

(59)

(60). (6).    dans  , il convient de poser :  est d´efinie de   a` valeurs lorsque      

(61)  

(62)  

(63)   

(64) 

(65)    

(66)    

(67) Pour  qu’une de dimension trois  de type (6) soit une fonction de r´e partition  application   sur , il faut et il suffit que l’application  o  soit compl`etement monotone. Cette condition s’´ecrit :  Puisque  . . . . .    . . . .    

(68)

(69)      . Soient  et   les param`etres respectifs des applications  et  . On suppose, sans perte de g´en´eralit´e, que ces param`etres sont compris entre -1 et 1. On note   

(70) une copule de dimension trois de type (6) engendr´ee par les deux  applications  et    telle que 

(71) o   soit compl`etement monotone.   Soit  la distribution correspondant cas o`u et  sont des variables     au  

(72)    . . . . .  al´eatoires ind´ e pendantes : .    ) la distribution correspondant au cas o`u    et  sont Soit  (resp.  parfaitement corr´el´ees positivement (resp. la distribution correspondant au cas o`u   et  sont parfaitement corr´el´ees n´egativement) :.  . . . . .   et . .     

(73)     

(74).      

(75)       .  .  . . .

(76) . sont appel´ees respectivement la borne sup´erieure et inf´erieure de Fr´echet  (voir Fr´echet (1951)). Les conditions suivantes sont une extension de celles de Kimeldorf et Simpson (1975) associ´ees  aux copules bidimensionnelles. Elles permettent d’assurer que les lois  et  sont un prolongement des copules de la. INRIA.

(77) 7 famille d´e finie par l’´equation (6) :   1)     

(78)   

(79) est une fonction continue par rapport a`  et   pour tout             dans l’intervalle 2)   

(80) est une copule absolument continue par rapport a` la mesure de Lebesgue   entre pour tout    compris -1 et 1,    3)    

(81)      

(82)   ,    

(83)     

(84)   .      . 

(85) n’est pas prise en compte dans La loi .   

(86)      les conditions  1, 2 et 3 puisqu’elle n’est pas une copule et donc elle n’appartient pas. a` la famille . 2.2 Coefficients de d´ ependance et copules archim´ ediennes multidimensionnelles de la famille Dans cette partie nous allons voir qu’il existe une correspondance naturelle entre les param`etres des copules archim´ediennes de dimension de la famille et deux mesures de d´ependance multivari´ee, a` savoir les coefficients de corr´elation de Spearman et de Kendall g´en´eralis´es. 2.2.1 Coefficients de la d´ ependance multivari´ ee Les mesures de la d´ependance bivari´ee de Spearmanet     de Kendall s’´etendent facilement a` toute famille finie de variables al´eatoires . Nous pouvons utiliser un nombre unique pour mesurer la d´ependance collective (c’est le cas si on construit une loi  multidimensionnelle a` partir de ses marges par une copule de la forme (3)) ou nombres pour tenir compte de toutes les distributions marginales (voir les travaux de Cuadras (1992)). Pour simplifier, nous nous limiterons au premier cas, c’est-`a-dire a` une mesure de la d´ependance    

(87) collective.. Soit  une copule de de lois du vecteur al´eatoire      dimension   

(88)    marginales uniformes sur de loi jointe telle que : .

(89)   . Les coefficients de corr´elation de Spearman et de Kendall associ´es a` un  

(90)  couple de variables al´ e atoires peuvent se g´ e n´ e raliser a ` un vecteur al´ e atoire   ,. . , de copule  (voir Joe (1990)), de la mani`ere suivante :. RR n ˚ 3704.

(91) 8. Y. Hillali. . .

(92) .   

(93) . . 

(94)  .  .  . . . . .   .   .      

(95)  .    

(96)      

(97).  .    . 

(98) 

(99). (7). . (8). 2.2.2 Coefficient de corr´ elation de Kendall d’une copule archim´ edienne de la famille . Si on consid`ere trois variables al´eatoires , et  de lois uniformes sur le carr´e unit´e et de copule  , alors, d’apr`es les e´ quations (7) et (8), les coefficients de corr´elation de Spearman et de Kendall a` l’ordre trois sont d´efinis par :.  

(100) .   . .   . . .  .

(101).     

(102)       . .

(103). . . (9). (10). Pour e´ viter les probl`emes de d´erivabilit´e on va dans ce qui  supposer,   suit, que     et 

(104) admettent trois d´eriv´ees continues sur , c’est-`a-dire   

(105)   . Proposition 2 : Soit    

(106) une copule archim´edienne de dimension trois et de  type (6) engendr´ee par  et 

(107)   et v´erifiant la condition n´ecessaire et suffisante de la proposition 1. Alors, le coefficient de corr´ elation de Kendall g´en´eralis´e mesurant la liaison entre  les variables al´eatoires , et  de loi jointe  

(108) est d´efini par :.      

(109)

(110)  .      . .  

(111) . avec. . !. #"

(112) !$

(113) 

(114)    

(115). 

(116) . . !. )(. 

(117)  

(118) . #"

(119) !

(120)  

(121) !$ % "

(122)  &

(123)     

(124) 

(125). . . 

(126) +*

(127). !.  #"

(128)

(129)  ! 

(130)  

(131)

(132)

(133) . '   "    

(134). . INRIA. . .

(135).

(136) 9. '.   $

(137) 

(138) 

(139)  

(140)

(141)  

(142). 

(143) . .  . . 

(144)  

(145). Preuve : En utilisant les e´ quations (6) et (10) on a :. .         

(146)

(147)  .   

(148) 

(149).  .       . 

(150) 

(151) .  . .

(152) . . .      

(153)   

(154). . .

(155). o`u    

(156) est la partie absolument continue par rapport a` la mesure de Lebesgue de    

(157) et   

(158) sa partie singuli`ere concentr´  ee  sur un ensemble de mesure nulle.. Il suffit donc d’int´egrer    

(159)   

(160) sur . En utilisant les changements de variables :. .   

(161)   *    

(162) .  .  .  

(163)

(164)  

(165)  

(166)  . on obtient le r´esultat souhait´e.. 3 Famille de Frank g´en´eralis´ee Dans cette partie, nous proposons une famille de copules archim´ediennes de dimension trois, appartenant a` et g´en´eralisant la famille de Frank en dimension deux, largement trait´ee par Genest (1987). Nous donnerons la condition sous laquelle    elle repr´esente une fonction de r´epartition a` trois dimensions concentr´ee sur de marges uniformes. Nous examinerons deux estimateurs non-param´etriques de ses param`etres. Ces estimateurs sont bas´es sur les coefficients de corr´elation de Spearman et de Kendall g´en´eralis´es.     Soit la copule de Frank a ` deux dimensions d´ e finie pour et .    par :. .   . . .  .

(167)           

(168)   

(169)   a     

(170) .  . 

(171)      (

(172) .  

(173)     

(174)   

(175)

(176)  Une g´en´eralisation de   en dimension trois, par une famille appartenant a`

(177) . . pr´esente sous la forme suivante :.   

(178) . RR n ˚ 3704.   .

(179)  .  . .  . 

(180)  

(181)       .

(182) .   . .

(183)

(184) . 

(185)  

(186)

(187) . . , se.

(188) 10. Y. Hillali.    .   

(189) .  .

(190)  .

(191) . . .  . .                

(192)  .   

(193). 

(194)  . .

(195)   . .

(196)

(197). (11). o`u   et 

(198) sont deux applications de la classe  et d´efinies de la mˆeme fac¸on que  . Proposition 3 : La copule  

(199) d´efinie dans l’´equation (12)   est une fonction de r´epartition de dimension , si et seulement si         trois, de marges uniformes sur , avec et strictement positifs. Preuve : En appliquant la proposition (1) aux deux applications   et 

(200) associ´ees a`    , la condition et suffisante se r´esume  n´ecessaire   

(201)

(202) alors par : 

(203)     

(204).     

(205)      compl`etement mo-. .  . .   .

(206) . 

(207) . . notone, avec

(208).  

(209)  

(210). . . 

(211) . . . .  . . . Une e´ tude de cette fonction donne la condition. .  . .  .. 3.1 Propri´ et´ es de la famille de Frank g´ en´ eralis´ ee La borne sup´erieure de Fr´echet a` trois dimensions et la loi de l’ind´ependance sont un prolongement  

(212) . En effet :    de la famille  .  .      

(213) 

(214)   

(215)      

(216)         

(217)     . 

(218). .     

(219) . . . . 3.2 Coefficient de corr´ elation de Kendall g´ en´ eralis´ e de la famille de Frank de dimension 3 . Soient , et  trois variables al´eatoires de loi jointe la loi de Frank de dimension trois not´ee  

(220) , engendr´ee par deux applications   et 

(221) continues,  strictement d´ et convexes, telles que   (  . Si ( e croissantes (   on note  ( : 

(222)  

(223)

(224).

(225)               

(226)     

(227)   

(228) ,   

(229) 

(230). . .    

(231)   .   

(232) 

(233)    . .  . .   

(234) !

(235)     

(236). !. .

(237)  

(238).  . . . . 

(239)  

(240)   . INRIA.

(241) 11. .   

(242)  .  .   

(243)  . .  .    .    

(244) ! 

(245) 

(246)  

(247)         

(248)  

(249) 

(250)

(251) 

(252) .  

(253) 

(254). !.      . .  . Alors, en utilisant la proposition (2) et apr`es plusieurs e´ tapes de calcul, le coefficient  de corr´elation de Kendall entre , et  de loi  

(255) , not´e    

(256)

(257) , est d´efini par :. 3.3.  .      

(258)

(259)          

(260)       

(261)       

(262)

(263)  (12)      Coefficient de corr´ elation de Spearman g´ en´ eralis´ e de la famille de Frank de dimension 3.    

(264) . On pose les change-. . Soient , et  trois variables al´eatoires de loi ments de variables suivants  :. . . .     .

(265)

(266)  *    

(267)    

(268) . 

(269) .

(270) . .  Soient  ,   et   trois fonctions d´efinies sur . .  .   

(271)  $

(272) 

(273)        *    

(274)      !  

(275) 

(276) !

(277)  

(278)

(279)       

(280).     *

(281) .      *. . .

(282) .

(283) . . .     par :   

(284) 

(285)   . .  

(286)

(287)   . . Alors le coefficient que corr´elation de Spearman entre s’´ecrit : .    

(288)

(289) .  . .     . .       *

(290).  . .    *. .

(291) . .  .

(292)   . et  de loi jointe .   

(293) .  *.  *.   

(294) . .

(295) . (13). La d´emonstration de ce r´esultat repose sur l’´equation (9) et sur les changements de variables utilis´es dans la proposition (2) (pour plus d´etails voir Hillali (1998)). Avant d’´etudier l’estimation des param`etres de la loi de Frank g´en´eralis´ee, nous pr´esentons d’abord un algorithme qui s’av`ere utile dans le cadre d’´etudes de simulation des copules archim´ediennes multidimensionnelles. Pour les nota simplifier  tions on suppose que les lois marginales sont uniformes sur .. RR n ˚ 3704.

(296) 12. Y. Hillali. Algorithme 1 : L’algorithme suivant permet de g´en´erer une r´ealisation du vecteur al´eatoire (X, Y, Z) de loi  de la forme (12) absolument continue, engendr´ee par deux applications   et 

(297) continues, d´ecroissantes et convexes, et dont les param`etres v´erifient la condition de la proposition (3) :  et  de lois unie´tape 1 : on g´en`ere trois variables al´ e atoires ind´ e pendantes   formes sur l’intervalle    

(298)  

(299)  

(300) 

(301)   

(302)   e´tape 2 : on calcule        

(303)

(304) e´tape 3 : on pose       

(305)  e´tape 4 : on calcule        

(306) , avec la fonction de r´epartition conditionnelle    

(307)     e´ tant donn´e   et de la variable    

(308)   

(309)  

(310)    

(311) 

(312)

(313) e´tape 5 : on pose   

(314) 

(315) 

(316)   

(317). . . .  . .  . . .  . .  . Les m´ethodes d’estimation des param`etres de la loi  

(318) de type (12) peuvent eˆ tre d’ordre param´etrique ou non-param´etrique. Dans les deux cas les calculs s’av`erent tr`es difficiles, vu la complexit´e des formes des densit´es multidimensionnelles et des coefficients de corr´elation g´en´eralis´es de Spearman ou de Kendall. Nous allons essayer de donner quelques solutions et nous comparerons les deux m´ethodes pr´esent´ees ci-dessous a` l’aide de donn´ees simul´ees.. 4 Estimation des param`etres de la loi de Frank g´en´eralis´ee 4.1 M´ ethode bas´ ee sur le coefficient de corr´ elation de Kendall Les coefficients de corr´elation de Spearman et de Kendall g´en´eralis´es associ´es a`  

(319) et pr´esent´es par les e´ quations (13) et (14) se d´efinissent comme fonctions  des deux param`etres et  ; d’o`u l’id´ee d’estimer ces param`etres a` partir de ces deux coefficients d’association.  Soient et   trois   variables al´eatoires, ind´ependantes ou non, de lois marginales uniformes sur et de copule  

(320) . Soit  le coefficient de corr´elation de Kendall g´en´eralis´e, calcul´e a` partir de  r´ealisations des trois variables al´eatoires , et  , estim´e par le coefficient de.  . . .  . INRIA.

(321) 13 corr´elation de Kendall moyen des couples. . . . . Alors, une bonne fac¸on d’estimer  tels que :. .  . . .

(322) ,   

(323)

(324) . .  .  . . et. 

(325) , d´efini par :. . (14). .  et  consiste a` trouver deux param`etres. . . .      .  

(326)

(327)          

(328) . . et. (15). o`u  est le coefficient de corr´elation de Kendall g´en´eralis´e de la loi de Frank de dimension trois, d´efini par l’´equation (13). L’´equation (16) ne peut pas eˆ tre r´esolue     sachant que et  sont tous les deux inconnus. Mais, puisque le param`etre  peut eˆ tre interpr´et´e comme coefficient d’association des variables al´eatoires , de loi   , alors, d’apr`es un r´esultat de Genest (1987), un bon estimateur non   param´etrique de est solution de l’´equation :. . . avec

(329). . 

(330) . . . . .  . . 

(331)  . .     

(332) .  

(333) .  .  

(334)    

(335)

(336) 

(337)    

(338)      

(339)     

(340) . (16). et   le coefficient de corr´elation de Kendall entre.     .     .

(341) , et calcul´e a` partir de leurs r´ealisations respectives 

(342) et     c’est-`a-dire que est la valeur de pour laquelle le coefficient de corr´elation de Kendall th´eorique est e´ gal au coefficient de corr´elation de Kendall calcul´e :. . .  .       

(343) . Cette e´ quation ne poss`ede pas de solution explicite et le recours aux m´ethodes d’ap proximations successives est in´evitable. Finalement, l’estimateur  de  sera la solution de l’´equation suivante :. .       

(344)  . . . (17). . . Remarque : Dans cette proc´edure, on ne peut pas estimer  a` partir de   

(345)

(346)   

(347)  et ensuite estimer comme solution de l’´equation    . En effet, le coefficient de corr´elation th´eorique   

(348)

(349) ne d´epend que de   , c’est-`a-dire, il est  

(350)

(351) ind´ependant du choix de la loi bidimensionnelle des couples   ou   .. . RR n ˚ 3704. .  . .

(352) 14. Y. Hillali. Par contre, le coefficient de corr´elation de Kendall bidimensionnel, calcul´e a` partir des r´ealisations, d´epend du couple 

(353) de variables al´eatoires choisies.   Donc, le choix du couple   de loi 

(354) donne un estimateur et le couple    

(355) donne un autre estimateur   . Cette m´ethode n’aboutit donc pas a` un r´esultat coh´erent. Cette proc´edure peut se r´esumer par l’algorithme suivant : Algorithme 2 : 1. calculer   le coefficient de corr´elation de Kendall   des r´ealisations du couple. . . .

(356). . 2. calculer le coefficient de corr´elation de Kendall  a` partir des r´ealisations des trois variables al´eatoires, simul´ees selon la loi de Frank de dimension trois (voir e´ quation 15);    3. r´esoudre l’´equation  

(357)    pour obtenir l’estimateur de ;    

(358)   par et r´esoudre l’´equation   4. remplacer  pour obtenir l’estimateur   de. . . . . . .  . . 4.2 M´ ethode bas´ ee sur le coefficient de corr´ elation de Spearman.  . Un autre coefficient possible pour l’estimation des param`etres de  

(359) est le coefficient de elation de Spearman.    .   g´   e n´ e

(360) ralis´e (voir e´ quation (14)).     corr´.

(361).

(362) et   Soient . ,    al´e atoires       r´ealisations des variables  les rangs respectifs de et  pour  , # et  de loi jointe  

(363) et , et . Alors le coefficient de corr´elation de Spearman associ´e aux variables  et  not´e  est d´efini par (voir Joe (1990)) :.  .  .    .  .  . . .   .       . . #.   . . .

(364) 

(365) .

(366) 

(367) . (18). 

(368)    

(369)

(370) le coefficient de corr´elation de Spearman Soit  th´eorique des     variables et  de loi  

(371) . Alors, les estimateurs  et  de et  sont solutions de l’´equation :.  .    

(372)

(373)  . .  .    

(374)   . . . . . . (19). . Il est impossible de r´esoudre cette e´ quation sachant que les deux param`etres et  sont inconnus. Pour contourner ce probl`eme, nous allons proc´eder en deux e´ tapes,. INRIA.

(375) 15. .  . . en faisant appel aux lois marginales de  

(376) Soit   

(377) , qu’on notera par la  suite  

(378) , le coefficient de corr´elation de Spearman des variables al´eatoires et de loi   .

(379) et le param`etre d’association  des D’apr`es un r´esultat de Nelsen (1986),     variables et sont li´es par la relation :. . . . . 

(380)   . .  . .

(381)   . . 

(382)   . .

(383)   . 

(384) 

(385). . . . .

(386)    . 

(387)

(388). (20). .   

(389)      Si on note  le de corr´elation de Spearman, calcul´e a` partir des r´ealisations  coefficient  

(390) du couple  , il paraˆıt naturel qu’un estimateur   de  soit solution de l’´equation avec. .  

(391). . suivante :.    

(392)     . (21). Cette e´ quation ne poss`ede pas de solution explicite ; on a donc recours aux m´ethodes d’approximations successives d’int´egrales, ce qui exige beaucoup de temps de calcul.  Connaissant le param`etre  solution de l’´equation (22), un estimateur   de  est solution de l’´equation :. .    .  . .  .    

(393)   . . (22). 

(394)  o`u    

(395)

(396) et  sont les coefficients de corr´elation de Spearman a` l’ordre 3 d´efinis respectivement par les e´ quations (14) et (19).  Les r´esultats des deux m´ethodes d’estimation de et  ainsi qu’une comparaison de leurs performances sont pr´esent´es ci-dessous.. . . 5 Simulations Pour la famille de Frank g´en´eralis´ee en dimension trois, nous avons e´ tudi´e deux m´ethodes non-param´etriques bas´ees sur les coefficients de corr´elation de Spearman et de Kendall g´en´eralis´es a` l’ordre trois.. RR n ˚ 3704.

(397) 16. Y. Hillali.  . Cette famille d´efinie pour.   

(398) . o`u .   . .   .   . et .

(399)  .

(400) .   

(401) .  .  . . 

(402)  . .  donn´ee par :  est. . . . . .              

(403)    

(404)   

(405).  .  (

(406) , pour #  . .

(407)   . .

(408)

(409). (23).    . . . . Dans les tableaux qui suivent, les r´ealisations d’un vecteur 

(410) de   al´eatoire  sont simul´ees a` partir de loi jointe  

(411) et de lois marginales uniformes sur  l’algorithme (1) (voir section 3 ) ; repr´esente la moyenne des diff´erentes esti mations et Std l’´ecart type. Les param`etres et repr´esentent respectivement les estimateurs de la m´ethode du coefficient de corr´elation de Kendall et de celle du coefficient de corr´elation de Spearman..  . . .    . . , .    E 1.106 1.095 0.974 0.942.           . . . . Std 0.776 0.295 0.261 0.223. E 1.521 1.466 1.321 1.264.  . Std 1.124 0.638 0.388 0.335. TAB . 1: Mod`ele de Frank g´en´eralis´e : proc´edure du coefficient de corr´elation de Spearman. .     . . , .           .    E 0.121 0.094 0.076 0.057. .  Std 0.182 0.105 0.094 0.036. E 0.756 0.684 0.591 0.503.  . Std 1.056 0.948 0.902 0.784. TAB . 2: Mod`ele de Frank g´en´eralis´e : proc´edure du coefficient de corr´elation de Spearman. INRIA.

(412) 17.     . .  . .  . . .  . . . . E Std 0.053 0.223 0.049 0.190 0.0250 0.0453 0.0185 0.0448. TAB . 3: Mod`ele de Frank en dimension 2 : proc´edure du coefficient de corr´elation de Spearman. .    . . , .    E 1.183 1.224 1.035 0.961.           .  . Std 0.587 0.321 0.254 0.210. E 1.847 1.701 1.511 1.390.  . Std 1.102 0.814 0.658 0.421. TAB . 4: Mod`ele de Frank g´en´eralis´e : proc´edure du coefficient de corr´elation de Kendall. .     . . , .  . .  . .  . .   .  .  . E Std E Std 0.134 0.0971 1.023 1.084 0.0972 0.0925 0.928 0.951 0.0754 0.084 0.841 0.911 0.0542 0.0513 0.744 0.850. TAB . 5: Mod`ele de Frank g´en´eralis´e : proc´edure du coefficient de corr´elation de Kendall. RR n ˚ 3704.

(413) 18. Y. Hillali. 5.1 Proc´ edure d’estimation bas´ ee sur le coefficient de corr´ elation de Spearman Comme nous l’avons pr´ecis´e dans la section 4, cette m´ethode, bas´ee sur les approximations num´eriques d’int´egrales, donne des r´esultats contestables : soit une forte surestimation, soit une forte sous-estimation. Dans les simulations effectu´ees nous avons toujours observ´e une surestimation des param`etres, comme on peut le remarquer dans le tableau(1).  (de l’ordre de 0.05), nous avons obtenu de mauvais Pour de faibles valeurs de estimateurs pour le param`etre  (une forte surestimation), par contre pour le pa ram`etre les r´esultats sont plus ou moins satisfaisants comme on peut le constater dans le tableau (2). Cette forte surestimation du param`etre  est due a` des e´ chantillons pathologiques dont le nombre n’est pas n´egligeable et pour lesquels  on a obtenu des estimateurs fortement erron´es pour  mais acceptables pour , ce qui explique aussi la variabilit´e importante des estimations,     pour le      notamment   et tableau (2) : (0.00589, 5.241), (0.0875, 7.352) pour En r´esum´e, la complexit´e du calcul du coefficient de corr´elation de Spearman en dimension trois, qui engendre beaucoup d’approximations, rend cette m´ethode inefficace pour estimer les param`etres de la loi de Frank en dimension trois. Paradoxalement, cette m´ethode donne des r´esultats satisfaisants dans le cas de la loi de Frank en dimension deux, comme on peut le constater dans le tableau (3) o`u nous avons simul´e 100 e´ chantillons de taille 10, 15, 25 et 50.. . . . . . . . . . . 5.2 Proc´ edure d’estimation bas´ ee sur le coefficient de corr´ elation de Kendall La m´ethode du coefficient de corr´elation de Kendall donne de moins bons r´esultats que la m´ethode pr´ec´edente. Elle fournit des estimations aussi erron´ees que celles de la m´ethode du coefficient de corr´elation de Spearman. On a observ´e de la mˆeme mani`ere une surestimation dans tous les cas, surtout pour le param`etre  pour des  dans le tableau (5). Ces r´esultats ne sont pas du tout surprevaleurs faibles de nants si on regarde de pr`es la complexit´e de la formule du coefficient de corr´elation de Kendall en dimension trois associ´e a` la loi de Frank g´en´eralis´ee (voir e´ quation 13) ; de plus cette m´ethode, test´ee par Genest (1987) dans le cas de la loi de Frank a` deux dimensions o`u la complexit´e est peu apparente, a donn´e de mauvais r´esultats.. . . INRIA.

(414) 19 En g´en´eral, les m´ethodes d’int´egration num´erique, en dehors de leurs applications a` certains types de fonctions et de domaines d’int´egration pr´ecis, restent peu fiables pour les probl`emes d’estimation. Ces simulations nous permettent de conclure qu’aucune m´ethode d’estimation des param`etres d’une loi multidimensionnelle n’est universelle. Selon la loi multidimensionnelle a` traiter et ses caract´eristiques : type de la vraisemblance, coefficient de corr´elation de Spearman, coefficient de corr´elation de Kendall, il faut choisir la m´ethode adapt´ee. Sur le plan pratique, les difficult´es et les probl`emes typiquement num´eriques que soul`event les algorithmes d’estimation des param`etres des lois multidimensionnelles (dimension trois et plus) exigent e´ norm´ement d’attention, leur r´esolution n’est pas toujours ais´ee et le temps de calcul est fort important.. 6 Conclusion La g´en´eralisation d’autres familles de copules archim´ediennes bidimensionnelles au cas multidimensionnel peut s’av´erer inutilisable si la fonction de r´epartition correspondant a` l’application    est trop compliqu´ee, c’est-`  a-dire si on ne  parvient pas a` trouver une expression alg´ebrique simple de  . D’une mani`ere g´en´erale la construction de lois multidimensionnelles pr´esente des difficult´es plutˆot d’ordre pratique que d’ordre th´eorique : estimation des param`etres et expression de la densit´e multidimensionnelle.. R´ef´erences Chakak, A. et Koehler, K.J. (1995). A strategy for constructing multivariate distributions. Commun. Statist. Simula., 24 (3), 537-550. Cuadras, C.M (1992). Probability distribution with given multivariate marginals and given dependence structure. Journal of multivariate analysis, 45, 51-66. Feller, W. (1966). An introduction to Probability Theory and its Applications. John Wiley Sons, New York. RR n ˚ 3704.

(415) 20. Y. Hillali. Fr´echet, M. (1951). Sur les tableaux de corr´elation dont les marges sont donn´ees. Ann. univ. Lyon, sec. A. 14, 53-57. Genest, C. (1987). Frank’s family of bivariate distributions, Biometrika, 47, 549555. Genest, C. et Mackay, R.J. (1986). Copules archim´ediennes et familles de lois bidimensionnelles dont les marges sont donn´ees. The Canadian journal of statistics, 14, 145-159. Hillali, Y. (1998). Analyse et mod´elisation des donn´ees probabilistes : Capacit´es et lois multidimensionnelles. Th`ese de doctorat de l’Universit´e Paris IX-Dauphine. Joe, H. (1990). Multivariate concordance. Journal of multivariate analysis, 35, 12-30. Joe, H. (1993). Parametric families of multivariate distributions with given margins. Journal of multivariate analysis, 46, 262-282. Johnson, N.L, Kotz, S. and Balakrishnan, N. (1997). Discrete multivariate distributions. Wiley, New York. Koehler, K.J. et Symanowski, J.T. (1995). Constructing multivariate distributions with specific marginal distributions. Journal of multivariate analysis, 55, 261282. Krummenauer, F. (1998). Representation of multivariate discrete distributions by probability generating functions. Statistics and Probability letters, 39, 327331. Nataf, A. (1962). D´etermination des Distributions de probabilit´es dont les marges sont donn´ees. C. R. A. S. Paris, A 255, 42-43. Nelsen, R.B. (1986). Properties of one-parameter family of bivariate distribution with specified marginals. Communication in statistics, A. 15, 3277-3285. Schweizer, B. et Sklar, A. (1983). Probabilistic metric spaces. North-Holland, Amsterdam.. INRIA.

(416) 21 Sklar, A. (1973). Random variables, joint distribution functions, and Copulas. Kybernetika, 9, 449-460.. RR n ˚ 3704.

(417) Unit´e de recherche INRIA Lorraine, Technopˆole de Nancy-Brabois, Campus scientifique, ` NANCY 615 rue du Jardin Botanique, BP 101, 54600 VILLERS LES Unit´e de recherche INRIA Rennes, Irisa, Campus universitaire de Beaulieu, 35042 RENNES Cedex Unit´e de recherche INRIA Rhˆone-Alpes, 655, avenue de l’Europe, 38330 MONTBONNOT ST MARTIN Unit´e de recherche INRIA Rocquencourt, Domaine de Voluceau, Rocquencourt, BP 105, 78153 LE CHESNAY Cedex Unit´e de recherche INRIA Sophia-Antipolis, 2004 route des Lucioles, BP 93, 06902 SOPHIA-ANTIPOLIS Cedex. ´ Editeur INRIA, Domaine de Voluceau, Rocquencourt, BP 105, 78153 LE CHESNAY Cedex (France) http://www.inria.fr ISSN 0249-6399.

(418)

Références

Documents relatifs

L’objet du probl` eme est d’´ etudier quelques propri´ et´ es d’un estimateur du param` etre p d’une loi g´ eom´ etrique..

N’utilisez surtout pas la notation ln(z) si z n’est pas un r´ eel strictement

Comme les estimateurs sont des estimateurs linéaires des Y t [les Y t dépendent des ε t qui sont aléatoires et obéissent à des lois normales], alors les

Dans la dernière case de notre tableau, la valeur exacte de d s’écrit donc 5 et se lit racine de cinq.. Dans ce cas, la calculatrice ne peut nous donner qu’une valeur approchée

Enoncer le th´ eor` eme de d´ erivation d’une int´ egrale ` a param` etre de

Cela revient à étudier le comportement asymptotique de la suite de mesures (moT^nX)' On va montrer qu'il existe une unique fonction h : I d —>• 1^ strictement positive,

Les surfaces unicursales, admettant des représentations para- métriques rationnelles^ sont aussi susceptibles de représentations uniformes transcendantes; cela est évident, parce

Le cas, dans lequel les fonctions uniformes H(^) et M (t) ne présentent pas de points singuliers isolés, est celui qui nous inté- resse surtout ici, parce que, dans ce cas,