• Aucun résultat trouvé

Publications

1. Chaouch, M., Gannoun, A. et Saracco, J. (2007). Estimation de quantiles géomé- triques conditionnels et non conditionnels. En révision pour le JSFdS/RSA.

2. Chaouch, M. and Goga C. (2008). Design-Based Estimation for Geometric Quan- tiles. Submitted at International Statistical Review.

3. Cardot, H., Chaouch, M., Goga, C. and Labruère, C. (2007). Functional Princi- pal Components Analysis with Survey Data. Submitted at Journal of Statistical Planning and Inference.

4. Chaouch, M. (2008). Estimation non paramétrique des quantiles géométriques conditionnels sous une hypothèse d’α-mélange. Soumis aux C. R., Math., Acad. Sci. Paris.

Chapitres de livres

1. Cardot, H., Chaouch, M., Goga, C. and Labruère, C. (2008). Functional Principal Components Analysis with Survey Data. In Functional and Operatorial Statistics, Dabo-Niang, S. and Ferraty, F. (Eds.), Physica-Verlag, Heidelberg, 95-102. Articles parus dans des Actes de conférences (avec comité de lecture)

1. Cardot, H., Chaouch, M., Goga, C. and Labruère, C. (2008). Functional Principal Components Analysis with Survey Data. International Workshop on Functional an Operatorial Statistics. Toulouse, 19-21 Juin 2008.

2. Cardot, H., Chaouch, M., Goga, C. and Labruère, C. (2007). Sondage et ACP fonctionnelle : une approche par la fonction d’influence. 5ème

Colloque francophone sur les sondages. CIRM, Marseille, 5-7 Novembre 2007.

3. Chaouch, M. (2007). Un exemple de quantile spatial conditionel. 2èmes Journées

des jeunes statisticiens. Aussois, 3-7 Septembre 2007.

4. Cardot, H., Chaouch, M., Goga, C. et Labruère, C. (2007). Echantillonnage et ACP fonctionnelle. 39èmes

Journées de Statistique. Angers, 11-15 Juin 2007. 5. Chaouch, M., Gannoun, A. et Saracco, J. (2007). Quantile spatial conditionnel et

non conditionnel. 39èmes

Chapitre 2

Estimation des quantiles

géométriques conditionnels et non

conditionnels

Résumé :L’absence d’un critère pour ordonner les observations représente un obstacle pour étendre la définition classique des quantiles univariés au cas multidimensionnel. Dans le cadre d’études biomédicales ou industrielles, par exemple, on cherche souvent à déterminer le quantile d’un vecteur aléatoire conditionnellement à un autre. Plusieurs définitions des quantiles (conditionnels) multivariés, ne reponsant pas sur une relation d’ordre, ont été proposées dans la littérature statistique. Dans cet article, nous nous focalisons sur la notion de quantile géométrique et de quantile géométrique conditionnel, fondée sur la minimisation d’une fonction de perte.

Mots-clés: algorithmes de calcul, estimateur à noyau, contours, quantile

géométrique, quantile géométrique conditionnel, Transformation-Retransformation.

Contents

2.1 Introduction . . . 32 2.2 Quantile univarié . . . 33 2.3 Quantile géométrique . . . 35 2.4 Quantile géométrique conditionnel . . . 43 2.5 Implémentation en R des algorithmes de calculs des quan-

tiles (conditionnels) géométriques . . . 47 2.6 Etude par simulation . . . 50 2.7 Étude sur des données réelles . . . 52

Article écrit en collaboration avec Ali Gannoun et Jérôme Saracco et il est en révision pour le JSFdS/RSA.

32 Chapitre 2

2.1 Introduction

Les quantiles univariés, conditionels ou non conditionnels, sont fréquemment utilisés en Statistique. Par exemple, la médiane est un indicateur robuste de la tendance cen- trale d’une population, l’intervalle interquartile est un bon indicateur de sa dispersion. Dans la pratique, les domaines d’utilisation des quantiles sont assez variés. En biologie, Gannoun et al. (2002) utilisent les quantiles conditionnels pour estimer des courbes de référence permettant d’analyser certaines propriétés biophysiques de la peau. Les quantiles représentent également un moyen robuste de prévision (voir par exemple De Gooijer et al., 2002, et Gannoun et al., 2003b). En pratique, ces quantiles sont calculés suivant un critère d’ordre sur les observations. Un rappel sur les caractérisations des quantiles univariés sera présenté à la Section 2. L’ordre n’étant pas total sur Rd, une

extension de la définition classique des quantiles au cas où les observations sont à valeurs dans Rd, avec d ≥ 2, ne peut être que partielle. Il s’agit dans ce cas du vecteur quantile

(dit “arithmétique”) dont les composantes sont les quantiles marginaux. Cette définition souffre de plusieurs faiblesses. Notamment, elle n’est pas invariante par rotation et elle ne tient pas compte de l’existence possible de corrélations entre les différentes compo- santes des vecteurs des observations. Le problème d’ordre des données multivariées est assez ancien. Plusieurs auteurs se sont attelés à le résoudre. Nous citons par exemple les travaux de Barnett (1976), Plackett (1976), Reiss (1989), Eddy (1982, 1985). Brown et Hettmansperger (1987, 1989) ont introduit la notion de quantile bivarié en se basant sur la définition de la médiane d’Oja (1983). Par la suite, Babu et Rao (1988) et Abdous et Theodorescu (1992) ont généralisé la notion de quantile pour un vecteur aléatoire. Cependant, cette définition ne tient pas compte de la géométrie des points, de plus elle n’est pas invariante par rotation.

Récemment, deux approches principales ont été développées pour définir des quantiles multivariés qui soient invariants par transformation affine. La première approche est basée sur la fonction de profondeur (en anglais “depth function”) ; nous citons à ce propos les travaux d’Oja (1983) pour la médiane et ceux de Donoho et Gasko (1992), Liu et al. (1999) et Zuo et Serfling (2000) pour les quantiles multivariés. La seconde approche a été utilisée, en premier lieu, par Brown (1983), Gower (1974), Haldane (1948) et Chaudhuri (1992) pour généraliser la notion de la médiane au cas multivarié. Ensuite, Abdous et Theodorescu (1992), Chaudhuri (1996), Koltchinskii (1997) et Kokic et al. (2002) ont proposé différentes généralisations des quantiles multivariés. Cette approche définit le quantile comme un M-estimateur qui minimise une fonction de perte (ou de coût). Pour une description plus détaillée des différentes méthodes ainsi qu’une comparaison entre elles, le lecteur peut se référer à l’article de Serfling (2002).

Dans ce qui suit, nous nous focalisons sur la définition des quantiles, dit géomé- triques, introduite par Chaudhuri (1996). Les quantiles géométriques sont invariants par rotation, cependant ils ne le sont pas par transformation affine. La technique dite de Transformation-Retransformation (TR) permet d’avoir des quantiles géométriques invariants par rotation et tranformation affine (voir par exemple Chakraborty (2001) et Gannoun et al. (2003a)). Ces différents points sont décrits à la Section 3. Une uti- lisation des quantiles géométriques en statistique descriptive multivariée est disponible

Quantile univarié 33

dans Serfling (2004).

Dans le cadre d’études industrielles ou biomédicales par exemple, une variable d’intérêt Y à valeurs dans Rd (par exemple la pression artérielle avec ses deux composantes : la pression systolique et la pression diastolique) peut être concomitante à une variable explicative X à valeurs dans Rs(par exemple l’âge et le poids du patient). Dans ce cas, il

est question de définir et d’étudier les quantiles géométriques conditionnels multivariés de Y sachant X. Ceci est l’objet de la Section 4 où nous proposons une généralisation, dans le cas conditionnel, du théorème 2.1.2 de Chaudhuri (1996) et de l’algorithme d’estimation correspondant. Dans la Section 5, nous décrivons l’implémentation des différents algorithmes sous le logiciel R. Des exemples sur des données simulées sont présentés afin d’illustrer les notions présentées dans les sections précédentes à la Section 6. Enfin nous donnons, dans la Section 7, un exemple d’application sur des données environnementales.

Documents relatifs