• Aucun résultat trouvé

Estimateur avec information auxiliaire générale

4.2.1 Littérature

Dmitriev et Tarasenko[34] ont étudié quand l’information auxiliaire est donnée par la connaissance de P pg1q, . . . , P pgmq ou quand une approximation de cette information est dis-

ponible. Ils ont déterminé la projection de la mesure empirique qui minimise la divergence de Kullback-Leibler sur l’ensemble des mesures de probabilité vérifiant cette information. Zhang a étudié l’information auxiliaire donnée par des espérances de fonctions supposées nulles. Il a en particulier montré que les M -estimateurs et les estimateurs de quantile avec information auxiliaire possédaient une variance asymptotique plus faible que les estimateurs classiques [82], que la fonction de répartition empirique avec ce type d’information auxiliaire était uniformément plus petite que la fonction de répartition empirique [83] et a étudié le comportement asymptotique de la fonction quantile avec information auxiliaire [84]. Cette vision de l’information auxiliaire correspond à celle que nous étudions à la section 4.3. Tarima et Pavlov [79] ont étudié de manière générale comment modifier une statistique pour utili- ser une information auxiliaire générale donnée par des sources d’information différentes. Ils mettent en évidence que la corrélation entre l’estimateur d’intérêt et l’information auxiliaire intervient dans l’utilisation d’une l’information auxiliaire. Si cette corrélation ainsi que la variance de l’information auxiliaire est connue du statisticien, il est assuré d’avoir l’estima- teur le plus efficace en termes de variance, quelque soit la taille de l’échantillon. À l’inverse, si celles-ci ne sont pas connues, le statisticien devra recourir à une méthode de plug-in et sera assuré asymptotiquement d’avoir une réduction de variance optimale. À de nombreux points de vue cet article est très général mais il fait appel à de nombreuses hypothèses de normalité qui sont néanmoins vérifiées dans la plupart des cas pratiques. De plus leur résultat est de type convergence en loi et ne propose pas de vitesse de convergence. En somme, les définitions du processus empirique avec information auxiliaire de cette partie seront des cas particuliers de l’article de Tarima et Pavlov mais les résultats seront plus forts.

4.2.2

Estimateur de Tarima et Pavlov

Notation. De par sa généralité, les notations pour introduire les résultats de Tarima

et Pavlov sont lourdes. Nous les rappelons ici et nous ferons le lien avec les objets sta- tistiques introduits dans la suite. Avec un échantillon X1, . . . , Xn on estime un paramètre

Θ “ pθ1, . . . , θSq avec un estimateur non biaisé pΘ “ ppθ1, . . . , pθSq où S P N˚ désigne le

nombre de statistiques d’intérêts. L’information auxiliaire est donnée par des estimateurs non biaisés Bir “ p rβi1, . . . , rβiJiq

t provenant de I sources d’information différentes pas for-

cément indépendantes, i “ 1, . . . , I et Ji désigne le nombre d’informations apportées par

la ième source d’information. Notre modèle suppose que les Bir estiment de manière précise

Bi “ pβi1, . . . , βiJiq

t. Le statisticien estime ces derniers avec des estimateurs non biaisés

p Bi. On note B “ pBt 1, . . . ,BJtiq t, p B “ pBp1t, . . . , pBtJ iq t et r B “ pBr1t, . . . , rBJt iq t. Si X, Y sont

des vecteurs aléatoires, on note pCovpX, Y qqi,j “ CovpXi, Yjq. Les vecteurs aléatoires pΘ, pB

dépendent de la taille d’échantillon n.

Estimateur optimal. L’idée de cet article est d’étudier une transformation de l’estima-

teur Θ afin d’exploiter l’information auxiliaire. L’objectif est de déterminer la valeur de lap matrice Λ qui minimise la variance de l’estimateur non biaisé

p

Si la matrice V “ VarpBq ` Varpp Bq est inversible alors la solution à cette optimisation est der prendre la valeur

Λ0“ ´Covp pΘ, pBq ¨ V´1. (4.1)

Si la matriceV n’est pas inversible il suffit de considérer la valeur Λ`

0 “ ´Covp pΘ, pBq ¨ V`, où

A` “ lim

δÑ0pAtA ` δIdq´1At est la pseudo-inverse (ou inverse généralisée) d’une matrice

carrée A. Sauf remarque de notre part nous supposerons que la matrice de covarianceV est inversible. L’estimateur optimal de Θ devient

p

Θ0“ pΘ ` Λ0¨ p pB ´Bq “ pr Θ ´ Covp pΘ, pBq ¨ V´1¨ p pB ´Bq.r La matrice de covariance de cette nouvelle statistique est

Varp pΘ0q “ Varp pΘq ´ Covp pΘ, pBq ¨ V´1¨ Covp pΘ, pBqt. (4.2) Puisque l’inverse d’une matrice semi-définie positive est semi-définie positive,

Varp pΘ0q ď Varp pΘq. (4.3)

La pseudo-inverse d’une matrice semi-définie positive est semi-définie positive (voir corollaire 3 de [58]), donc cette propriété est aussi vérifiée quand on utilise la matrice Λ`

0, autrement dit, Var ´ p Θ ´ Λ`0 ¨ p pB ´Bqr ¯ ď Varp pΘq.

Si la covariance entre la fonction d’intérêt et l’information auxiliaire est nulle, c’est-à-dire si Covp pΘ, pBq “ 0 alors il n’y a pas de réduction de variance. Si les sources sont indépendantes entre elles alors la matrice de covariance Varp rBq est diagonale par blocs.

Estimateur adaptatif. Sous réserve d’avoir la valeur Λ0le statisticien est en mesure de

calculer la nouvelle statistiqueΘp0qui exploite l’information auxiliaire. Il est assuré que, pour toute taille d’échantillon n fixée, d’améliorer assurément et de manière optimale la statistique initiale Θ. Dans la majorité des cas le statisticien n’aura pas accès à la vraie valeur de Λp 0

puisqu’il n’aura pas à sa disposition la valeur exacte des matrices Covp pΘ, pBq ou V ou bien ces deux dernières valeurs. Pour compenser ce manque d’information, on peut substituer Λ0

par un estimateur consistant pΛ0 de celui-ci. On noteΘp˚ l’estimateur adaptatif défini par p

Θ˚“ pΘ ´ pΛ0¨ p pB ´Bq,r que le statisticien pourra utiliser s’il lui manque la valeur de Λ0.

Hypothèses et résultats. Le résultat de Tarima et Pavlov reste général mais suppose

que certaines conditions de comportement asymptotique gaussien soient vérifiées. Nous listons ces conditions ci-après et supposons qu’elles sont vérifiées.

• anp pΘ ´ Θq ÝÑL

nÑ`8ξ avec ξ „N p0, Σ11q, anune suite de réels positifs, telle que annÑ`8ÝÑ

`8 et a2nVarp pΘq ÝÑ nÑ`8Σ11 ; • τn “ anp pB ´ Bq ÝÑL nÑ`8τ avec τ „N p0, Σ 1 22q et a2nCovp pB,Bq ÝÑp nÑ`8Σ 1 22 ;

• ζin “ binp rBi´Biq Ñ ζi où bin est une suite de réels positifs telle que bin ÝÑ nÑ`8`8, ζiN p0, Σ222iq, i “ 1, . . . , I et b 2 inCovp rBi, rBiq ÝÑ nÑ`8Σ 2 22i.

Notons Σ12“ Covpξ, τ q. Sous ces hypothèses de convergence, Tarima et Pavlov ont démontré

le résultat suivant (voir Proposition 1 et 2 de [79]).

Proposition 4.2.1. Si anb´1in Ñ wiP r0, `8r et Σ22“ Σ122`diagpw2iΣ222iq est définie positive

alors anp pΘ0´Θq ÝÑL nÑ`8N p0, Σ11´Σ12Σ ´1 22Σ t 12q et anp pΘ˚´Θq ÝÑL nÑ`8N p0, Σ11´Σ12Σ ´1 22Σ t 12q.

Ce résultat est général par rapport aux statistiques concernées mais n’apporte pas d’infor- mation concernant la vitesse de convergence et concerne qu’une seule statistique à la fois.

Documents relatifs