• Aucun résultat trouvé

Donn´ees fonctionnelles et sondages: estimation des trajectoires moyenne et m´ediane.

N/A
N/A
Protected

Academic year: 2022

Partager "Donn´ees fonctionnelles et sondages: estimation des trajectoires moyenne et m´ediane."

Copied!
48
0
0

Texte intégral

(1)

Donn´ ees fonctionnelles et sondages: estimation des trajectoires moyenne et m´ ediane.

Camelia Goga

Universit´e de Bourgogne, IMB camelia.goga@u-bourgogne.fr

7eme Colloque sur les sondages, Rennes 2012

(2)

Plan de l’expos´ e

1 Motivation: courbes de charges ´electriques `a EDF et courbes d’audience `a ”M´ediam´etrie”;

2 Estimateurs de la courbe moyenne et m´ediane: propri´et´es asymptotiques;

3 Application aux courbes de charge ´electriques;

4 Conclusion et perspectives.

Travaux r´ealis´es en collaboration avec H. Cardot (Univ. de Bourgogne) et Pauline Lardin (EDF et Univ. de Bourgogne) pour la courbe moyenne;

avec M. Chaouch pour la courbe m´ediane.

(3)

”Sondage” de courbes

Dans beaucoup de domaines: les courbes d’´electricit´e, d’audience t´el´e ...

A EDF:

Actuellement, les donn´ees de courbes de charge individuelles sont r´ecup´er´ees par campagne de mesure (panels, mesures ”ponctuelles”

sur ´echantillons de clients).

Demain:

Installation de pr`es de 34 millions de compteurs communicants

”LINKY”.

Possibilit´e de r´ecup´erer ”au fil de l’eau” plus de 34 millions objets courbes `a des pas potentiellement tr`es fins (par secondes jusqu’aux donn´ees mensuelles).

ecup´eration exhaustive des courbes de charge peu envisageable.

Techniques de sondage envisag´ees pour estimer la courbe moyenne de consommation `a des coˆuts raisonnables.

(4)

Exemple 1: un ´ echantillon de 30 courbes de consommation d’´ electricit´ e. La courbe m´ ediane est en rouge.

Population test: 18902 courbes de consommation d’´electricit´e des entreprises enregistr´ee toutes les 30 minutes pendant une semaine.

0100200300400500600

Electricity Consumption (Kw−H)

(5)

La courbe m´ ediane ”versus” la courbe moyenne

0 50 100 150 200 250 300

100150200250300350400

Hours

Electricity consumption (Kw-H)

Figure: La courbe m´ediane est en rouge et la courbe moyenne en rouge.

(6)

Exemple 2: un ´ echantillon de 5 profils individuels d’audience TV

L’audience TV est enregistr´ee toutes les minutes pendant 24 heures.

0 200 400 600 800 1000 1200 1400

0.00.20.40.60.81.0

TV audience

(7)

La courbe m´ ediane ”versus” la courbe moyenne

0 20000 40000 60000 80000

0.00.10.20.30.40.5

seconds

TV audience profiles meanmedian

(8)

Aspect fonctionnel des donn´ ees

Des courbes plutˆot que des vecteurs multidimensionnels : description et mod´elisation statistique de fonctions (al´eatoires) et de courbes consid´er´ees comme individus statistiques.

Des travaux “anciens” : Deville (1974), Dauxois & Pousse (1976) ...

et un renouveau : Ramsay & Silverman (2002, 2005), Ferraty & Vieu (2006).

Des applications : ´economie (Kneip & Utikal 2001), climatologie (Besse et al. 2000), t´el´ed´etection (Cardot et al. 2003),

bio-informatique, ...

En sondagesdes travaux tr`es r´ecents: Cardot, Chaouch, Goga and Labru`ere (2010), th`eses de Etienne Josserand (2011) et Pauline Lardin (2012) `a l’Univ. de Bourgogne:

(9)

La courbe moyenne et m´ ediane: d´ efinition

Soit U ={1, . . . ,N}une population de taille N suppos´ee connue;

Soit Y une variable fonctionnelle d´efinie pour chaque individuk:

Yk(t), t ∈[0,T] Deux param`etres d’int´erˆet:

1 la courbe moyenne:

µ(t) = 1 N

X

U

Yk(t)

2 la courbe m´ediane (la m´ediane fonctionnelle) qui est la solution unique (Kemperman, 1987 Chaudhuri, 1992 and Gervini, 2008) de

mN = argminy∈L2[0,T]

N

X

k=1

||Yk y||

(10)

Estimateurs de la courbe moyenne et m´ ediane

SoitsU un ´echantillon s´electionn´e selon un plan de sondagep(·); la taille N est suppos´ee connue.

Soientπk etπkl les probabilit´es d’inclusion:

πk =Pr(k s); πkl =Pr(k,ls)

L’estimateur de type Horvitz-Thompson de la courbe moyenne est ˆ

µ= 1 N

X

s

Yk πk

L’estimateur ˆmn de la m´edianemN est la solution unique de:

ˆ

mn= argminy∈L2[0,T]

X

k∈s

||Yky||

πk

(11)

Propri´ et´ es de l’estimateur de Horvitz-Thompson fonctionnel

L’estimateur ˆµest sans biais pourµpar rapport au plan;

La fonction de covariance de ˆµest donn´ee par γ(r,t) = 1

N2 X

U

X

U

klπkπl)Yl(r) πl

Yk(t) πk

Les propri´et´es de convergence uniforme et en distribution ont ´et´e ´etudi´ees par Cardot and Josserand (2011).

Extensions: estimateurs desparam`etres non-lin´eaires:

1 Du coefficient de r´egression lin´eaireβ(t) et l’estimateur pourµassist´e par un mod`ele lin´eaire (Cardot, Goga and Lardin, 2012);

2 La m´ediane fonctionnelle (Chaouch and Goga, 2012);

3 L’estimateur de l’approximation de variance de Hajek (Cardot, Goga and Lardin, 2012)

(12)

Le mod` ele lin´ eaire (Cardot, Goga and Lardin, 2012)

SoientX1, . . . ,Xp variables auxiliaires; on notex0k = (Xk1, . . . ,XKp) Le mod`ele lin´eaire suivant (Faraway, 1997)

ξ : Yk(t) =x0kβ(t) +εkt, t∈[0,T]

o`u β(t) est le coefficient de r´egression fonctionnel et les r´esidusεkt sont de moyenne 0

Eξkt) = 0 et de fonction de covariance:

Covξkt, εlt) = 0, k 6=l,t∈[0,T] Covξkt, εkr) = Γ(t,r), t,r ∈[0,T]

(13)

L’estimateur pour µ assist´ e par un mod` ele lin´ eaire

ˆ

µMA(t) = 1 N

X

s

Yk(t) πk

− 1 N

X

s

xk πk

−X

U

xk

!0

β(t)ˆ

o`u ˆβ(t) =

1 N

P

s xkx0k

πk

−1 1 N

P

s xkYk(t)

πk =G−1 1N P

s xkYk(t)

πk

En pratique, on observe la trajectoireYk(t) pour des instants discretis´es 0<t1 <t2< . . . <tD =T;

La valeurYk,d(t) pour∈[ti,ti+1] est calcul´ee par interpolation lin´eaire;

On note ˆµMA,d(t) l’estimateur construit `a partir des valeursYk,d(t).

Il peut ˆetre obtenu par calage sur les totaux de X1, . . . ,Xp.

(14)

Un estimateur r´ egularis´ e de ˆ β

La construction de ˆµMA,d est possible si la matrice ˆG=N−1P

s xkx0k

πk

est inversible;

On propose l’estimateur r´egularis´e de G:

Soientλj,vj,les valeurs propres, resp. les vecteurs propres associ´es, j= 1, . . . ,pde ˆG:

Gˆ =

p

X

j=1

λjvjvj0

On consid`ere a>0 et l’estimateur ˆGa qui est toujours inversible:

Gˆa =

p

X

j=1

max (λj,a)vjv0j

(15)

Propri´ et´ es de ˆ G

a

Si λmin≥a,alors ˆG= ˆGa.

a est inversible et ||Gˆ−1a || ≤a−1.

Sous les hypoth`eses (A1)-(A5), on montre que

P( ˆGa6= ˆG) =P(λmin <a) =O(n−1).

Soit l’estimateur suivant deµ ˆ

µMA,a = 1 N

X

s

Yk,d(t)

πk − 1

N X

s

xk

πk −X

U

xk

!0

βˆa(t)

avec ˆβa= ˆG−1a N1 P

s

xkYk,d(t) πk

(16)

Nouvelle difficult´ e due au cadre fonctionnel

Pour t∈[0,T] fix´e, ˆµMA,a(t) est univari´e;

Et si on s’int´eresse aux propri´et´es asymptotiques de ˆµMA,a pour tout t dans [0,T]?

On veut d´eduire la convergence uniforme de ˆµMA,a qui fait intervenir la fonction supt∈[0,T]:

P supt∈[0,T]|ˆµMA,a(t)−µ(t)|> ε

→0

On se place dans l’espace des fonctions continues sur [0,T],not´e C[0,T].

(17)

L’espace C [0, T ]

Les processus ˆµMA,a etµ sont des ´el´ements de l’espaceC[0,T] muni de la m´etrique

ρ(x,y) = sup

t∈[0,T]

|x(t)−y(t)|

ˆ

µMA,a converge en probabilit´e versµ(selon ρ), ˆµMA,aP µ, si P supt∈[0,T]|ˆµMA,a(t)−µ(t)|> ε

→0 On utilise l’in´egalit´e de Cauchy-Schwarz pour montrer que ˆ

µMA,aP µ,

P supt∈[0,T]|ˆµMA,a(t)−µ(t)|> ε

≤ E supt∈[0,T]|ˆµMA,a(t)−µ(t)|2

ε2

(18)

La normalit´ e asymptotique

D´efinition: Xn converge en distribution versX,XnD X si E(f(Xn))→E(f(X))

pour f :C[0,T]→Rcontinue et born´ee.

Th´eor`eme (Prohorov): XnDX dansC[0,T] si est seulement si

1 tout vecteur fini-dimensionnel (Xn(t1), . . . ,Xn(tr)) converge en distribution vers (X(t1), . . . ,X(tr));

2 Xnest tendu (“tight”);

La condition (1) peut ˆetre obtenue facilement et pour (2), on peut utiliser les crit`eres donn´es dans Billingsley (1968);

D´efinition: Un processus Zde C[0,T] est gaussiensi toutes ses restrictions finies sont gaussiennes.

(19)

Cadre asymptotique: hypoth` eses

Sur le plan de sondage A1. lim

N→∞

n

N =π∈]0,1[.

A2. min

k∈Uπk λ >0, min

k6=lπkl λ>0 et lim sup

N→∞

nmax

k6=l klπkπl|<C1< Sur les trajectoires

A3. Il existeC2>0,C3>0 etβ >1/2 tels que pour tous (r,t)[0,T]×[0,T], 1

N X

k∈U

Yk(0)2<C2 and 1 N

X

k∈U

{Yk(t)Yk(r)}2<C3|tr|. Sur l’information auxiliaire

A4. Il existeC4>0 tel que kU,kxkk2<C4pour tousk U.

A5. On suppose que la matriceGest inversible estkG−1k<a−1.

(20)

Propri´ et´ es asymptotiques de β b

a

R´esultat: Si les points de discr´etisation satisfont

N→∞lim max

i={1,..,D−1}|ti+1−ti| =o(n−1), alors, il existe une constanteC >0 tel que,

nEp sup

t∈[0,T]

βba(t)−β(t)˜

!2

≤C.

o`uβ(t) =˜ G−1 1N P

UxkYk(t)

Il r´esulte queβbaP β˜dans l’espace C[0,T].

(21)

Propri´ et´ es asymptotiques de µ b

MA,a

R´esultat: Si les points de discr´etisation satisfont

N→∞lim max

i={1,..,D−1}|ti+1−ti| =o(n−1), alors il existe une constante C >0 tel que,

nEp sup

t∈[0,T]

|µbMA,a(t)−µ(t)|

!2

≤C.

Il r´esulte queµbMA,aP µ dans l’espaceC[0,T].

En particulier, l’erreur due `a l’interpolation est n´egligeable devant l’erreur due `a l’estimation.

(22)

L’estimateur de la variance de ˆ µ

MA,a

On peut montrer que

µbMA,aµ= ˜µµ+op(n−1/2),

o`u ˜µest l’estimateur par la diff´erence g´en´eralis´ee obtenu pour ˜β.

La covariance asymptotique debµMA,a est donn´ee par γMA(r,t) = 1

N2 X

k∈U

X

l∈U

klπkπl)Yk(r)x0kβ(r˜ ) πk

Yl(t)x0lβ(t)˜ πl

L’estimateur de la variance est

γbMA,a(r,t) = 1 N2

X

k,l∈s

πkl πkπl

πkl

·Yk,d(r)x0kβˆa(r) πk

·Yl,d(t)x0lβˆa(t) πl

,

(23)

Convergence de ˆ γ

MA,a

Deux hypoth`eses suppl´ementaires:

A6. limN→∞maxk6=l6=k06=l0∈U|E{(IkIlπkl)(Ik0Il0πk0l0)}|= 0;

A7. Il existeC5,C6>0 tels queN−1P

UYk(0)4<C5et N−1P

{Yk(t)Yk(r)}4<C6|tr|, pour tous (r,t)[0,T]2 On suppose que les points de discr´etisation satisfont

limN→∞maxi={1,..,D−1}|ti+1ti|=o(1).Alors, (r,t)[0,T]2, nEp{|bγMA,a(r,t)γMA(r,t)|} 0 et

nEp

( sup

t∈[0,T]

|bγMA,a(t,t)γMA(t,t)|

)

0.

(24)

Normalit´ e asymptotique

A8. On suppose que pour chaque t∈[0,1] fix´e,

MA(t,t)}−1/2(˜µ(t)−µ(t))→DN(0,1)

R´esultat. On suppose (A1)-(A5), (A8) et

limN→∞maxi={1,..,dN−1}|ti+1−ti| =o(n−1).Alors,

√n(µbMA,a−µ)→Z

o`uZ est un processus Gaussian de moyenne 0 et fonction de covariance γZ(r,t) = limn→+∞MA(r,t).

(25)

Bandes de confiance

Pour t[0,T] fix´e et sous l’hypoth`ese de normalit´e,l’intervalle de confiance asymptotique(1α)% deµest donn´e par

ˆ

µMA,a(t)±zασ(t)ˆ

n

,t [0,T] et ˆσ(t) = q

nbγMA,a(t,t)

Trouverune bande de confiance asymptotique (1α)% deµ P

µ(t)

ˆ

µMA,a(t)±cα

ˆ σ(t)

n

, ∀t[0,T]

= 1α,

(26)

P

µ(t)∈h ˆ

µMA,a(t)±cασ(t)ˆni

, ∀t ∈[0,T]

= P

supt∈[0,T]|Zˆ(t)/ˆσ| ≤cα

→P

supt∈[0,T]|Z(t)|/σ≤cα o`u Zˆ/ˆσ =√

n(ˆµMA,a−µ)/ˆσ →DZ/σ dansC[0,T].

La distribution de supt∈[0,T]|Zˆ(t)|/ˆσ(t) n’est connue que pour certains cas particuliers et elle est approxim´ee par des simulations (bootstrap parametrique, Cardot, Degras and Josserand, 2012).

Le cα est le quantile d’ordre (1−α)% de supt∈[0,T]|Zˆ(t)|/ˆσ(t)

(27)

La m´ ediane fonctionnelle: propri´ et´ es

mN = argminy∈L2[0,T]X

k∈U

||Yk−y||

On se place dansL2[0,T] qui est strictement convexe; la fonctionnelle sup n’est plus born´ee, donc on ne peut plus construire des bandes de confiance.

Si en plus lesYk,kU ne sont pas align´es,mN est la solution unique de l’´equation estimante

N

X

k=1

YkmN

||YkmN|| = 0 un indicateur plus robust que la courbe moyenne;

un indicateur central de la distribution deYk;

(28)

Calcul de la m´ ediane

La m´ediane est d´efinie de fa¸con implicite et elle est calcul´ee de par des m´ethodes it´eratives.

Plusieurs algorithmes ont ´et´e propos´es pour calculermN:

Vardi and Zhang (2000), Gervini (2008) mais ils n´ecessitent beaucoup de temps de calcul surtout si la taille de la population est grande;

plus rapides en utilisant les algorithmes stochastiques (Cardot, C´enac and Zitt, 2011);

On propose utiliser un ´echantillon al´eatoire dansU et estimer la m´ediane `a partir de cet ´echantillon (Chaouch and Goga,ISR, 2012).

(29)

Estimation de la m´ ediane par sondage

La courbe m´ediane mN ∈L2[0,T] est estim´ee par ˆ

mn= argminy∈L2[0,T]X

k∈s

||Yk −y||

πk

Si lesYk,k ∈s ne sont pas align´es, alors ˆmnest la solution unique de:

X

s

1 πk

Yk −mˆn

||Yk −mˆn|| = 0

Approche fonctionnel (Goga and Ruiz, 2012) : T(M,mN) = 0 et T( ˆM,mˆn) = 0 et la variation totale entre M et ˆM.

(30)

Linearization of ˆ m

n

.

Sous les hypoth`eses (A1)-(A3) et siN−1P

U||Yk −mN||−1 <∞, alors

mbn = mN+X

s

uk

πk −X

U

uk +op(n−1/2)

o`u uk = Γ−1

Yk−mN

||Yk−mN||

est la variable lin´earis´ee demN et Γ =X

U

1

||Yk−mN||

I−(Yk −mN)⊗(Yk −mN)

||Yk −mN||2

Pour estimer de fa¸con efficace ˆmn,on doit estimer de fa¸con efficace le total de uk

(31)

L’estimateur de la variance et aspects pratiques

L’estimateur de la variance est donn´e par varcp( ˆmn)(t) =X

s

X

s

πkl−πkπl

πkl ·ˆuk(t) πk ·uˆl(t)

πl Avec des points discretis´es, 0≤t1 ≤. . .≤tD on a

Yk = (Yk(t1), . . . ,Yk(tD))0,et on calcule ˆuk = (ˆuk(t1), . . . ,ˆuk(tD))0 comme suit:

bΓ·(bu1, . . . ,bun) =

Y1−mˆn

||Y1−mˆn||, . . . , Yn−mˆn

||Yn−mˆn||

avec bΓ=X

s

1 πk||Yk−mˆn||

ID− (Yk−mˆn)·(Yk−mˆn)0

||Yk −mˆn||2

(32)

Application aux courbes de charge ´ electriques.

Comparaison de plusieurs plans de sondage

1 On a une population de N= 18902 conteurs ´electriques install´es dans des petites et grandes entreprises;

2 La consommation d’´electricit´e est enregistr´ee tous les 30 minutes pendant deux semaines;

3 On veut estimer la courbe m´ediane de la consommation d’´electricit´e Yk de la deuxi`eme semaine en utilisant la consommation Xk de la premi`ere semaine comme information auxiliaire.

4 On a doncD = 336 mesures.

5 On s´electionne un ´echantillon de taillen = 2000 selon plusieurs plans de sondage;

(33)

Strat´ egies utilis´ ees

1 Sans information auxiliaire: sondage al´eatoire simple sans remise (SRSWOR);

2 Avec information auxiliaire au niveau du plan de sondage:

stratifi´e avec SRSWOR `a l’int´erieur de chaque strate et plusieurs allocations (STRAT);

proportionnel `a la taille sans remise (πPS);

3 Avec information auxiliaire au niveau de l’estimation:

l’estimateur assist´e par un mod`ele lin´eaire;

l’estimateur assist´e par un mod`ele non-param`etrique et lissage par des B-splines;

lissage par des B-splines de l’estimateurπps;

(34)

Plans πps et stratifi´ e

Le plan πps: la probabilit´e d’inclusionπk est proportionnelle `a ˜Xk,la consommation moyenne de la premi`ere semaine:

X˜k =

D

X

t=1

Xk(t)/D, k U.

Sondage stratifi´e: H= 4 strates construites en utilisant la variableXk; On utilise l’allocation proportionnelle etx-optimale.

(35)

0 50 100 150 200 250 300

100200300400500600700

Mean of consumption within strata

Hours

Mean of Y_k within strata

1 2 3 4

0 50 100 150 200 250 300

-0.010-0.0050.0000.0050.010

Mean of linearized variables within strata

Hours

Mean of u_k within strata

1 2 3 4

(a) (b)

Figure: (a) Moyenne de variablesYk `a l’int´erieur des strates. (b) Moyenne de variables lin´earis´eesuk `a l’int´erieur des strates

(36)

Comparaisons des diff´ erents plans

On veut estimer la courbe moyenne et m´ediane de la consommation d’´electricit´e pendant la deuxi`eme semaine;

On tire un ´echantillon de taillen= 2000 selon les plans pr´esent´es et on r´ealise I = 500 simulations;

Pour comparer ces diff´erents plans, on utilise le crit`ere suivant

R(θ) = Z T

0

|bθ(t)−θ(t)|dt ' 1 D

D

X

d=1

|bθ(td)−θ(td)|

o`u θ est µoumN.

(37)

SRSWOR STRAT+OPT STRAT+PROP PIPS

51015

Boxplot des erreurs absolues, estimation moyenne

SRSWOR STRAT+OPT STRAT+PROP PIPS

05101520253035

Boxplot des erreurs absolues, estimation de la médiane

(a) Moyenne (b)M´ediane

(38)

Mean 1st quartile median 3rd quartile

SRSWOR 4.723 2.366 3.718 6.27

PROP 3.507 2.092 2.918 4.356

OPTIM 2.437 1.62 2.07 2.914

πPS 1.837 1.467 1.723 2.092

MA 1.942 1.571 1.864 2.211

Table: Erreurs d’estimation pourµ.

Mean 1st quartile median 3rd quartile

SRSWOR 2.65 1.30 2.16 3.56

PROP 1.737 1.047 1.486 2.248

OPTIM 2.294 1.466 1.979 2.783

πPS 7.399 2.869 6.05 10.48

MA 2.198 1.202 1.829 2.855

Table: Erreurs d’estimation pour mN.

(39)

Am´ eliorer l’estimation de m

N

avec πps en utilisant un lissage non-parametrique par des Bsplines des poids

Le planπps est efficace si la relation entreYk et lesπk est Yk(t)

πk

=β(t) +εkt

Dans le cas de mN, la relation entre la variable lin´earis´eeuk et πk =nX˜k/P

UX˜k estnon-lin´eaire,

uk(t) =fk,t) +εkt

On prendxk =πk =nX˜k/P

UX˜k et les poids wks= 1

πk

X

U

b0k)

! X

s

b(πk)b0k) πk

!−1

b(πk)

(40)

Estimation de la m´ ediane avec un seul ´ echantillon

0 50 100 150 200 250 300

80100120140160180200

Estimation of the mediane with a Pips sampling and Bspline Pips sampling

Hours

Electricity consumption

Pips Pips-Bspline True Median

(41)

Le plan πps ”versus” le πps-Bspline

n= 2000, 500 sim Mean 1st quartile median 3rd quartile

πPS 7.3990 2.8690 6.05 10.48

πPS-spline 1.9260 1.3650 1.672 2.131

pips pips.spline

05101520253035

(42)

L’estimation non-param` etrique de la m´ ediane

1 On consid`ere l’information auxiliairexk = ˜Xk,la consommation moyenne de la premi`ere semaine.

2 Les poids non-parametrique sont wks = π1

k

P

Ub0( ˜Xk) P

s

b( ˜Xk)b0( ˜Xk) πk

−1

b( ˜Xk)

3 La m´ediane mN est estim´ee en utilisant les poids wks X

s

wks Yk−mˆn

||Yk−mˆn|| = 0.

4 Simulations : fonctions Bspline quadratiques (m=3) etK = 8 noeuds int´erieurs;

(43)

SRSWOR versus MODEL-ASSISTED lin´ eaire et non-param` etrique

n= 2000, 500 sim Moyenne 1st quartile median 3rd quartile

SRSWOR 2.6680 1.308 2.175 3.613

MA 2.198 1.202 1.829 2.855

MA BSplines 1.17 0.9047 1.120 1.350

SRSWOR MA BSPLINES-MA

24681012

Boxplot des erreurs absolues, estimation médiane

(44)

Taux de couverture et bandes de confiance

0 50 100 150

100150200250300350

Heure

Consommation électrique (kw−h)

Moyenne observée sur U Moyenne estimée Bande de confiance

(45)

M´ethodes Nombre M de processus α=0.05 α=0.01

SRSWOR 5000 94.80 98.70

STRAT +OPT 5000 94 98.55

πps 1000 93.87 98.61

MA 5000 92.85 98.15

Table: Taux de couverture empirique (en %), pourI=2000 r´eplications.

(46)

Conclusion et perspectives

Construction d’un estimateur fonctionnel de la courbe moyenne bas´e sur un mod`ele lin´eaire avec des propri´et´es asymptotiques:

convergence uniforme et normalit´e asymptotique;

Construction d’un estimateur fonctionnel de la courbe m´ediane et son lin´earisation.

Perspectives:

Estimation d’autres param`etres d’int´erˆet;

Prise en compte de la non-response;

Prise en compte de l’aspect temporel dans la construction des poids;

. . .

(47)

Courte bibliographie

Cardot, H. C´enac, P. and Zitt, P.A. (2012),Efficient and fast estimation of the geometric median in Hilbert spaces with an averaged stochastic gradient algorithm. Bernoulli, to appear.

Cardot, H. and Josserand, E. (2011), Horvitz-Thompson estimators for functional data: asymptotic confidence bands and optimal allocation for stratified sampling. Biometrika, 98, 107-118.

Cardot, C, Dessertaine, A., Josserand, E., Goga, C. and Lardin, P. (2012), Comparaison de diff´erents plans de sondage et construction de bandes de confiance pour l’estimation de la moyenne de donn´ees fonctionnelles : une illustration sur la consommation ´electrique, `a paraˆıtre, Survey Methodology.

Cardot, H., Goga, C. and Lardin, P. (2012),Uniform convergence and asymptotic confidence bands for model-assisted estimators of the mean of sampled functional data, en r´evision for EJS.

Cardot, H., Goga, C. and Lardin, P. (2012),Variance estimation and asymptotic confidence bands for the mean estimator of sampled functional data with high entropy unequal probability sampling designs (soumis)

(48)

Chaouch, M. and Goga, C. (2012),On the estimation of the L1-median of a functional variable with complex surveys: application to the electricity load curves, International Statistical Review, Special Issue on Energy, 80, 40-59.

Gervini, D. (2008),Robust functional estimation using the spatial median and spherical principal components. Biometrika, 95, 587-600.

Goga, C. (2011),Improving the estimation of the functional median using survey data and B-spline modeling, in work.

Goga, C. and Ruiz-Gazen, A. (2012),Efficient Estimation of Nonlinear Finite Population Parameters using Nonparametrics, soumis.

Vardi, Y. and Zhang, C.H. (2000). The multivariate L1-median and associated data depth. Proc. Natl. Acad. Sci. USA, 97, 1423-1426.

Références

Documents relatifs

[r]

Comparaison de différents plans de sondage et construction de bandes de confiance pour l’estimation de la moyenne de données fonctionnelles : une illustration sur la

Interrogeons nous maintenant sur la fa¸con dont sont construits ces tests multidimensionnels, autrement dit sur la fa¸con dont sont obtenues les matrices E pour les erreurs du

Une exp´ erience par coloration a montr´ e qu’une rivi` ere souterraine alimente une r´ esurgence dans la vall´ ee. La rivi` ere souterraine a un d´ ebit tr` es sensible aux

Ecrire en Java la gestion d’un tas, repr´esent´e par un tableau : cr´eer, ins´erer, minimum, supprimer (le minimum), modifier une valeur.. Vous programmerez ceci en TP, et

On fixe une cat´ egorie C et on prend comme objets les couples (R, M ) d’une monade R sur C et d’un R-module M. Que peut-on prendre comme morphismes pour faire une cat´

Perdre ses photos de vacances : ¸ca n’a pas de

Programme des enseignements – Syst` emes d’information et conception d’entrepˆ ots de donn´ ees – Les principes et la d´ emarche du Data Mining (fouille de donn´ ees)