y 1 x 1,1 x 1,2

(1)

P. Ailliot

30novembre 2011

1 Introdution aux méthodes de régression

L'objetifgénéraldelarégressionest d'expliquerunevariable

Y

^,^dite^réponse,^variable^exogène

ouvariable àexpliquer,enfontionde

p

^variables

x 1 , ..., x p

^,^dites^variablesexpliativesou endogènes.Ondisposed'observationsdeesvariablessur

n

^individus,^'est^à^dire^d'un^tableau^de

donnéesdelaforme:

y 1 x 1,1 x 1,2

^.^.^.

x 1,p

y 2 x 2,1 x 2,2

^.^.^.

x 2,p

.

. .

.

. .

.

. .

.

. .

.

y n x n,1 x n,2

^.^.^.

x n,p

Table1Lignes:individus,Colonnes:variables

Lapremièreolonneest lavariableàprédireàpartirdesvariablesexpliativesdonnéesdansles

p

dernièresolonnes.

Lesméthodesderégressionsonttrès ourammentutiliséesenassuraneetennane.Deux

exemplesserontpluspréisémentétudiésdansleadredeeours:

Assuranedommage:lesmodèlesderégressionsontourammentutiliséspourprévoirla

primepured'unassuréenfontiondesonprol. Onherheparexempleàprédirelenombre

etlesmontantsdessinistresd'unassuréauours d'uneannée enfontiondesonsexe,sonâge,

sonmétier(CSP),larégionoùilvit,etand'adapter aumieux latariationauprolde

l'assuré...

Tables de mortalité :lestablesdemortalitésdériventladémographied'unepopulation

donnée,typiquementlenombre

N x,t

^de^survivants^qui^ont^l'âge

x

^l'année

t

^.^Les^modèles^de

régressionsontourammentutiliséspourprévoirl'évolutionfuturedelapopulationetréaliser

destables demortalitéprospetives.Cestables prospetivessontutiliséespourdebombreux

alulsatuarielsenassuranevie.

Cesdiérentesvariablespeuventêtresoit

quantitatives à valeurs ontinues(ex:age,température,montant...)

quantitatives à valeurs disrètes,parexempleàvaleursbinaires(ex:présene/absene

d'unemaladie)ouentières(ex:nombredesinistres)

qualitatives (ex:CSP,région,sexe).

Lanature desvariablesonditionnefortementlaméthodederégressionutilisée:

danslehapitre4,touteslesvariablessontsupposéesêtrequantitativesontinueset on

introduiralarégression linéairemultiplequiest unegénéralisationdelarégression

linéairesimpleétudiée enL3

(2)

maisonautoriseraertainesvariablesexpliativesàêtrequalitativesouquantitativesdisrètes

etonintroduiral'analyse de lavarianeet l'analyse de la ovariane

Leshapitres2et3sontdesrappelsdesoursdeL3etsontdespré-requisdeeours.Le

hapitre2rappelleertainesnotionsessentiellesduours destatistique:estimation, intervallede

onane,test statistique,méthodedumaximumdevraisemblane,...Lehapitre3rappelle

ertainespropriétésdesveteursgaussiensetdesprojetionsorthogonales.Cesontlesprinipaux

outilsmathématiques utilisésdanslesdémonstrationsdeshapitres4et5.

2 Introdution à la statistique inférentielle

Pourplusdedétails,onpourraonsulter lesouvragessuivants:

HussonF.etPagèsJ.(2005),Statistiquesgénéralespour utilisateurs.2- Exeries etorrigés,

PressesUniversitairesdeRennes.

Knight,K.(1999),Mathematial Statistis,Chapman andHall.

PagèsJ.(2005),Statistiques générales pourutilisateurs. 1- Méthodologie, PressesUniversitaires

deRennes.

Saporta,G.(2006),Probabilités,analysesdesdonnéesetstatistiques,EditionsTehnip,2eédition.

2.1 Introdution

Lesexemplesi-dessousservirontàillustrerehapitre:

Exemple1: ontrle de qualité.Un lientommandeàsonfournisseurunlotde10000

thermomètres.Andetesterlaqualitédesthermomètres,lelientenhoisit20auhasardet

lesplonge dansunliquideà20degrés.Ilobtientlesrésultatssuivants:

20.2,20.4,20.1,19.9,19.7,20,20.5,19.9,19.9,20.1,20.4,20.6,20,19.8,20.3,19.6,19.8,20.1,

20.3,20

Quepeut-onendéduiresurlaqualitédesthermomètres?Est-equ'ilsdonnentlabonne

températureenmoyenne?Avequellepréision?

Exemple2: sondage.And'estimerlesintentionsdevotelorsdudeuxièmetourd'une

eletionprésidentielle,uninstitut réaliseunsondage.Sur1000personnes interrogéesau

hasard,520pensentvoterpourleandidatAet 480pourleandidatB.Quepeut-onen

déduiresurlesintentionsdevotedanslapopulationFrançaise?Avequellepréisionle

sondageeetué permet t'ild'estimerlepourentaged'intentiondevoteenfaveurduandidat

A?Peutondéduiredeesondage,aveune ertaineonane,queàladatedusondagele

andidatAestentête?

Exemple3: eaité d'un médiamenten médeine.And'étudierl'eetd'un

nouveaumédiamentenvuederéduirelatensionartérielle,onamesurélatension(enmmde

Hg)sur12patientsavantet aprèstraitement.Lesvaleurssuivantesontétéobtenues:

Avant 200 174 198 170 179 182 193 209 185 155 169 210

Après 191 170 177 167 159 151 176 183 159 145 146 177

Peut-ononlurequeemédiamentréduitlatensionartérielle?

Ondisposedonde

n

observationsnotées

(x 1 , ..., x n ) ∈ R ⁿ

^(fêxemplesî-dessus).Ôn^va

supposertoutd'abordqueesobservationssontuneréalisationd'uneexpérienealéatoire,'està

direqu'ilexistedesvariablesaléatoiresréelles

(X 1 , ..., X n )

^dénies ^sur^un^espaeprobabilisé

(Ω, F , P)

^telles^que

(x 1 , ..., x n ) = (X 1 (ω), ..., X n (ω))

^ave

ω ∈ Ω

^.

Ceipermet demodéliserl'aléatoirequiestgénéralementprésentedanslereueildesdonnées.

Parexemple,danslesexemplesintroduits i-dessus:

(3)

parmiungrandnombred'individus.Si onreommenel'expériene,ilyadefortes hanes

qu'onhoisissed'autresindividuset qu'onobtiennedesrésultatsdiérents:lerésultatde

l'expérieneestdonbien"aléatoire".

Exemples1et3 :aprèsavoirhoisilesindividus,onréalisedesmesuresquipeuventêtre

sujettesàdeserreursexpérimentales.Cei rajoutedel'inertitudeauxrésultatsobtenus.

Onfaitensuitedeshypothèsessurlaloideprobabilitédun-uplet

(X 1 , ..., X n )

^.^Dans ^le^adre

de e hapitre, onsupposera que e sontdes variablesaléatoires indépendantes et

identiquement distribuées(i.i.d). Ils'agitduadreleplussimple,maisettehypothèsen'est

pastoujoursréaliste:

Lorsqu'ononsidèredesphénomènesindexésparletemps(foursM2surlesséries

temporelles),l'hypothèsed'indépendanen'estgénéralementpasvériée. Parexemple,si

(x 1 , x 2 , ..., x n )

^désigne^le^ours^d'un^produit ^nanier^pendant

n

^jours^suessifs,^alors^on^ne

peutgénéralementpassupposéequelesobservationssuessives

x i

^et

x i+1

proviennentde variablesaléatoiresindépendantes.

Lorsquel'onherheàprédireunevariable(variable àexpliquer)àpartird'autresvariables

(variablesexpliatives),onsupposegénéralementquelaloidelavariableàexpliquerdépend

desvariablesexpliatives.L'hypothèseidentiquementdistribuée n'estplusvériée.Ce serala

asdanslesmodèlesderégressionétudiésdansleshapitressuivants.

Dénition. On appellen-éhantillond'une loide probabilité

P

^une ^suite

(X 1 , ..., X n )

^de ^v.a.

i.i.d. quisuiventle loide probabilité

P

^.^On ^notera

X 1 , ..., X n ∼ ^iid P

Onvaensuitesupposer,dansehapitre,quelaloideprobabilitéommune de

X 1

^,

X 2

^,^...,

X n

estunloideprobabilitéquidépendd'unparamètre inonnu

θ ∈ Θ

^ave

Θ ⊂ R ^k

(statistique paramétrique paroppositionàstatistiquenonparamétrique).Onnoteraalors

X 1 , ..., X n ∼ ^iid P θ

Parexemple,onsupposerasouventque

X i ∼ ^iid N (µ, σ ² )

pour

i ∈ { 1...n }

^.^Le^paramètreînonnuêstâlors

θ = (µ, σ) ∈ R × R ⁺ ^∗

^.

Onherhealorsàestimer

θ

^à^partir^desobservationsdisponibles

(x 1 , ..., x n )

^.

Dénition. Soit

(X 1 , ..., X n )

^unn-éhantillond'une loi

P θ

^.Ûnêstimateur^du ^pâramètre

inonnu

θ

êst ûne^variable âléatoire

T = g(X 1 , ..., X n )

^qui ^s'exprime^en ^fontion^de

(X 1 , ..., X n )

^.

Uneestimation de

θ

êstâlors ^la ^valeur ^numérique ^prise^par êttestatistiquesurune réalisation partiulière

(x 1 , ..., x n )

^,^'est ^à^dire^la ^quantité

t = g(x 1 , ..., x n )

^.

Exempleetdénition. Prenons l'exemple 1surlaqualité desthermomètres. Onsupposeà

nouveauque

(x 1 , ..., x n )

^est ^uneréalisation d'unéhantillon

(X 1 , ..., X n )

^.^La^qualité^des

thermomètresest partiellement déritepar lesparamètresinonnus

µ = E[X i ]

^(si^les

thermomètressont de bonnequalité, alors ils devraient fournirla bonne températureenmoyenne,

'estàdirequ'on devrait avoir

µ = 20

⁾^et

σ ² = var[X i ]

^(qui^renseigne^sur^la^dispersion^de

mesuresautourdela valeur moyenne:si

σ = 0

^alors ^tous^lesthermomètres donnentla même valeur alorssi

σ

^est^grand, ^lesthermomètresindiquentdes températurestrèsdiérentes).

(4)

Unestimateurusuel de

µ

êstâlors ^la ^moyenne êmpirique^dénie^par

X ¯ = X 1 + ... + X n

n

Unestimateurusuel de

σ ²

^est^la ^variane ^empirique ^dénie^par

S ² =

P n i=1 X _i ²

n − X ¯ ² = 1 n

n

X

i=1

(X i − X) ¯ ²

Les estimationsorrespondantessont notées

x ¯ = ^x ¹ ^+...+x _n ⁿ

^et

s ² = ^P ⁿ ⁱ⁼¹ _n ^x ² ⁱ − x ¯ ²

^.Îi ônôbtient

¯

x = 20.08 ^o

^et

s = 0.2657 ^o

^.^Lesthermomètressemblentdon indiquer unetempératurelégèrement supérieurà

20 ⁰

^,^maisôn ^peut^se^demander ^siêtte^diérene êst^signiative^étant^donné ^la

faibletaillede l'éhantillon(20 thermomètres seulement)etla forte variabilité entreles

thermomètres. Les intervallesde onanesetlestest statistiquesvusdansla suitede eours

permettront derépondreàettequestion.

Exempleetdénition. Prenons l'exemple 2dusondagesurlesintentionsde vote lorsd'une

életion avedeuxandidats (notésA etB). Leparamètreinonnuestla proportion

π

d'intentionsde vote enfaveur de B dansla population totale. Pourestimer ettequantité,on

sonde1000personneshoisies auhasard,et onode lesrésultatsde la manièresuivante :

x i = 0

^si^la ^ième ^personne^sondée ^pense^voter^pour^A

x i = 1

^si^la ^ième ^personne^sondée ^pense^voter^pour^B

Onsupposeque

(x 1 , ..., x n )

^est^une réalisation d'unéhantillon

(X 1 , ..., X n )

^d'une ^loi^de ^Bernoulli

etleparamètreinonnu

θ = π = P[X i = 1]

^est ^le^paramètre^de^ette^loi ^de^Bernoulli. L'expériene aléatoire onsisteiiàhoisir les1000 personnesauhasardetde manièreindépendantedansla

"population totale".Unestimateur"naturel" de

π

êstâlors ^la ^fréquene êmpirique

F

^de

1

dansla séquene

(X 1 , ..., X n )

^,^'est ^à^dire ^:

F = card { i ∈ { 1...n }| X i = 1 }

n =

P n i=1 X i

n

Onretrouveunaspartiulier del'exemple préédentpuisque

π = E[X i ]

^et

F

^est^la ^moyenne

empiriquede l'éhantillon. Supposonsquelorsdusondage, on trouve que480personnespensent

voterenfaveur duandidat B (i.e. 480"1"dansla série

(x 1 , ..., x n )

^). ^Une^estimation ^de

π

^est

alors

f = card { i ∈ { 1...n }| x i = 1 }

n =

P n i=1 x i

n = 0.48

Remarque. Dans lasuiteduours,les variables aléatoires (parexemple

X i

^,

F

^,

S

⁾^sont ^notées

avedeslettresmajusules,lesobservations (

x i

⁾ ^et^lesestimations(

f

^,

s

⁾ ^ave ^des^lettres

minusules.Les paramètresinonnussont notésave deslettresgreques(parexemple

π

^,

µ

^,

σ

^).

2.2 La méthode du maximum de vraisemblane

Lafontiondevraisemblanedéniei-dessousjoueunrle fondamentalenstatistique.

Dénition. Si la loide probabilitéduveteur aléatoire

(X 1 , ..., X n )

^admet ^une^densité

f (x 1 , ..., x n ; θ)

^par^rapport^àûne ^mesure^dominante,âlors ôn âppêlle^fontion ^de

vraisemblanela fontionde

θ

^dénie^par

L(θ; x 1 , ..., x n ) = f (x 1 , ..., x n ; θ)

(5)

Dansleasdeséhantillons i.i.d.,la loide probabilité jointede

(X 1 , ..., X n )

^admet ^une ^densité

(parrapport àla mesureproduit)dèsquela loi marginalede

X i

^admet ^une^densité

f (x i ; θ)

^et^on

aalors

L(θ; x 1 , ..., x n ) =

n

Y

i=1

f (x i ; θ)

Enpratique:

Lorsqueles

X i

^sont ^des^variables âléatoire ^disrètes, âlors ônônsidère^la ^densité ^par^rapport ^à

la mesure deomptage et

f (x i ; θ) = P θ (X i = x i )

^.

L(θ; x 1 , ..., x n )

s'interprètealors diretement ommela probabilité ou"vraisemblane" d'observer

(x 1 , ..., x n )

^lorsque

θ

^est^la^vraie^valeur ^du

paramètre.

Laplupartdesloisusuellespour lesvariablesaléatoiresontinues(loinormale, loilog-normale,

loigamma,...) sontdéniesparleurs densités

f (x i ; θ)

par-rapportàla mesurede Lebesgue.

Onappellefontion de log-vraisemblane laquantité :

l(θ; x 1 , ..., x n ) = ln(L(θ; x 1 , ..., x n ))

Laméthode dumaximumde vraisemblane onsistealors,étantdonnéeuneréalisation

(x 1 , ..., x n )

^d'un^éhantillon^de ^loi

P θ

^,^à^prendre^omme ^estimation

t

^de

θ

^une ^valeur ^de

θ

^(si ^elle

existe...)qui rend maximalela fontionde vraisemblane

θ → L(θ; x 1 , ..., x n )

Onnotera

t = h(x 1 , ..., x n ) = argmax θ ∈ Θ L(θ; x 1 , ..., x n )

^.L'estimateur du maximum de vraisemblane(EMV)estalors l'estimateur

T = h(X 1 , ..., X n )

^.

Remarque. Enpratique, ontravaillesouventavela fontionde log-vraisemblane qui estplus

simpleàmanipuler (lepassage aulog permet de transformer leproduiten somme).Dans lesas

simples,uneétude de fontion(aluldesdérivéspremières etéventuellement seonde, tableaude

variation,...) permetde trouverlemaximumde

l

^.^Lorsque^e ^n'est^pas^possible, ^une ^méthode

d'optimisationnumérique estutilisée. AveR, onpeutparexemple utiliserla fontion tdistrdu

pakage MASS.

Exemple. Si

(X 1 , ..., X n )

^est ^un^éhantillon^d'une ^loi ^de^Bernoul^li^de ^paramètre

θ = π

^,^alors

1 − π si x i = 0

P π (X i = x i ) =

π si x i = 1

Cei se rééritsous laforme

P π (X i = x i ) = π ^x ⁱ (1 − π) ¹ ⁻ ^x ⁱ pour x i ∈ { 0, 1 }

Soit

(x 1 , ..., x n ) ∈ { 0, 1 } ⁿ

^une réalisationde

(X 1 , ..., X n )

^.^Lavraisemblaneest donnéepar

L(π; x 1 , ..., x n ) =

n

Y

i=1

P π (X i = x i )

=

n

Y

i=1

π ^x ⁱ (1 − π) ¹ ⁻ ^x ⁱ

= π ^P ⁿ ⁱ⁼¹ ^x ⁱ (1 − π) ⁿ ⁻ ^P ⁿ ⁱ⁼¹ ^x ⁱ

(6)

l(π; x 1 , ..., x n ) = ln(π)

n

X

i=1

x i + ln(1 − π)(n −

n

X

i=1

x i )

puisque

∂l(π; x 1 , ..., x n )

∂π

= P n

i=1 x i

π(1 − π) − n 1 − π

Don,enétudiant lesignede la dérivée, onen déduitquela fontionde vraisemblaneatteint

sonmaximumen

P n i=1 x i

n

^.^L'EMV ^est^don

F = ^P ⁿ ⁱ⁼¹ _n ^X ⁱ

^.^On^retrouve l'estimateurusuel.

Exemple. Ononsidèrelestempératuresjournalières (endegré Celsius)àBrest auoursde

l'été2008 donnéesdans letableaui-dessous :

16.4;14.25;14.5;11.8;13.65;12.2;11.6;13.2;16.9;17.1;16.75;15.2;12.5;12.45;13.65;

12.15;13.45;15.1;16.4;16.5;18.25;17.2;12.95;15.25;16.8;14.35;16.9;18.3;17.75;

15.85;16.1;16;14.4;14.35;16;14.65;14.2;15.05;15.75;16.7;16.05;14.9;15.9;14.5;

18.9;16.8;15.2;15.55;16.95;15.6;15.05;15.5;19.1;20.8;18.15;17.4;18.45;17.45;17.6;

19.25;17.95;17.4;17.95;17.1;16.4;17.95;19.4;17.05;17.35;15.4;17.15;15.8;15.6;

15.9;15.5;13.25;15.6;15.2;16.95;16.25;15.35;16.9;16.05;14.55;16.9;16.35;16.95;

16.3;16.05;16.35;17.85;16.65

1. Réaliser unhistogramme dees observations(on utiliseradeslasses de largeur1degréet

lelogiiel R).

2. Onsupposedansla suitede l'exeriequeesobservations sontune réalisation de n

variables aléatoires

(X 1 , ..., X n )

^i.i.d. ^de^loi

N (µ, σ ² )

^.^Cette ^hypothèse ^voussemble-t-elle réaliste?

3. Quel estl'estimateurdumaximumde vraisemblanede

θ = (µ, σ)

^?

4. Appliation numérique.Calulerlesestimations orrespondantessurlesdonnéesde

températurejournalièreàBrest,puis représenter surla gurede laquestion 1. la densité

orrespondante (attentionàl'éhelle!). Commentez.

Solution partielle : 3.Calulde la fontionde vraisemblane. Soit

(X 1 , ..., X n )

^un

n-éhantillond'une loi normalede moyenne

µ

^et^éart-type

σ

^,^alors ^la ^densité^de ^la ^v.a.

X i

^est

donnée, pour

x i ∈ R

^,^par^:

f θ (x i ) = 1

√ 2πσ exp

− (x i − µ) ² 2σ ²

ave

θ = (µ, σ)

^.^Don,^la ^fontion^de vraisemblaneestdonnée,pour

(x 1 , ..., x n ) ∈ R ⁿ

^une

réalisation de

(X 1 , ..., X n )

^,^par^:

L(θ; x 1 , ..., x n ) =

n

Y

i=1

f θ (x i )

=

n

Y

i=1

√ 1

2πσ exp

− (x i − µ) ² 2σ ²

= 1

(2π) ^n/2 σ ⁿ exp

− P n

i=1 (x i − µ) ² 2σ ²

L'étudedespointsritiques montrequeettefontionatteint son maximumpour

µ = ¯ x

^et

σ = s

^.

Pourla loinormale, lesestimateursdumaximumde vraisemblanede

µ

^et

σ ²

^oïnident^ave ^les

estimateursusuelsde l'espérane etde la variane.

4.Appliation numérique:

x ¯ = 15.9679 ^o

^et

s = 1.7846 ^o

^.

Graphique:f Figure1

(7)

10 12 14 16 18 20 22 0

0.05 0.1 0.15 0.2 0.25 0.3 0.35

Figure1Histogrammedestempératureset densitédelaloinormaleajustée

2.3 Propriétés des estimateurs

Onpeuttoujoursdéniruneinnitéd'estimateurspourunparamètreinonnudonné,eten

pratiqueonherheraàutiliserle"meilleur" deesestimateurs.Ceinéessitededénire

qu'estunbonestimateur.

2.3.1 Biais d'un estimateur

Dénition. On appelle biaisde l'estimateurTla quantité

biais(T ) = E(T ) − θ

Onditquel'estimateur

T

^est^sans ^biais ^lorsque

biais(T ) = 0

^,^'est ^à^dire^lorsque

E[T ] = θ

^.^Le

biaisreprésente "l'erreur moyenne" quiest faite lorsqu'on utilise

T

^pour^estimer

θ

^.

Proposition. Si

(X 1 , ..., X n )

^est^unn-éhantillond'une loi de moyenne

E[X i ] = µ

^,^alors

X ¯

^est

unestimateursans biaisde

µ

^.

Enpartiulier, si

(X 1 , ..., X n )

^est^unn-éhantillonde Bernoulli de paramètre

π

^alors

F

^est^un

estimateursansbiaisde

π

^.

Sionsupposeen outreque

σ ² < ∞

^alors

E[S ² ] = ⁿ ⁻ _n ¹ σ ²

^.

S ²

êst^don ûnêstimateur^biaisé ^de

σ ²

^,êtôn ^préfère^parfoisûtilisél'estimateur orrigé

S _corr ² = n

n − 1 S ² = 1 n − 1

n

X

i=1

(X i − X ¯ ) ²

qui estunestimateursans biaisde

σ ²

^.

Remarque. Denombreuxlogiiels statistiques(Exel, R, ...)alulent pardéfautl'estimateur

sansbiaisde la variane

S _corr ²

^déni^i-dessus.

Démonstration. Si

(X 1 , ..., X n )

^est ^unn-éhantillond'uneloid'espérane

µ

^alors

E[ ¯ X] = E[ X 1 + ... + X n

n ]

= E[X 1 ] + ... + E[X n ]

= µ n

(8)

Onsupposeque

σ ² < ∞

^.^Par^dénition,

S ² = 1

n

X

i=1

(X i − X) ¯ ²

etdeladéomposition

(X i − X) = (X ¯ i − µ) − ( ¯ X − µ)

^,^on^déduit^que^:

S ² = 1

n

X

i=1

(X i − µ) ² − 2( ¯ X − µ)(X i − µ) + ( ¯ X − µ) ²

= 1

n

X

i=1

(X i − µ) ² − 2( ¯ X − µ) 1 n

n

X

i=1

(X i − µ) + ( ¯ X − µ) ²

= 1

n

X

i=1

(X i − µ) ² − ( ¯ X − µ) ²

Don

E[S ² ] = E[ 1 n

n

X

i=1

(X i − µ) ² − ( ¯ X − µ) ² ]

= 1

n

X

i=1

E[(X i − µ) ² ] − E[( ¯ X − µ) ² ]

= σ ² − E[( ¯ X − µ) ² ]

Ilresteàaluler

E[( ¯ X − µ) ² ] = var( ¯ X)

= var( 1 n

n

X

i=1

X i )

= 1

n ² var(

n

X

i=1

X i )

= 1

n ²

n

X

i=1

var(X i )

= σ ² n

Finalement,

E[S ² ] = n − 1 n σ ²

2.3.2 Erreur quadratiquemoyenned'un estimateur

Onmesuregénéralementlapréisiond'unestimateurparsonerreurquadratiquemoyenne.

Dénition. L'erreur quadratique moyenne(EQM) de l'estimateur

T

^dénie^par

EQM (T ) = E[(T − θ) ² ]

L'EQMreprésente l'espérane duarréde l'éart entrel'estimateuretleparamètreinonnu:plus

l'EQMest faible,plusl'estimateurestpréis.

(9)

0 1 2 0

0.5 1 1.5 2

β ₀

β 1

0 1 2

0 0.5 1 1.5 2

β ₀

β 1

0 1 2

0 0.5 1 1.5 2

β ₀

β 1

Figure 2 Plusieurs réalisations de trois estimateurs diérents. La vraie valeur du paramètre

est le entre de laible (point de oordonnés

(1, 1)

^). ^Le^premier ^estimateur ^(gure ^de ^gauhe)

est biaisé (on vise systématiquement tropen bas et à gauhe), alors que les deuxième (gure

dumilieu) et troisième estimateurs (gure de droite) sont non-biaisés. Lavariane dudeuxième

estimateurestplusfortequeelledutroisième estimateur.

Remarque. Onmontrefailementque

E[(T − θ) ² ] = var(T ) + E[(T − θ)] ²

'estàdirequel'erreur quadratiquemoyenneestégaleàla variane del'estimateur pluslebiais

del'estimateur auarré. Lorsquel'estimateurest non-biaisé,l'EQMoïnide avela variane:

parmideuxestimateurssans biais, lepluspréis estdon elui de varianeminimale (f Figure

2.3.2:lemeilleur estimateuresteluide droite).Cetteformule estégalementutileen pratique

pouraluler l'EQMdesestimateursusuels.

Proposition. Si

(X 1 , ..., X n )

^est^unn-éhantillond'une loi de moyenne

µ

^et^de ^variane

σ ² < ∞

^,^alors

EQM ( ¯ X ) = var( ¯ X ) = σ ² n

Enpartiulier, si

(X 1 , ..., X n )

^est^un^éhantillon ^de ^Bernoulli ^de^paramètre

π

^alors

EQM (F ) = var(F ) = π(1 − π)

n

Side plus

µ 4 = E[(X i − µ) ⁴ ] < ∞

^,^alors

EQM (S _corr ² ) = var(S ² _corr ) = µ 4

n − n − 3 n(n − 1) σ ⁴

Démonstration. (partielle)

Soit

(X 1 , ..., X n )

^est ^un^éhantillon^d'une^loi^de^moyenne

µ

^et^de^variane

σ < ∞

^.^On^a^vu^que

X ¯

(10)

estunestimateursansbiaisde

µ

^et^don

EQM ( ¯ X ) = var( ¯ X)

= var( X 1 + ... + X n

n )

= var(X 1 ) + ... + var(X n ) n ²

= σ ² n

Lealulde

var(S _corr ² )

^est^plus^déliat...

2.3.3 L'informationde Fisher

Dénition. On appellequantité d'information de Fisherapportée par unn-éhantillonsur

leparamètre

θ

^la ^quantité^suivante ^(si^elle^existe)

I n (θ) = E[

∂l(θ; X 1 , ..., X n )

∂θ

2 ]

Enpratique,ilestsouventplusfailed'utiliserl'une desdeuxformulesdonnéesdansla

propositionsuivantepouralulerl'information deFisher.

Proposition. Sous desonditionsgénérales (f remarquei-dessous),on a:

I n (θ) = var(

∂l(θ; X 1 , ..., X n )

∂θ

)

I n (θ) = − E[

∂ ² l(θ; X 1 , ..., X n )

∂θ ²

]

Démonstration. Onseplae dansleasdesvariablesontinues.Lapreuvedansleasdisret est

similaireenremplaçantlessignes

R

pardessignes

P

.Onpartdelarelation:

Z

R ⁿ

L(θ; x 1 , ..., x n )dx 1 ...dx n = 1

^(2.1)

quivientdufaitque

L(θ; x 1 , ..., x n )

^est ^la^loi^deprobabilitéd'unn-éhantillon

(X 1 , ..., X n )

^de^la

loi

P θ

^.^Notons^que,^plusgénéralement,si

g : R ⁿ → R

^,^on^a

E[g(X 1 , ..., X n )] =

Z

R ⁿ

g(x 1 , ..., x n )L(θ; x 1 , ..., x n )dx 1 ...dx n

Ensuite,pardénitionde

l

^,^on^a

∂L(θ; X 1 , ..., X n )

∂θ = L(θ; X 1 , ..., X n ) ∂l(θ; X 1 , ..., X n )

∂θ

^(2.2)

Endérivant(2.1)parrapportà

θ

^,^et ^en^supposant^qu'on^puisseintervertirlessignes

R

et

∂

^,^on

obtient

0 = ∂

∂θ Z

R ⁿ

L(θ; x 1 , ..., x n )dx 1 ...dx n

= Z

R ⁿ

∂

∂θ L(θ; x 1 , ..., x n )dx 1 ...dx n

(11)

Z

R ⁿ

L(θ; X 1 , ..., X n ) ∂l(θ; X 1 , ..., X n )

∂θ dx 1 ...dx n = 0

^(2.3)

Parailleurs,d'aprèslaremarquepréédente,ona

Z

R ⁿ

L(θ; X 1 , ..., X n ) ∂l(θ; X 1 , ..., X n )

∂θ dx 1 ...dx n = E[ ∂l(θ; X 1 , ..., X n )

∂θ ]

Onadon

E[ ^∂l(θ;X _∂θ ¹ ^,...,X ⁿ ⁾ ] = 0

^puis

I n (θ) = E[

∂l(θ; X 1 , ..., X n )

∂θ

2 ]

puisquelav.a.

∂l(θ;X 1 ,...,X n )

∂θ

^est^entrée.

Endérivant(2.3)parrapportà

θ

^,^on^obtient

Z

R ⁿ

L(θ; X 1 , ..., X n ) ∂ ² l(θ; X 1 , ..., X n )

∂θ ² +

Z

R ⁿ

∂

∂θ L(θ; X 1 , ..., X n ) ∂

∂θ l(θ; X 1 , ..., X n ) = 0

Puis,enutilisantànouveaul'égalité

∂L(θ;X 1 ,...,X n )

∂θ = L(θ; X 1 , ..., X n ) ^∂l(θ;X _∂θ ¹ ^,...,X ⁿ ⁾

^,^on^obtient^la

deuxièmeégalitédelaproposition.

Remarque. 1. Pour quela propositionpréédentes'applique, il fautdon pouvoirdériver la

vraisemblane deuxfoisparrapportà

θ

^(pour^tout^x)^et intervertirlessignes

∂

^et

R

.Ces

hypothèsessont vériéesparleslois usuellesdèsquelesupportde laloi, 'est àdire

l'ensemble

A θ = { x | f (x; θ) ≥ 0 }

^,^ne ^dépend^pas^de

θ

^.^Un^exemple ^lassique^pour^lequel^le

supportde la loidépend de

θ

êst ^laâsôù ^les

X i

^suivent^une ^loi^uniforme^sur

[0, θ]

^.^On

vériealors quelesformules de la proposition préédentene sont pasvériées.

2. Enutilisantla dénition de la log-vraisemblanedansleasdeséhantillons i.i.d.,il est

faile de vérierque

l(θ; x 1 , ..., x n ) = P n

i=1 l(θ; x i )

^. Ônên^déduit âisément^que,^si^la

proposition préédentes'applique, alors

I n (θ) = nI 1 (θ)

Exemple. Si

(X 1 , ..., X n )

θ = π

^,^alors

l(π; x 1 , ..., x n ) =

n

X

i=1

x i ln(π) + (n −

n

X

i=1

x i )ln(1 − π)

Don

∂l(π; x 1 , ..., x n )

∂π

= P n

i=1 x i

v +

P n

i=1 x i − n 1 − π

= P n

i=1 x i

π(1 − π) − n 1 − π

Onendéduit que

E[ _∂l(π;x

1 ,...,x n )

∂π

] = 0

^et^don ^que

E[ _∂l(π;x

1 ,...,x n )

∂π

] = var( _∂l(π;x

1 ,...,x n )

∂π

)

^,

puisquel'information de Fisher estdonnéepar

I n (π) = var(

P n i=1 X i

π(1 − π) − n π )

= n

π(1 − π)

(12)

∂ ²

∂p ² l(π; x 1 , ..., x n ) =

n

X

i=1

x i

1 − 2p

π ² (1 − π) ² + n (1 − π) ²

puis

E[ ∂ ²

∂π ² l(π; x 1 , ..., x n )] = − n π(1 − π)

Onretrouvebien lemêmerésultat.

Lethéorèmesuivantestfondamental enstatistiqueinférentielle.

Théorème. (Borne de Fréhet-Darmois-Cramer-Rao (FDCR))

Sousdesonditions générales (f remarquei-dessous),si

T

êstûne êstimateur^sans ^biais^de

θ

alors:

var(T ) ≥ 1 I n (θ)

Plusgénéralement,si

T

êst ûnêstimateur^sans ^biais^de

g(θ)

^,^alors ^:

var(T ) ≥ (h ^′ (θ)) ²

I n (θ)

Démonstration. Onseplae toujoursdansleasdesvariablesontinues.

Onutilisel'inégalitédeCauhy-Shwartz:

cov(T, ∂

∂θ l(θ)) ² ≤ var(T )var( ∂

∂θ l(θ))

Ensuite,

cov(T, _∂θ ^∂ l(θ)) = E[T _∂θ ^∂ l(θ)]

^ar

_∂θ ^∂ l(θ)

^est^entrée.^Don

cov(T, ∂

∂θ l(θ)) = Z

R ⁿ

T (x 1 , ..., x n ) ∂

∂θ l(θ; x 1 , ..., x n )L(θ; x 1 , ..., x n )dx 1 ...dx n

= Z

R ⁿ

T (x 1 , ..., x n ) ∂

∂θ L(θ; x 1 , ..., x n )dx 1 ...dx n

= ∂

∂θ Z

R ⁿ

T (x 1 , ..., x n )L(θ; x 1 , ..., x n )dx 1 ...dx n

= ∂

∂θ E[T ]

= g ^′ (θ)

Remarque. Anouveau, pourquelethéorèmepréédents'applique, il fautpouvoirdériver la

vraisemblane deuxfois par rapport à

θ

^(pour ^tout^x)^etintervertir lessignes

∂

^et

R

.Ces

onditionssont généralementvériées lorsquelesupport dela loi nedépend pasde

θ

^.

LethéorèmedeFDCRdonneuneborneinférieurepourlavarianed'unestimateursansbiais.

Ondiraqu'unestimateursans biais esteaelorsquesavarianeestégaleàla borne de

FDCR.Plus laquantitéd'informationapportéeparl'éhantillonestgrande,plusborne deFDCR

estpetite.

Parailleurs,si ilexisteunestimateureae,alorsilestuniquep.s.En eet,soit

T 1

^et

T 2

^deux

estimateurseaesde

θ

^.

T 1

^et

T 2

^sont^don^sans^biais^et^leurs^varianes^sont^égales^à^la^borne

deFDCR

V

^.Considéronsl'estimateur

T 3 = ^T ¹ ^+T ₂ ²

^.

T 3

êst ûnêstimateur^sans^biais^de

θ

^de

variane

var(T 3 ) = ^V ₂ (1 + cor(T 1 , T 2 ))

^. ^Comme

var(T 3 ) ≥ V

^,^on^en^déduit ^que

cor(T 1 , T 2 ) = 1

puisque

T 1 = T 2 p.s.

(13)

Exemple. Si

(X 1 , ..., X n )

θ = π

^,^alors

l'informationde Fisher estdonnéepar

I n (π) = n π(1 − π)

Lethéorème de FDCRnous dit toutestimateursans biaisauraune varianesupérieureà

π(1 − π)

n

^.

Or,nous avonsvuque

F = ¹ _n (X 1 + ... + X n )

êstûnêstimateur^sans^biais^de

π

^et^que^sa^variane

estégale

I n (π) ⁻ ¹

^.Ônên ^déduit ^qu'il^s'agit^de ^l'unique êstimateurêae ^de

π

^,^et ^don ^le

meilleur(en unertainsens...)

2.3.4 Propriétés asymptotiques

Onnoteradanseparagraphe

T n

^un^estimateur^de

θ

^basé^sur^un^éhantillon^de^taille

n

(X 1 , ..., X n )

^.Ûn^bonêstimateur^doitâvoir^de^bonnes"propriétésasymptotiques",'estàdiredes propriétésdeonvergenelorsque

n → ∞

^. ^Enpartiulier,onpréféreradesestimateursquisont onvergents(ouonsistants).

Dénition.

T n

êstûnêstimateurônvergent^de

θ

^lorsque

T n

^onverge^p.s.^vers

θ

^lorsque

n → ∞

^.

Proposition. Si

(X 1 , ..., X n )

^est^unn-éhantillond'une loi d'espérane

µ

^et^de ^variane

σ ² < ∞

alors

X ¯ n = X 1 + ... + X n

n

estunestimateuronvergentde

µ

^.^Enpartiulier, si

(X 1 , ..., X n )

^est^un^éhantillon^de ^Bernoulli

deparamètre

π

^alors

F n = X 1 + ... + X n

n

π

^.

Side plus

µ 4 = E[(X i − µ) ⁴ ] < ∞

^alors

S _n ² = X ₁ ² + ... + X _n ² n − X ¯ ²

et

S _n,corr ² = n

n − 1 S ² = 1 n − 1

n

X

i=1

(X i − X) ¯ ²

sontdesestimateursonvergentsde

σ ²

^.

Démonstration. Appliationsdiretesdelaloidesgrandsnombres(LGN).

DenombreuxestimateursvérientunTCL,'estàdiresonttelsque

√ n(T n − θ) → N ^L (0, σ ² (θ))

lorsque

n → ∞

^.^Ce^type^deomportementasymptotiqueestourammentutilisépouronstruire desintervallesdeonaneouréaliserdestests(fparagraphessuivants)et estdon

partiulièrementsouhaitable.Onparlerade"normalitéasymptotique".

Proposition. Soit

(X 1 , ..., X n )

^est^un^éhantillon^d'une ^loi^de ^moyenne

µ

^et^de^variane

σ ² < ∞

alors

√ n( ¯ X n − µ) → N ^L (0, σ ² )

lorsque

n → ∞

^.^En^p^artiulier, ^si

(X 1 , ..., X n )

^est^un^éhantillon ^de ^Bernoulli ^de^paramètre

π

^et

F n = ^X ¹ ^+...+X _n ⁿ

^,^alors

√ n(F n − π) → N ^L (0, π(1 − π))

lorsque

n → ∞

^.

(14)

Lapropositionsuivanteétablitquesousdesonditionsgénérales,l'EMV adebonnespropriétés

asymptotiques.

Proposition. Sous deshypothèses générales (f rqi-dessous),l'EMV estonvergent et

asymptotiquementgaussienet

√ n(T n − θ) → N ^L (0, 1 I 1 (θ) )

Remarque. 1. Onpeutdon en déduire, sous ertainesréserves, quepour

n

^grand

E[T n ] ≈ θ

et

var(T n ) ≈ I n ¹ (θ)

^.Ûn^telêstimateurêst^dit "asymptotiquementeae". Touteses bonnes propriétés(onvergene, normalité asympotitqueave varianeasymptotiqueonnue,

eaitéasymptotique) justientl'utilisation de la méthode dumaximumde vraisemblane

ommeméthode d'estimationpardéfaut enstatistique.

2. Pourque lethéorème préédent s'applique,il fautpouvoir dériver lavraisemblanetroisfois

parrapportà

θ

^(pour^tout^x),^pouvoirintervertir lessignes

∂

^et

R

etque

Θ

^soit ^un

ensembleouvert. Cesonditionssont généralementvériéeslorsquelesupportde laloi ne

dépend pas de

θ

^.

2.4 Estimation par intervalle de onane

Danslesparagraphespréédents,desméthodespermettantd'estimerlavaleurd'unparamètre

inonnu

θ

^à^partird'observationsontétéproposées.Cesméthodesfournissentseulementune valeur("estimation pontuelle"),maisnepermettentpasdequantierlapréisiondeette

estimation.Pourela,onutilisegénéralementdesintervallesdeonanequipeuvent

s'interpréterommedesmargesd'erreur.

2.4.1 Constrution d'intervallesde onanepourla moyenned'un éhantillon

Gaussien lorsquela variane est onnue

Onsupposedanseparagrapheque

X 1 , ..., X n

^est^unn-éhantillond'uneloi

N (µ, σ ² )

^.^On

herheàestimer

µ

^,^supposé^inonnu,^mais^on^suppose^quel'éart-type

σ

êst ônnu.^Cei êst

rarementleasenpratique,et easpartiulieradonprinipalementunobjetifpédagogique.

Nousreviendronssurlaonstrutiond'intervallesdeonanelamoyenned'unéhantillonsous

deshypothèsesplusréalistesdanslasuitedeeours.

Aveleshypothèsesi-dessus,onpeutmontrerque

X ¯ ∼ N (µ, ^σ _n ² )

^puis^que

√ n ^X ^¯ _σ ⁻ ^µ ∼ N (0, 1)

^et

don

P [u α/2 ≤ √

n X ¯ − µ

σ ≤ u 1 − α/2 ] = 1 − α

ave

u α

^le^quantile^d'ordre

α

^de^la^loi

N (0, 1)

^,^e^qui^se^rérit

P [ ¯ X + u α/2

√ σ n ≤ µ ≤ X ¯ + u 1 − α/2

√ σ n ] = 1 − α

L'intervalle

[ ¯ X + u α/2 √ σ n ; ¯ X + u 1 − α/2 √ σ n ]

êstûnîntervalleâléatoire^(puisque^les^bornes

dépendentdesvariablesaléatoires

X 1 , ..., X n

⁾^qui ^ontient^la^vraie ^valeur^du^paramètre

µ

^ave

uneprobabilité

1 − α

^.Ûn^telîntervalleêstâppeléîntervalle^deônaneâu^niveau^deônane

1 − α

^pour

µ

^.

Enpratiquelesquantilesdelaloi

N (0, 1)

^peuvent^êtreôbtenusênûtilisant^des^tablesstatistiques oudeslogiielsadaptés(R,Matlab,SAS,Exel...)

Dénition: l'intervallealéatoire

[a(X 1 , ..., X n ); b(X 1 , ..., X n )]

êst âppelé întervalle ^de

onaneauniveaudeonane

1 − α

^pour

θ

^si

P [a(X 1 , ..., X n ) ≤ θ ≤ b(X 1 , ..., X n )]] = 1 − α

^.

(15)

Lorsquelatailledel'éhantillon

n

êst^susamment^grande,ôn^peutônstruire^desintervallesde onanepourlamoyenne

µ

^en^utilisant^les^propriétésasymptotiquesde

X ¯

^et

S ²

^données

i-dessus.

Pluspréisément,soit

(X 1 , ..., X n )

^unn-éhantillond'uneloivériant

var(X i ) = σ ² < + ∞

^.^Pour

"ngrand",d'aprèsleTCL,ona:

√ n X ¯ − µ

σ ≈ N (0, 1)

Cetteapproximationestvalable mêmesil'éhantillonn'estpasgaussienet permet defairedes

intervallesdeonanelorsque

σ

^est^onnu.^Lorsque

σ

êstînonnu,ôn^peutûtiliser^le^fait^que

S ²

σ ²

^,^et^don^pour^"ngrand",ona

S ≈ σ

Finalement,onendéduitquepour"ngrand":

√ n X ¯ − µ

S ≈ N (0, 1)

UnedémonstrationrigoureusedeerésultatpeutêtreobtenueenutilisantlelemnedeSlutsky:

onpeutmontrerque,souslesonditionsd'appliationduTCL,

√ n ^X ^¯ _S ⁻ ^µ

ônvergeên^loi^versûne

loi

N (0, 1)

^.

Enpratique,onsuppose généralementqueette approximationestvalidedèsque

n ≥ 30

⁽^!).^On

aalors:

P [u α/2 ≤ √

n X ¯ − µ

S ≤ u 1 − α/2 ] ≈ 1 − α

puis

P [ ¯ X + u α/2

√ S n ≤ µ ≤ X ¯ + u 1 − α/2

√ S n ] ≈ 1 − α

L'intervalle

[ ¯ X + u α/2 √ S

n ; ¯ X + u 1 − α/2 √ S

n ]

^est^appelé "intervallede onaneasymptotique"

auniveaudeonane

1 − α

^pour

µ

^.

Exemple. Onreprend lesdonnéesde températureàBrest(f paragraphe2.2).

1. Donnerunintervallede onaneà95% pourla température moyenne,disuter la validité

deshypothèsessurlesquellesreposelaonstrution de etintervalle.

2. Une agene devoyage prétendquela températuremoyenneàBresten étéest de

19 ^o

^.^Qu'en

pensez-vous?

2.4.3 Constrution d'intervallesde onanepourune proportion

Ilest égalementpossibledeonstruiredesintervallesdeonanepouruneproportionlorsquen

estgrand.Soit

X 1 , ..., X n

^unn-éhantillond'uneloideBernoullideparamètre

π

^.^D'après^le

TCL,onsaitquepourngrand :

√ n F − π

p π(1 − π) ≈ N (0, 1)

Comme

F

êstûnêstimateurônsistent^de

π

^, ^pourⁿ^grand,^on^peut^remplaer^ledénominateur par

F (1 − F)

^(de^manière^plus^formelle,ôn^peutûtiliser^le^lemme^de^Studsky),êt ônââlors^:

√ n F − π

p F (1 − F ) ≈ N (0, 1)

(16)

P [u α/2 ≤ √

n F − π

p F (1 − F ) ≤ u 1 − α/2 ] ≈ 1 − α

etenn

P [F + u α/2

p F (1 − F )

√ n ≤ π ≤ F + u 1 − α/2

p F(1 − F )

√ n ] ≈ 1 − α

Don

[F + u α/2

√ F(1 − F)

√ n ; F + u 1 − α/2

√ F(1 − F)

√ n ]

êstûnîntervalle ^deônaneasymptotiqueau niveaudeonane

1 − α

^pour

π

^.^En ^pratique,^on^supposegénéralementqueette approximation estvalabledèsque

nπ ≥ 5

^et

n(1 − π) ≥ 5

^. ^Comme

π

êst înonnuên^pratique,ôn^vérieâ

posteriorisilesonditionssontvériéespourlesbornesdel'intervalledeonane,'estàdire

n(F − u α/2

√ F(1 − F)

√ n ) ≥ 5

^et

n(1 − F − u 1 − α/2

√ F (1 − F)

√ n ) ≥ 5

Exemple. Onreprend l'exemple dusondage.

1. Donnerunintervallede onaneà

95%

^pour^les^intentions^de ^vote.

2. Combien depersonnefaudrait-ilsonderpour êtreertaind'obtenirunintervallede

onaneà

95%

^dont^la^largeur ^est^inférieur ^à

0.1%

^?

2.5 Tests statistiques

2.5.1 Généralité sur lestests

Unteststatistiquepermetdevériersiertaineshypothèsesfaitessurlavaleurdesparamètres

sontréalistesounon.Pluspréisément,dansleadredeeours,nousnousintéresseronsàtester

deshypothèsesdelaforme

H 0 : θ ∈ Θ 0

^ontrel'hypothèsealternative

H 1 : θ / ∈ Θ 0

ave

Θ 0 ⊂ Θ

^.

Ondistingueusuellementdeux typesd'erreurs:

L'erreurde premièreespèe quionsisteàrejeter

H 0

^alors^que

H 0

êst^vraie.Ônâppelle

risquede premièreespèe

α

^laprobabilitédehoisir

H 1

^alors^que

H 0

^est ^vraie.

L'erreurde deuxième espèequi onsisteàaepter

H 0

^alors^que

H 0

êst^fausse.Ônâppelle

risquede deuxièmeespèe

β

^laprobabilitédehoisir

H 0

^alors^que

H 0

^est ^fausse.

Enpratique,onxegénéralement

α

^(vâleursôurantes^:^5%ôu^1%)êt

H 0

^joue^don^un^rle^plus

importantque

H 1

^.

1 − β

êst âppelé^la^puissane ^du^test^: ^pourûn^risque^de^premièreêspèe

α

xé,onherheàonstruireletestdontlapuissaneest laplusgrande!

2.5.2 Tests pourune moyenne

Ondisposed'unn-éhantillon

(X 1 , ..., X n )

^d'une^loi^d'espérane^inonnue

µ = E[X i ]

^et ^on^veut

testerl'hypothèsesimple:

H 0 : µ = µ 0

H 1 : µ 6 = µ 0

ave

µ 0

^une^valeur^xée.

Premieras :supposons que

(X 1 , ..., X n ) ∼ ^iid N (µ, σ ² )

^ave

σ

^onnue^(f^paragraphe^sur^les

intervallesdeonane).Onaalors:

√ n X ¯ − µ

σ ∼ N (0, 1)

(17)

Don,si

H 0

êst^vraie,ônâ

µ = µ 0

^et

P H 0 [u α/2 ≤ √

n X ¯ − µ 0

σ ≤ u 1 − α /2] = 1 − α

Onadoptealorslarègle de déisionsuivante :

Onaepte

H 0

^si

√

n ^X ^¯ ⁻ _σ ^µ ⁰ ∈ [u α/2 , u 1 − α/2 ]

^.

Onrefuse

H 0

^sinon.

Remarque. 1. Onaepte don

H 0

^lorsque^,

X ¯ ∈ [µ 0 + u α/2

√ σ n , µ 0 + u 1 − α/2

√ σ n ]

'est àdirelorsque

X ¯

^est^susamment ^prohe ^de

µ 0

^.^La^règle ^de ^déision ^est^onstruite

pour quelerisquede premièreespèe soitbienégal à

α

^.

2. Lorsqu'on faituntestaveunlogiiel de statistique(R,SAS,Exel,...), lerésultat est

donné sousla forme d'une "p-value"(ou"degré de signiation").Pourletest

préédent, ettep-valueest déniepar

p v = P[ | Z | > | √

n ¯ x − µ 0

σ | ]

ave

Z

^une ^variable ^gaussienneentrée-réduiteet

x ¯

^la ^moyenne^observée ^surl'éhantillon.

On vérieaisémentqu'on aepte

H 0

âve ûn^risque^de ^premièreêspèe

α

^si^et^seulement

si

p v > alpha

^.^La^p-value ^est^souventinterprétéeommeune"mesure" dela vraisemblane de l'hypothèse

H 0

^:ûne ^p-value^faible îndique^que ^l'hypôthèse

H 0

^est^peuvraisemblable.

Deuxièmeas:onnesupposeplusquel'éhantillonest gaussienniquelavariane

σ ²

^est

onnue.Parontre,onsupposeque

n

^est^susamment^grand⁽

n ≥ 30

^?)^pour^que

l'approximation

√ n X ¯ − µ

S ≈ N (0, 1)

soitvalable.Alors,si

H 0

êst^vraie, ônâ

µ = µ 0

^et

P H 0 [u α/2 ≤ √

n X ¯ − µ 0

S ≤ u 1 − α/2 ] = 1 − α

Onadoptealorslarèglededéisionsuivante:

Onaepte

H 0

^si

√ n ^X ^¯ ⁻ _S ^µ ⁰ ∈ [u α/2 , u 1 − α/2 ]

^.

Onrefuse

H 0

^sinon.

Remarque. Iila p-value dutestestdonnéepar

p v = P[ | Z | > | √

n x ¯ − µ 0

s | ]

ave

Z

^une ^variable ^gaussienneentrée-réduiteet

x ¯

^(resp.

s

⁾ ^la ^moyenne^(resp. l'éart-type) observée surl'éhantillon

Exemple. Uneagenede voyage prétendquela températuremoyenneàBresten étéestde

22 ^o

^.

Cettearmation est-elleen aordave lestempératures observéspendant l'été2008 (f hapitre

2.2)?Quelleestla p-value dutest?

2.5.3 Test pour uneproportion

Ondisposed'unn-éhantillon

(X 1 , ..., X n )

^d'une^loi^de^Bernoulli^de^paramètre

π

înonnu,êtôn

veuttesterl'hypothèsesimple

H 0 : π = π 0

H 1 : π 6 = π 0

(18)

√ n F − π

p π(1 − π) ≈ N (0, 1)

Don,si

H 0

êst^vraie,ônâ

π = π 0

^et

P H 0 [u α/2 ≤ √

n F − π 0

p π 0 (1 − π 0 ) ≤ u 1 − α/2 ] ≈ 1 − α

Onsupposegénéralementqueetteapproximationestvalablelorsque

nπ ≥ 5

^et

n(1 − π) ≥ 5

^.^On

adoptealorslarèglededéisionsuivante:

Onaepte

H 0

^si

√ n √ ^F ⁻ ^π ⁰

π 0 (1 − π 0 ) ∈ [u α/2 , u 1 − α/2 ]

^.

Onrefuse

H 0

^sinon.

Exemple. And'estimerles intentionsde votelors dudeuxièmetourd'une életion

présidentielle, uninstitutréalise unsondage. Sur1000 personnesinterrogéesauhasard,520

pensentvoterpour leandidat Aet480 pour leandidat B.Etantdonnés lesrésultatsde e

sondage, peut-onen déduire quelandidatva gagner l'életion?

2.6 Exeries sur le hapitre 2

Exerie 2.1. Lors duontrled'unhaînede médiaments,on s'intéresseaunombre de

omprimés défetueuxdansunlot.Lestestseetuéssur20lotshoisis auhasardont donnéles

résultatssuivants:

1,0,0,3,2,0,5,2 ,0 ,0 ,1 ,2, 1, 3, 0, 1,0 ,0 ,2 ,7

Onsupposeraqueesobservationsproviennentd'unéhantillond'une loide probabilitéinonnue,

d'espérane mathématique

µ

^et^de ^variane

σ ²

^.

a.Ononsidère lesquatreestimateurssuivantspour

µ

^:

T 1 = X 1

T 2 = ^X ¹ ^+X ₂ ²

T 3 = ^X ¹ ^+X ₃ ²

X ¯ = ^X ¹ ^+X ² ^+...+X _n ⁿ

Quereprésentent

X i

^et

n

^dans^la ^dénition ^desestimateurs?Quelleshypothèses sont faitessur

X 1 , X 2 , ..., X n

^?

Calulerlebiais, la varianeet l'erreurquadratiquemoyennede es4estimateurs. Quel estle

meilleurestimateur?Quelleest l'estimationorrespondante?

b.Proposer unestimateurde

σ ²

^et^alulerl'estimation orrespondante.

.Proposer unestimateurde la proportion delotsqui ontiennentaumoinsunomprimé

défetueuxetaluler l'estimation orrespondante.

Exerie 2.2. Existe-t-ilunestimateursans biaisduparamètre

θ = _π ¹

^pour^un^éhantillon^de

taille1d'une loi de Bernoulli deparamètre

π

^?

Exerie 2.3. Soit

(X 1 , ..., X n )

ⁿ ^variables ^aléatoires^i.i.d. ^d'une ^loi^de ^moyenne

µ

^et ^de

variane

σ ²

^.

a.Donnerune onditionnéessaireetsusante surlesonstantesréelles

a 1 , ..., a n

^pour^que

P n

i=1 a i X i

^soit^un^estimateur^sans ^biais^de

µ

^.

b.Parmi touslesestimateursde

µ

^de ^la ^forme

P n

i=1 a i X i

^,^quel^est^elui ^de ^variane ^minimale^?

Quelestlebiais deetestimateur?

.Parmi touslesestimateursde

µ

^de ^la ^forme

P n

i=1 a i X i

^,^quel^est^elui ^dont^l'erreur

quadratique moyenneestminimale?

d.Parmiles estimateurssans biaisde

µ

^de ^la ^forme

P n

i=1 a i X i

^,^quel^est ^elui ^de^variane

minimale?

(19)

Exerie 2.4. Soit

(X 1 , ..., X n )

ⁿ ^variables âléatoiresî.i.d. ^qui ^suiventûne ^loi^normale

d'espérane

0

^et^de ^variane

σ ²

^.^On^onsidèrel'estimateursuivantpour

σ ²

^:

T = _n ¹ P n i=1 X _i ²

a.Caluler lebiais,la variane etl'erreur quadratique moyennedeetestimateur.

b.Etudier lespropriétés asymptotiquesde l'estimateur(onvergene, normalitéasymptotique).

Exerie 2.5. Onaobservé lesdurées de vie(en heure)de 30 omposantséletroniques.Les

résultatssuivantsontétéobtenus :0.1;7.4;1.0;7.9;2.1;1.8;17.9;9.3;6.5;3.3;5.6;7.7;

0.1;24.3;8.1;10.0;11.9;1.6;2.7;0.5;5.8;42.5;5.1;2.0;0.2;15.0;3.5;6.4;0.6;3.3

Onadmettraque

P 30

i=1 x i = 223.5

^et

P 30

i=1 x ² _i = 3826.8

^.

Première partie.Onsupposedansettepremière partie quela durée de viedesomposants

életroniques suituneloi exponentiellede paramètreinonnu

θ > 0

^.^On^rappelle^que^la ^densité ^de

etteloiestdonnéepar:

f θ (x) = 1

θ exp( − x θ )

a.Construire unestimateurde

θ

ên ûtilisant^la ^méthode ^des^momentsêt^donner l'estimation orrespondante.

b.Caluler l'estimateurdumaximumde vraisemblane

T n

^de

θ

^ainsi^quel'estimation orrespondante.

.Caluler lebiaisetl'erreur quadratique moyennede

T n

^.^Cet êstimateurêst-ilêae^?

d.Etudier lespropriétés asymptotiquesde

T n

(onvergene, normalitéasymptotique). Endéduire unintervallede onane asymptotiqueà95% pour

θ

^.

e.Caluler lafontion de répartitionde la loiexponentielle, puis endéduireunestimateurde la

probabilitéquela durée devie d'unomposantsoit supérieureàune duréequelonque

t ≥ 0

^.^En

déduireune estimationde la probabilité quela duréede vie d'unomposantsoit supérieure à20h,

30het40het ompareres résultatsave lesfréquenes empiriquesalulées àpartirdesdonnées.

Quelestlemeilleur estimateur?

f.Traer surunmême graphique la densitéde la loiexponentielleajustéeetunhistogramme

dérivantla répartition desduréesde vie observées(on utiliseraundéoupage en lassesde

largeur3). Disuterla qualitéde l'ajustement.

Deuxième partie.Onsupposemaintenantquela duréede vie desomposantséletroniques suit

uneloi dontladensité de probabilité estdonnéepar :

f θ (x) = _x

θ ² exp( − ^x θ ) si x ≥ 0

0 sinon

^(2.4)

ave

θ > 0

^un^paramètre^inonnu.

a.Caluls préliminaires. Onpose,pour

n ≥ 0

^,

J n (θ) =

Z + ∞ 0

x ⁿ exp( − x θ )

1. Montrer,àl'aided'une intégrationparpartie, quepour

n ≥ 0 J n+1 (θ) = (n + 1)θJ n (θ)

^.^En

déduire que

J n (θ) = θ ⁿ⁺¹ n!

2. Endéduire que

f θ

^dénit^bienûne ^densité,^puis ^que^si^queêst ûne^variable âléatoire^dont^la

loiadmet la densité

f θ

^alors

E[X ] = 2θ

^et

var(X ) = 2θ ²

3. Construireunestimateurde

θ

^en^utilisant ^la ^méthode ^des^moments.

b.Caluler l'estimateurdumaximumde vraisemblane

T n

^de

θ

^,^ainsi ^quel'estimation orrespondante.

.Caluler lebiaisetl'erreur quadratique moyennede

T n

^.^Cet êstimateurêst-ilêae^?

d.Etudierlespropriétésasymptotiquesde

T n

^.Ên^déduireûnîntervalle^de ônaneasymptotique à95%pour

θ

^.

(20)

mortels(horssuiide)surespassages entre1985 et1997.Lesnombresobservés sont les

suivants:

1985 :3

1988 :2

1991,1993,1995,1 997 :1

Onsupposeque lenombre d'aidents

X

âuôurs ^d'uneânnée^suitûne ^loi^de ^poisson ^de

paramètre

θ > 0

înonnu. Ônââlors,^pour

k ≥ 0

^,

P[X = k; θ] = θ ^k exp( − θ) k!

Onadmettraque

E[X] = θ

^et

var(X ) = θ

^.

a.Caluler l'estimateurdumaximumde vraisemblane de

θ

^,^puis ^une^estimation^de

θ

^basée^sur

lesobservations.

b.Calulerlebiaisetl'erreurquadratiquemoyennedel'estimateurde laquestion a.,puisétudier

sespropriétés asymptotiques.Cetestimateurest-ileae?

.Donnerunintervallede onaneasymptotiqueà95% pour

θ

^.

Exerie 2.7. Soit

(X 1 , ..., X n )

^unn-éhantillond'une variable aléatoirenormale de moyenne

µ

etd'éart type

σ

^.^On^rappelle^que^la ^densité ^de

X i

^est ^donnée^par

f θ (x) = 1 σ √

2π exp( − (x − µ) ² 2σ ² )

ave

θ = (µ, σ)

^.

Première partie.Onsupposedansettepartie que

σ

êstônnuêt

µ

^inonnu.

µ

^ainsi ^que^la^quantité d'information de Fisherapportée par l'éhantillon sureparamètre. Comment varieettequantité ave

σ

^?

Commenter.

b.L'estimateur de la questionpréédenteest-ileae?

Deuxième partie.Onsupposedansettepartieque

µ

êstônnuêt

σ

^inonnu.

σ

^ainsi ^que^la^quantité d'information de Fisherapportée par l'éhantillon sureparamètre.

b.L'estimateur de la questionpréédenteest-ileae?

Troisième partie.Onsupposedorénavantque

µ

^et

σ

^sont ^inonnus. ^Calulerl'estimateurdu maximumde vraisemblaneorrespondant.

Exerie 2.8. Soit

(X 1 , ..., X n )

^des^variables ^aléatoiresindépendantesetidentiquement distribuéesde loiuniformesurl'intervalle

[0, θ]

^.^La^densité ^de

X i

^est^alors ^donnée^par

f (x; θ) = ₁

θ si x ∈ [0, θ]

0 sinon

a.Vérier que

f (.; θ)

êst^bienûne ^densité êt^montrer^que ^l'espéraneêt ^la^variane^de êtte^loi

sontdonnées par

E[X] = θ/2

^et

var(X) = θ ² /12

^.

b.Donnerunestimateur

T n

^de

θ

^par^la ^méthode ^des^moments.

1. Calulerlebiaiset la varianede etestimateur.

2. Etudier lespropriétés asymptotiquesde

θ

(onvergene, normalité asymptotique).

3. Endéduire unintervalle de onaneasymptotique à95%pour

θ

^.

.Montrer que

M n = max(X 1 , ..., X n )

^est l'estimateurdumaximumde vraisemblane de

θ

^.

1. Montrerque

F M n

^,^la^fontion ^de répartitionde

M n

^,^est

y 1 x 1,1 x 1,2

Y

p

x 1 , ..., x p

n

y 1 x 1,1 x 1,2

x 1,p

y 2 x 2,1 x 2,2

x 2,p

y n x n,1 x n,2

x n,p

p

N x,t

x

t

n

(x 1 , ..., x n ) ∈ R n

(X 1 , ..., X n )

(Ω, F , P)

(x 1 , ..., x n ) = (X 1 (ω), ..., X n (ω))

ω ∈ Ω

(X 1 , ..., X n )

(x 1 , x 2 , ..., x n )

n

x i

x i+1

P

(X 1 , ..., X n )

P

X 1 , ..., X n ∼ iid P

X 1

X 2

X n

θ ∈ Θ

Θ ⊂ R k

X 1 , ..., X n ∼ iid P θ

X i ∼ iid N (µ, σ 2 )

i ∈ { 1...n }

θ = (µ, σ) ∈ R × R + ∗

θ

(x 1 , ..., x n )

(X 1 , ..., X n )

P θ

θ

T = g(X 1 , ..., X n )

(X 1 , ..., X n )

θ

(x 1 , ..., x n )

t = g(x 1 , ..., x n )

(x 1 , ..., x n )

(X 1 , ..., X n )

µ = E[X i ]

µ = 20

σ 2 = var[X i ]

σ = 0

σ

µ

X ¯ = X 1 + ... + X n

n

σ 2

S 2 =

P n i=1 X i 2

n − X ¯ 2 = 1 n

n

X

i=1

(X i − X) ¯ 2

x ¯ = x 1 +...+x n n

s 2 = P n i=1 n x 2 i − x ¯ 2

¯

x = 20.08 o

s = 0.2657 o

20 0

π

x i = 0

x i = 1

(x 1 , ..., x n )

(X 1 , ..., X n )

θ = π = P[X i = 1]

π

(x 1 , ..., x n ) ∈ R ⁿ

X 1 , ..., X n ∼ ^iid P

Θ ⊂ R ^k

X 1 , ..., X n ∼ ^iid P θ

X i ∼ ^iid N (µ, σ ² )

θ = (µ, σ) ∈ R × R ⁺ ^∗

σ ² = var[X i ]

σ ²

S ² =

P n i=1 X _i ²

n − X ¯ ² = 1 n

(X i − X) ¯ ²

x ¯ = ^x ¹ ^+...+x _n ⁿ

s ² = ^P ⁿ ⁱ⁼¹ _n ^x ² ⁱ − x ¯ ²

x = 20.08 ^o

s = 0.2657 ^o

20 ⁰

P π (X i = x i ) = π ^x ⁱ (1 − π) ¹ ⁻ ^x ⁱ pour x i ∈ { 0, 1 }

(x 1 , ..., x n ) ∈ { 0, 1 } ⁿ

π ^x ⁱ (1 − π) ¹ ⁻ ^x ⁱ