Problème de test d'hypothèses linéaires multiples en analyse de la variance

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

P HAM -D INH -T UAN

Problème de test d’hypothèses linéaires multiples en analyse de la variance

Revue de statistique appliquée, tome 19, n

^o

1 (1971), p. 77-85

<

http://www.numdam.org/item?id=RSA_1971__19_1_77_0

>

© Société française de statistique, 1971, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (

http://www.

sfds.asso.fr/publicat/rsa.htm

) implique l’accord avec les conditions générales d’uti- lisation (

http://www.numdam.org/conditions

). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme

(2)

77

PROBLÈME DE TEST D’HYPOTHÈSES LINÉAIRES ^MULTIPLES

EN ANALYSE DE LA VARIANCE

PHAM-DINH-TUAN

laboratoire de Mathématiques Appliquées, ^Grenoble

1 - INTRODUCTION

Dans le modèle I

d’Analyse

^{de la}

Variance,

les

hypothèses (que

^ce^soit

une

hypothèse

^à

priori

^ou^cellesque l’on veut

tester)

^sont

toujours

^des

hy- pothèses

linéaires. Dans ce

modèle,

les observations sont des variables aléa- toires

X 1, ... , Xn ^normales, indépendantes,

^de

moyennes ,..., ~

^et^de

même variance

02.

Le vecteur

~ERn,

^de

composantes ~ 1 ,

^...,

est

^sup-

posé appartenir

^à^unsous-espace vectoriel V de

Rn (dim

^V

n).

^C’est

l’hypo-

thèse à

priori.

^Ons’intéresse à savoir

si ~ appartient

^à^{un ou}

plusieurs

sous-espaces vectoriels donnés

V1 , ... ,Vk

de V. Par

exemple,

considérons le cas d’un

plan

factoriel à deux facteurs. Si l’on fait

l’hypothèse

^à

priori qu’il n’y

^apas d’intéraction entre les

facteurs,

les observations sont de la forme :

J sont des constantes avec

et

e ij’ i = 1, ... , I, j = 1,

^..., ^{J sont}des variables aléatoires

normales, indépendantes,

centrées de variance commune Cy 2.

Le terme ~.

représente

la moyenne

générale

^des

observations,

^les

termes

e~, ^{i = 1 ,}

^...,¹

représentent

l’effet du facteur

A,

^les ^termes

E i B

^{i =}^1, ^..., ^Jcelui du facteur B et les termes ei j , ^{i =}1, ^...,

I, j

= 1, ^...,J tiennent

compte

des effets du hasard.

Ici le nombre des observations est

n = I. J,

^et^le^vecteur

~~RB

^de

c ompo sante s ~ i j =

^E

^{X i j ,}

^{i = 1,}

I, j = 1,...,

^J

appartient

^au ^sous-

espace vectoriel

On pourra s’intéresser à déterminer si le facteur A n’a _pasd’influence

sur les

observations,

^ce

qui

^se^traduit

par 6~=0,

ⁱ⁼

^1,

^...,^{I ;}c’est-à-dire

que ~ appartient

^ausous-espace vectoriel :

Revue de Statistique Appliquée. 1971 - vol. XIX N° 1

(3)

De

façon analogue,

^on^pourra^se^demander^si^le^facteur^B^n’a^pas^d’influence sur les

observations,

^ce

qui

^veut^dire

que ~

appartient ^au^sous- espace vectoriel :

Les

hypothèses

que l’on _pourraformuler sont :

pas d’influence de A et B Influence de B seul Influence de A seul Influence de A et B

On a donc un

problème

^de^test

d’hypothèses multiples.

Îlênêst^de

même _pourles

plans

factoriels à

plusieurs facteurs,

^avecintéraction ou non

entre les

facteurs,

^à^ceci

près

que l’on a un

plus grand

^{nombre de}^sous-

espaces vectoriels Vi, ^{... ,}

Vk

^et

plus d’hypothèses

^à^tester.

Une manière naturelle de résoudre ce

problème

^estd’effectuer

sépa-

rément les tests de

l’hypothèse ~~V~

^contre

^{~E Vi}

^pour

^chaque

ⁱ⁼^1,^...,^k

et de conclure suivant les résultats de ces tests. Dans

l’exemple précédent,

si _parle

premier

^testônêstâmener^à

accepter l’hypothèse ~~EB~

^{et par}^le

second,

ônêstâmener^à

rejeter l’hypothèse E:E V 2’

^alors^on^choisira

^l’hypo-

thèse H2. La suite de cet article est consacré à l’étude d’un tel

procédé.

2 - DEFINITION DU PROBLEME ET LE TEST CORRESPONDANT

Soit n variables aléatoires

-indépendantes Xl,

^{... ,}

X n,

normales de moyennes

respectives E: 1, ..., ~

^etde variance commune

Cy2 ; le

^vecteur des moyennes

~~(~

est

supposé appartenir

^à^unsous-espace V de

R .

Soient alors

V

^{... ,}

Vk,

k sous-espaces vectoriel de ^V

(dim Vi

^dim

^{V ,} i = 1,

^{... ,}

k),

^on^sepropose, ^{au vu}d’une observation x de

X = (X~

^...,

Xn)

de choisir une des

2 k hypothèses :

où j

^est^une

partie

^de

{1,

^...,

k }.

Désignons

par

Wi, l’orthogonal

^de

Vi

^dans^{V et} supposons que :

(C)

Les sous-espaces vectoriels

Wi, t-1,

^...,^{k son t}

ortho~onaux deux à

^deux.

La condition C est très

importante,

^elle

permet

de réduire le

problème

de test par la considération de l’invariance.

(4)

79

Notons

^la

projection de ~

^sur

W1.

^Les

hypothèses

^à^tester

peuvent

s’écrire d’une autre manière :

H J : ~=0

^{iE J}

~w, ~ 0

^iEJ

Le test que ^nousproposons est le suivant :

Désignons x ’1’

ⁱ⁼

^1,

^...,

^k,

^x~*^les

projections

de l’observation x de

XERD

sur

W1,

ⁱ⁼

1,

..., k et sur V*

(V *

^étant

l’orthogonal

^de^V^dans

R°),

on choisi

l’hypothèse H J

^{si et}seulement si

où

Pi, ^{i = 1,}

^...,^k^sont^desconstantes données à l’avance.

On _remarque

qu’effectuer

^ce^test

équivaut

^à^testersimultanément

l’hy- pothèse ~

⁼^{0 contre}

^{~,, 7t}

^{0 pour}

^chaque

ⁱ⁼

^1,

^...,

^k,

^parla méthode de test

d’hypothèses

^linéaire

(le F-test).

3 - ETUDE DU TEST PRECEDENT

3 .1. Test

d’hypothèse multiple

^et^fonction

puissance

Soit X un élément aléatoire de loi de

probabilité Pe

où 0 est un para- mètre

inconnu, appartenant

^àûnênsembleâbstrait^0.^Soient

Oi ,

^...,

8t

^une

partition

^{de 0}^en^r

parties,

^le

problème

^de^test

d’hypothèses multiples

^est

de décider au vu de l’observation x de

X,

l’une de k

hypothèses :

Un test est alors une fonction cp, mesurable de X dans R

telle _que

où

CPi (x) représente

^la

probabilité

que l’on

accepte l’hypothèse Hi quand

^x

est observé.

La

performance

^d’un^test

y s’exprime

à l’aide de la fonction

puissance p (. ;

;

cp)

^définie^sur⁸^età valeurs dans

Rk :

La

composante Pi _{(8 ; cp)}

⁼

E pe.(yi ) ^{de P} ^{(8 ; cp)} représente

^la

probabilité

(5)

que l’on

accepte l’hypothèse

^H^enutilisant le test

cp

^et

quand P8

est la vraie ici. Un test est d’autant meilleur _{que si}

~1 (0 ; cp)

^est^d’autant

^petit ^quand

O§É 91

3.2.

Propriétés optimales

^du^test

quelques propriétés optimales

^et^une^étude

plus complète

du test

[3].

On remarque que l’on a affaire à

un

problème

^de ^décisionet que

l’optimalité

^d’une

procédure

^de ^décision s’étudie ici ^auniveau de la fonction du

risque correspondant

^à^une^fonction

de coût très

simple.

4 - FONCTION PUISSANCE DU TEST

(2 .1 ) .

^RESULTAT

NUMERIQUE

^DANS

LE CAS DE DEUX HYPOTHESES LINEAIRES

La fonction

puissance

^du^test

(2 .1 )

^définie

dans §

^{2 est}^unefonction à valeurs dans

R 2k soit P (8 )

^{dont les}

composantes

^sont

P (0)

⁼

Pa {accepter hypothèse Hj} 8 = ~ , cr2) >

Introduisons les variables aléatoires :

Les variables aléatoires

Ui,

ⁱ⁼1, ^...,k suivent des lois du X2 dé- centrées à ni = dim

Wi

⁼^dim^{V -}^dim

^Vi degrés

de liberté et de

paramètre

de

décentrage Pi = IIt:WlI12/02 et

la variable aléatoire

Uo

^suit^une^{loi du}

^X2

centrée à _no⁼n - dim V

degrés

de liberté.

La fonction

puissance

^du^test^sedéduit donc de la loi de

probabilité

^du

k-tuples (Ul /U,,

^...,

Uk /Uo)’

^{elle est}^unefonction de

(p 1,

^...,

pk)

^et^dé-

pend

^des

degrés

de liberté no , nl, ..., nk ainsi que les

séparatrices paratrices p 1 ... , Pk ^qui

définissent le test

Dans le cas où k ⁼

2,

^la^fonction

puissance

^a

quatre composantes

(6)

81

m

~ J.4

"’’ ’’C~

.,...,..

~ ^C)

w 14)

~~

o IL4

10 pq

W (.) z

~

rn

s

1-4 p..

CD ~

:c

^~

Cu Z

~ 0

...

H

~ Z o W

(7)

Une

procédure Algol permet

de calculer les

quatre composantes

de la fonction

puissance

pour

chaque

^{valeur de}no , ni, n2, Pl, p2, et pl , p 2 .

Comme

exemple,

reprenons le

plan

factoriel à deux facteurs sans in- teraction. On

prend

^{1 =}

5,

^{J =}^{4. Il}^estfacile de voir que :

D’où no= 12, nI = 4,

n2= 3.

D’autre

part,

^onchoisira les

séparatrices p,

¹

P2 de ^façon

^que

où ^aest un nombre

compris

^entre

0,

^et1. Pour a ⁼5

%,

^{on a :}

Dans la table 1, ^{on a}

listé,

pour

chaque couple

pi, P2 les

quatre

pro- babilités de décider les

quatre hypothèse :

Hi~Pi=P2~~ ~

^{haut à}

gauche), H 2 : pi > 0,

¹

P 2 = 0 (en haut,

^à

droite),

H3 :

p~ = 0, P2>0 ^(en

^{bas à}

^gauche),

^{H4 :}

p 1 > 0, p 2 > 0 ^(en

^{bas à}

^{droite) .}

On voit que l’erreur de décision

(par exemple,

^décider

Hj, j 7~

ⁱ

^{quand Hi ,}

i ⁼1, ^...,⁴^s’est

réalisée)

est moins que

5 %

^si

_pl

^n’estpas

comprise

^entre

0 et 30. 0 et p 2 ^n’est^pas

compris

entre 0 et 25. 0. Plus

précisément,

^soit

p i *,

^{i =}^{1, 2,}^définis^par

où

pi ,

ⁱ⁼^1,^{2 sont}^les

séparatrices

^dutest, ^{alors le}^{test est}^valablepour tester les

hypothèses :

Les

probabilités

pour

chaque types

d’erreur de décision seront infé- rieures à a.

La valeur de

p * -ne ^dépend

que de ni, n o ^et^{a :}^:

p~p*(n~

^{.n~ ,}

a)

^où

p * (n i ,

Ho,

a )

^est^donnépar

(8)

83

f-n ^(p,x)

^{étant la}densité de la

loi P

décentrée de

paramètre n 1/2 , no /2

et de

paramètre

^de

décentrage p/2,

^{soit :}

On a tabulé les valeurs de

p*(n 1,

no ;

ex )

^{pour =}^{0. 05}

(table 2)

et pour a = 0.10

(table 3)

et pour no = 1

(1) 20, ni = 1 (1) (1)

^20.

Dans

l’exemple précédent,

no =

12,

n 1=

4,

n 2 = 3 ; ^ontrouve pour ^a⁼0.05

p*1= 27.74 p~=24.12.

BIBLIOGRAPHIE

[1]

^HISLEUR

G. -Exemple

d’utilisation d’un calculateur en

Statistique (Cha- pitre 3).

^Thèse

présentée

à la Faculté des Sciences de Grenoble

(1969).

[ 2] FERGUSON,

^TH.S. -Mathematical Statistics. A decision

theoreticapproach (Chapitre 6).

Academic press, ^NewYork

(1967).

[3]

PHAM-DINH T. - Contributions à

l’Analyse

^{de la}Variance et aux

plans d’expérience (chapitre 1).

^Thèse

présentée

à la faculté des Sciences de Grenoble

(1970).

(9)

00 M 00 H t:I::

o

>t M

00 H .-!

w

~ ~

s

ë

w E-t H .-!

~

C’iI :;:J ë

0’ :c

_A

~

^o

E-t

~

E-t p:¡

«

H 0

«

p:¡

~

H U H o H o H p:¡

~ H

~

(10)

85

00 w 00 w

==

E-t o Pi

>4

==

00 w a

~

~ z

1-4

H

00

1-4

o E-400 r4 E-4 w

>4

~ w

M ~7

.g

⁰

E-4

es

E-4

~

P4

G~1 o

~

w t)

~ o

~

~ E-t W

Problème de test d'hypothèses linéaires multiples en analyse de la variance

R EVUE DE STATISTIQUE APPLIQUÉE

P HAM -D INH -T UAN

Problème de test d’hypothèses linéaires multiples en analyse de la variance

Revue de statistique appliquée, tome 19, n

1 (1971), p. 77-85

<

>

© Société française de statistique, 1971, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (

) implique l’accord avec les conditions générales d’uti- lisation (

). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

PROBLÈME DE TEST D’HYPOTHÈSES LINÉAIRES MULTIPLES

EN ANALYSE DE LA VARIANCE

PHAM-DINH-TUAN

laboratoire de Mathématiques Appliquées, Grenoble

d’Analyse

Variance,

hypothèses (que

hypothèse

priori

tester)

toujours

hy- pothèses

modèle,

X 1, ... , Xn normales, indépendantes,

moyennes ,..., ~

02.

~ERn,

composantes ~ 1 ,

est

posé appartenir

Rn (dim

n).

l’hypo-

priori.

si ~ appartient

plusieurs

V1 , ... ,Vk

exemple,

plan

l’hypothèse

priori qu’il n’y

facteurs,

e ij’ i = 1, ... , I, j = 1,

normales, indépendantes,

représente

générale

observations,

e~, i = 1 ,

représentent

A,

E i B

I, j

compte

n = I. J,

~~RB

c ompo sante s ~ i j =

X i j ,

I, j = 1,...,

appartient

observations,

qui

par 6~=0,

1,

que ~ appartient

façon analogue,

observations,

qui

que ~

hypothèses

problème

d’hypothèses multiples.

plans

plusieurs facteurs,

facteurs,

près

plus grand

Vk

plus d’hypothèses

PROBLÈME DE TEST D’HYPOTHÈSES LINÉAIRES ^MULTIPLES

laboratoire de Mathématiques Appliquées, ^Grenoble

X 1, ... , Xn ^normales, indépendantes,

e~, ^{i = 1 ,}

^{X i j ,}

^1,

^{~E Vi}

^chaque

^l’hypo-

^{V ,} i = 1,

^1,

^k,

Pi, ^{i = 1,}

^{~,, 7t}

^chaque

^1,

^k,