• Aucun résultat trouvé

Tests et estimations

5.5 Mod`ele ` a deux facteurs crois´es

5.5.2 Tests et estimations

Tout ce qui a ´et´e expos´e dans le cas d’un seul facteur se g´en´eralise ici sans autre difficult´e que celle due aux ´ecritures. En particulier, on retrouve les mˆemes tests.

– Pour les tests de nullit´e des effets d’interactions, on notera que l’on a maintenant νH = (J −1)(K−1), νE=n−JK et que le nombre de valeurs propres non nulles `a prendre en compte est s= inf(D, νH).

– Par ailleurs, on notera que lorsque le test de significativit´e de chaque facteurF1etF2est fait dans le cadre du mod`ele complet,νE demeure ´egal `an−JK et les simplifications indiqu´ees dans la remarque 46 ne s’appliquent plus.

– Dans un mod`ele additif `a deux facteurs crois´es,νE vautn−(J+K−1).

– Lorsqu’un facteur ne poss`ede queJ = 2 niveaux, les 4 tests multidimensionnels sont encore tous identiques, mais l’expression de la statistique de test est plus compliqu´ee que celle indiqu´ee en 5.3.4, car le nombre de niveaux du second facteur intervient.

– Enfin, concernant les estimations de ˆβ, on les obtient colonne par colonne, comme indiqu´e dans la remarque 42.

5.5. MOD `ELE `A DEUX FACTEURS CROIS ´ES 79

5.5.3 G´ en´ eralisation

On peut encore envisager, avec une variable r´eponse Y multidimensionnelle d’ordre D, des mod`eles `a trois facteurs crois´es ou plus. Il n’y a aucune difficult´e th´eorique, mais seulement des difficult´es formelles (complexit´e des ´ecritures) et pratiques : nombre tr`es important de param`etres

`

a estimer, donc d’observations `a r´ealiser. Nous ne d´etaillons pas davantage ces extensions.

5.5.4 Illustration

Les donn´ees

Les donn´ees, toujours fictives, sont de mˆeme nature que les pr´ec´edentes. La variable r´eponse est `a 3 dimensions et figure dans les 3 derni`eres colonnes du fichier. Il y a maintenant 2 facteurs, le premier `a 2 niveaux (not´es 1 et 2), le second `a 4 niveaux (not´es 1, 2, 3 et 4). Les facteurs figurent dans les 2 premi`eres colonnes du fichier. Pour chaque cellule (il y en a 8), on a r´ealis´e 4 observations, de sorte que l’on dispose de 32 observations. Les donn´ees sont reproduites ci-dessous.

1 1 8 7 10 1 1 9 13 11 1 1 8 9 8 1 1 9 10 8 1 2 10 12 14 1 2 11 13 15 1 2 11 10 12 1 2 13 12 12 1 3 13 16 19 1 3 15 17 20 1 3 12 16 16 1 3 14 18 18 1 4 12 18 19 1 4 18 19 23 1 4 13 11 19 1 4 16 21 20 2 1 15 17 16 2 1 17 18 17 2 1 15 16 18 2 1 18 17 18 2 2 21 20 24 2 2 23 22 24 2 2 20 23 22 2 2 22 26 23 2 3 25 25 30 2 3 28 25 29 2 3 23 28 25 2 3 25 30 27 2 4 28 27 32 2 4 29 26 29 2 4 26 29 27 2 4 27 34 29

Le programme SAS

L’optionnounidu programme ci-dessous permet d’´eviter les traitements unidimensionnels.

options pagesize=64 linesize=76 nodate;

title;

footnote ’MANOVA - donnees fictives - 2 facteurs’;

* --- ;

* lecture des donnees ;

* (le fichier "fic2.don" contient les donnees ;

* et se trouve dans le repertoire de travail) ;

* --- ;

data fic2;

infile ’fic2.don’;

input f1 $ f2 $ y1 y2 y3;

run;

* --- ;

* procedure GLM pour la MANOVA ;

* --- ; proc glm data=fic2;

class f1 f2;

model y1-y3 = f1 | f2 / nouni;

manova H = f1 | f2 / printh printe;

run;

quit;

Les sorties de la proc´edure GLM

PAGE 1 The GLM Procedure

---Class Level Information

Class Levels Values

f1 2 1 2

f2 4 1 2 3 4

Number of observations 32

PAGE 2 The GLM Procedure

--- Multivariate Analysis of Variance E = Error SSCP Matrix

y1 y2 y3

y1 63 13 35

y2 13 159.75 -2.25

y3 35 -2.25 66

Partial Correlation Coefficients from the Error SSCP Matrix / Prob > |r|

DF = 24 y1 y2 y3

y1 1.000000 0.129584 0.542782

0.5370 0.0051

y2 0.129584 1.000000 -0.021912

0.5370 0.9172

y3 0.542782 -0.021912 1.000000

0.0051 0.9172

5.5. MOD `ELE `A DEUX FACTEURS CROIS ´ES 81

PAGE 3 The GLM Procedure

--- Multivariate Analysis of Variance

tests de f1

--- H = Type III SSCP Matrix for f1

y1 y2 y3

y1 903.125 855.3125 775.625

y2 855.3125 810.03125 734.5625

y3 775.625 734.5625 666.125

Characteristic Roots and Vectors of: E Inverse * H, where H = Type III SSCP Matrix for f1

E = Error SSCP Matrix

Characteristic Characteristic Vector V’EV=1

Root Percent y1 y2 y3

19.8676273 100.00 0.07148178 0.03487179 0.05101439 0.0000000 0.00 -0.11562870 -0.00337882 0.13836212 0.0000000 0.00 -0.06841360 0.07223796 0.00000000

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall f1 Effect

H = Type III SSCP Matrix for f1 E = Error SSCP Matrix

S=1 M=0.5 N=10

Statistic Value F Value Num DF Den DF Pr > F

Wilks’ Lambda 0.04792112 145.70 3 22 <.0001

Pillai’s Trace 0.95207888 145.70 3 22 <.0001

Hotelling-Lawley Trace 19.86762728 145.70 3 22 <.0001 Roy’s Greatest Root 19.86762728 145.70 3 22 <.0001 tests de f2

---H = Type III SSCP Matrix for f2

y1 y2 y3

y1 352.375 408.5625 474.125

y2 408.5625 479.59375 553.4375

y3 474.125 553.4375 640.375

Characteristic Roots and Vectors of: E Inverse * H, where H = Type III SSCP Matrix for f2

E = Error SSCP Matrix

Characteristic Characteristic Vector V’EV=1

Root Percent y1 y2 y3

13.1912003 99.67 0.02098208 0.03734450 0.09571189 0.0429976 0.32 -0.14092901 0.04193749 0.06806198 0.0007461 0.01 -0.05346802 -0.05737958 0.08918153

MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall f2 Effect

H = Type III SSCP Matrix for f2 E = Error SSCP Matrix S=3 M=-0.5 N=10

Statistic Value F Value Num DF Den DF Pr > F

Wilks’ Lambda 0.06751086 12.09 9 53.693 <.0001

Pillai’s Trace 0.97150442 3.83 9 72 0.0005

Hotelling-Lawley Trace 13.23494405 31.40 9 31.536 <.0001 Roy’s Greatest Root 13.19120030 105.53 3 24 <.0001

NOTE: F Statistic for Roy’s Greatest Root is an upper bound.

tests des interactions

---H = Type III SSCP Matrix for f1*f2

y1 y2 y3

y1 28.375 23.0625 6.125

y2 23.0625 23.34375 7.6875

y3 6.125 7.6875 4.375

Characteristic Roots and Vectors of: E Inverse * H, where H = Type III SSCP Matrix for f1*f2

E = Error SSCP Matrix

Characteristic Characteristic Vector V’EV=1

Root Percent y1 y2 y3

0.57694177 85.26 0.13350497 0.02373892 -0.04939697 0.09184462 13.57 -0.06443491 0.05012982 0.12343212 0.00788528 1.17 0.03441843 -0.05804521 0.06380435

MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall f1*f2 Effect

H = Type III SSCP Matrix for f1*f2 E = Error SSCP Matrix S=3 M=-0.5 N=10

Statistic Value F Value Num DF Den DF Pr > F

Wilks’ Lambda 0.57625194 1.52 9 53.693 0.1660

Pillai’s Trace 0.45780353 1.44 9 72 0.1872

Hotelling-Lawley Trace 0.67667167 1.61 9 31.536 0.1564

Roy’s Greatest Root 0.57694177 4.62 3 24 0.0110

NOTE: F Statistic for Roy’s Greatest Root is an upper bound.

Application

A titre d’application, on pourra, `` a partir des valeurs propres donn´ees ci-dessus dans le cadre du test de significativit´e des interactions, retrouver les valeurs de Λ (Wilks’ Lambda), deF (F Value pour le test de Wilks), ainsi que les degr´es de libert´e (on remarquera les d.d.l. d´ecimaux).

Chapitre 6

Mod` eles ` a effets al´ eatoires et mod` eles mixtes

Un mod`ele mixte est un mod`ele comportant `a la fois des facteurs `a effets fixes, tels qu’ils ont

´et´e introduits au chapitre 3, et des facteurs `a effets al´eatoires, notion nouvelle, un peu particuli`ere, introduite au d´ebut de ce chapitre. Les m´ethodes usuelles dans le mod`ele lin´eaire standard, esti-mations, tests et pr´evisions, deviennent assez d´elicates dans le cadre d’un mod`ele mixte. Certaines sont d´etaill´ees dans ce chapitre, d’autres seront simplement ´evoqu´ees.

Les r´ef´erences bibliographiques les plus importantes sur les mod`eles lin´eaires mixtes sont les ouvrages de Miller (1997), Searleet al. (1992) et Verbeke & Molenberghs (2000).

R´esum´e

Une nouvelle notion est introduite dans ce chapitre : celle de facteur `a effets al´eatoires. Jusqu’`a pr´esent, les facteurs consid´er´es dans les chapitres 3, 4 et 5 ´etaient des facteurs `a effets fixes : les diff´erents niveaux en ´etaient fix´es une fois pour toutes et les effets associ´es ´etaient des param`etres

`

a estimer, ces param`etres intervenant dans la moyenne du mod`ele. Les facteurs `a effets al´eatoires vont avoir, a priori, une grande quantit´e de niveaux, les observations r´ealis´ees correspondant `a un nombre restreint de ces niveaux, pris al´eatoirement. On va ainsi mod´eliser ces niveaux en tant qu’observations d’une variable al´eatoire normale, de moyenne nulle (la moyenne du mod`ele sera d´efinie par les effets fixes) et de variance inconnue, `a estimer. Chaque facteur `a effets al´eatoires sera donc caract´eris´e par un param`etre de variance qu’il faudra estimer en plus de la variance des erreurs du mod`ele. D’o`u le nom decomposantes de la variancequ’on rencontre ´egalement pour de tels mod`eles.

On appelle mod`eles mixtes des mod`eles comportant `a la fois des facteurs `a effets fixes (ces effets entrant dans la d´efinition de la moyenne du mod`ele) et des facteurs `a effets al´eatoires (ces effets entrant, quant `a eux, dans la d´efinition de la variance du mod`ele). La n´ecessit´e d’estimer simul-tan´ement plusieurs param`etres de moyenne et plusieurs param`etres de variances dans les mod`eles mixtes va compliquer la proc´edure d’estimation. Ainsi, la m´ethode du maximum de vraisemblance, qui entraˆıne un biais syst´ematique dans l’estimation de la variance, n’est pas la plus appropri´ee dans ce cas : on lui pr´ef`ere, en g´en´eral, la m´ethode dite dumaximum de vraisemblance restreint.

Les tests de significativit´e des effets al´eatoires sont encore des tests de Fisher dans le cas de plans d’exp´eriences ´equilibr´es. Mais, les statistiques de khi-deux intervenant au d´enominateur de la statistique de Fisher diff`erent parfois de ce qu’on a vu au chapitre 3, afin de tenir compte de la particularit´e des mod`eles mixtes. D’autre part, dans le cas d´es´equilibr´e, les tests de Fisher sont en fait des tests approch´es et sont d’un usage plus d´elicat.

83