• Aucun résultat trouvé

f I I I Volume Biostatistique

N/A
N/A
Protected

Academic year: 2022

Partager "f I I I Volume Biostatistique"

Copied!
8
0
0

Texte intégral

(1)

!t'

Bruno Scherrer

Préfaces de Pierre Legendre et Mohan Beltangady

Biostatistique

Volume 2 2'édition

ilil

!r

I

t I

'l

i

l*

I I

H I

i._

i.

I I gaëtan rnorin f I éditeur

cHENELtÈRE ÉDUcATtoN

(2)

CHAPITRE l9

Régressions

linéaire multiple, cun'ilinéaire

et

robuste..'...'....'..'...2

Régression

linéaire multiple... .'...".2

Modèle de régression linéaire

multiple...

'...'...2

Estination

des coefhcients de régression

...

...'....".3 Contribution du modèle à

l'explication

de

I'...

...'... 6 Inferences concemant les paramètres du modèle et une

prédiction..."....'....'.'

8

Notion

de corrélation partielle

Test de signification de la conn ibution marginale d'utre variable...'.

'..'..

12 Contribution et effet des variables

explicatives

...14

Consb'uction du modèIe.... ...

l9

Méthode descendante

d'élimination

des

variables

... 19

Méthode ascendante de sélection des

variables

.'...'. 19 Méthode progtessive de sélection des

variables

...20 Méthode combinatoire de sélection des

variables ....'.'.20

Diagrrostic et mesures de

correctiolr

...24

Validité

prédictive interne et externe d'un

modèle.

...'....24

Manque d'ajustement du

modèle....

...'....25

Nonnalité

des

résidus

...27

Valeurs exceptionnelles" influentes et

leviers...

...2'7 Constance de la variance des

erreurs

...'...'.

3l

Multicolinéarité...

...32

Indépendance des

résidus...

...'...'... 3-5

itiiiifrl#ffiffit.tt...'...'..'...:...:':::..'...'...'....t:

Régression pseudo-orthogonale

(ridge)... ,...'.'..'.52

Régression

partielle

et des

moindres

carrés

partiels

... 56

Régressionmultipledesmoindresécartsabsolus

...60 Régression

M...

..."....62 Régression

multiple

non

paramétrique

de

rang...

...'...66

Régression

polynomiale

...6'7

Régression

kerne1...

...'.... 70

l9.l

19.1.1 19.1.2 19.1.3 19.1.4 19.1.5

l9.l.6

19.1.7 19.1.8 19.1.8.1

l9.l

.8.2 19.1.8.3 19.1.8.4

r9.I.9

19.1.9.1 19.t.9.2 19.1.9.3 19.1.9.4 19.1.9.5

t9.t.9.6 t9.t.9.7

19.1.9.8 19.2 19.3 19.4 19.5 19.6 19.7 19.8 19.9 19.r 0 19.1

l

(3)

Table des matières

19.12

Régressionpolynomialelocale...7-5

19.13

Régressionsplinecubique...7,5

19.14

Régression non linéaire...80

l9.l4.l

Caractérisation du nodèIe...81

19.14.2

Estirnation des paramètres du nrodèie...83

19.14.3

Sélection du

moclèle....

."...85

19.11.1

lntervalles de conl-iance et tests de

signitication

...86

19.11.1.1 Approche

asyrnptotique

...86

| 9.1

1.4.2

Approche par r'ééchanti I lonnage ... 88

REFERENC'ES...

...90

CHAPITRE

20 et py'ramidaux Analyse des plans l'actoriels 20.

l

Plans à deux

lhcteurs

croisés et sans

répétition

...93

20.2 Plansfactorielséquilibrés...98

20.3 Plansfactorielsdéséquilibrés...104

10.3.1

Sources cie désécluilibre et problème dLr ciéséq uil ibre

..

^... "... ... I 05

i0.-1.2

Plans fàctoriels cléséquilihr'és : approche des contrastes... 1 07

10.3.2.1

Princ,ipe généralcle I'approche des

contrastes

...107

:A 3

.2.2

Test cl' interaction ... I 08

10.i.2.i

Comparaison de rnoyennes rnarginales pondérées par les effectifs ... I 08

10.3.2.4

Comparaisorr dernol,ennes marginales équipondérées ... I I I

:0.3.2.-5

Comparaison de mol,ennes rnargirrales pondérées par

l'efièctif

elficace ... I I 3

10.3.3

Plans làctoriels cléséquilibrés : approche cles rnoindres carrés ... I I -5

10.i.3.I

Modèle de

régression

...1 16

10.3.3.2'l'est

d'interaction ... 1 1 9

:0.3.3.3

'l'est d'interaction en présence de cases vides : analyse de f,'pe IV... ...120

:0.3.3.4

Comparaison de moyennes marginales équipondérées : analyse de type 111...120

:0.3.i.5

Comparaison cle mol"ennes marginales pondérées par

I'effèctif

effic,ace : anal1.'se de r,u"pe I I ... ... | 22

10.3.3.6

Conrparaison de moyennes marginales pondérées par

I'elêctif

e1ïcace : analyse de iype I ... ... ".... "... | 23

20.3.3.7

Corrrparaison cle moyennes marginales en présence de cases vides : analyse de type

IV

... ... 124

20.3.3.8

Choix clu type de somme de carrés .."...125

10.3.3.9

Programmation sous

SAS'

...131

20.4 lnlérences

statistiques et modèle général

linéaire...

... 133

Fonctions estirrables : cas générai ...133

hrtervalle de confiance et test de signifi catitln d'une cr:rrrbinaison linéaire cie paramètres... I 36

20.4.3

Estimation par

intelvalle

de moyennes ajustées et de contrastes pour les plans lactoriels

déséquilibrés

...135

20.5

Plan

factoriel

avec

facteur aléatoire

: rnodèles

ll

et

III

...140

20.5.

I

l\4odèle

1...

... 140

2û.5.2

Modèle

ll ...

...140

2A.5.2.1

Plan factoriel équilibré à deux facteurs

aléatoires

...

i40

20.5.2.2

Plan factoriel déséquilibré à deux facteurs

aléatoires

...143

2û.5.3

Modèle

III

ou rnodèle nrixte ."...149

20.5.3.1

Plan factoriel équilibré à un *rcteur aléatoire et à r-rn facteur

fixé

...1-50

20.5.3.2

Plan tàctoriel déséquilibré avec fbcterrs aléatoires et T'ixés... I 5 I Plan

factoriel

à plus de

deur facteurs

... L57 Plan pyram ida1... 1 57 Plan pyrauridal sans répétition ... 1 57 Plan pyrarnidal équilibré avec répétition . l-58 Plan pylarnidal déséquilibr'é ... I 63 Modèle

I

: lncteurs f rxés ... 163

Modèle

II

: fàcteurs aléatoires. modèle

lll

: au rnoins un fàcteLrr aléatoire...167

2A.'7.3.3

Codes

SAS"".

... 168

20.8

Diagnostic et mesures correctives.. ...110

RÉr.ÉRËNCËs...

...172

CTIAPITRB 2l

Analyse des plans en blocs,

stratifiés

en unités divisées et avec covariables... I73

2t.t

IVléthode des

blocs

...171

21 .1

.1

Plans en blocs complets sans répétition ... 174

2l .l.l .l

Analy,'se de

variance..

...174

21 .1 .l

.2

Test F non paranrétriciue et test de

Friecinran

"...-...116

2l

.1

.2

Plans en lrlocs complets avec répétiticxr... 179

2l

.1

.3

Plans en Lrlocs incomolets sans

répétition...

... I ftO

21.2 Stratification

...

l8l 21.3

Plan

fhctoriel

en unités divisées ... 185

21.3.1

Plan factoriel équilibré en unités

divisées...

. ...

llt6 21.3.2

Plan

factoliel

déséquilibré en unités

divisées

...197

21.4

Analyse de covariance

(ANCOVA)

... 197

21.4.1

Choix des covariables et de }... 198

21.4.2

Mo1,'ennes ajustées et paradoxe de

Simpson

... 199

21

.4.3

lr4odèle d'analyse de covariance ...202

71

.4.4

Estimation des pararnètres du modè1e...20i

21.4.5

Contribution des temres du

modèle

...204

21

.4.6

Construction du modèle et tests

d'intérêt

...205

21.4.7 Conditionsd'application.diagnosticet remèdes...

...222 0t

2{J.6

2t.7

20.7.1 20.7.2 20.1.3 20.7.3.1 20.7.3.2

10.4.1 20.4.2

(4)

21.4.8 21.4.9

22.1.3.1 22.1.3.2

L'ANCOVA

par régression ou à

I'aide

de

SAS@...

...222

Comparaison de moyennes ajustées et tests de

contraste

...230

Modèle 7 : Modèle classique d'analyse de covariance, droites paral lèles ... 230

21.4.9.2

Modèle 8 : Droites de même origine ...232

21.4.9.3

Modèle 5 : Droites différentes.... ...232

nÉr'ÉneNcss ...

...236

CHAPITRE 22

Séries temporelles, plans en groupes parallèles et

croisés

...237

22.1 Airatysed'unesériechronologique...239

22.1.1 Graphique

...239

21.1.2

Lissage et

filtrage

...239

22.1.2.1

Lissage par la moyenne mobile

...24t 22.1.2.2

Lissage par régression ... ...240

22.1.2.3

Lissage par régression spline cubique ...241

22.1.2.4

Lissage

exponentiel

...242

22.1

.3

Extraction de tendances et recherche de

stationnarité.

...244

Extraction de tendance par régression ...244

Effacement de tendances par differenciation ... ...245

Extraction de tendance par la moyenne

mobiIe...

...245

Stabilisation de la variance ...245

Corré logrammes et variogram mes... 247

Corréfogramme... ...247

Corréfogramme partiel... ...248

Variogramme

...248

Spectres

croisés

...249

Estimation de la période d'une variation

périodique....

...251

Périodogramrne de Whittaker et

Robinson

...251

Périodogramme de Schuster ... 25 1 Modélisation d'une série chronologique à des fins de

prévisions

...254

Modèle de

régression

...254

Modèles de lissage exponentiel ...25 5 Modèles

AR, MA, ARMA

et

ARIMA

....260

Analyse de

z

séries

chronologiques...27l

Plans en grou pes parallè|es.... ...27 2 Analyse de variance pour plan factoriel en unités

divisées...

...272

Analy'se de variance multidirnensionnelle

(MANOVA)

...278

Analy.se de covariance

(ANCOVA)

...282

Analyse d' antédépendance ... 283

Modèle

mixte...

...286

Modèles à effets fixes utilisant le maximum de vraisemblance... ... 29 1 Modèles linéaires à coefficients

aléatoires

...292

Plans

croisés

...295

22.4.1

Intérêt

duplan

crorsé...296

22.4.2 Définitions...

...297

22.4.3

Randomisation et traitement s ... 297

22.4.4

Analyse des plans

snisés 2x2...298

22,4.4.1

Analyse paramétrique par contrastes ...298

22.4.4.2

Analyse non paramétrique par

contrastes...

...-...-.-.-..--...30 I

22.4.4.3

Analyse de variance en mesures

répétées...

...303

22.4.4.4

Analyse de variance à quatre facteurs ...304

22.4.4.5

Analyse de variance avec le modèle

mixte ...

...305

22.4.4.6

Tests paramétriques ou non paramétriques pour échantillons appariés... 306

22.1.4.7

Equivalence de

termes

...306

22.4.4.8

Interprétation des

effets

...307

21.4.4.9 Attitude

en présence

d'effet

de rémanence et de tendances temporelIes ... 3 07

22.4.5

Analyse des plans croisésp

xp...308

22.4.6

Analy'se des plans croisés incomplets :

pxhavech> p.,...

...310

nÉpÉnENcES

...,...:,,...,...31

l CHAPITRE 23 Nlodélisation

de données catégorielles, de

dénombrement

et non

normales.3l3 23.1 Modèlelinéairegénéralisé...314

23.1.1

Fonction de

lien...

...314

23.1.2

Estimation des paramètres du modèle linéaire

généralisé...

... 3 1 6

23.1.3

Choix et justesse du modèle ...317

23.2 Modèle logistique....

...322

23.2.1

Modélisation desdonnéesbinaires...322

23.2.2

Modèle logistique

linéaire

...324

23.2.3

Estimation des paramètres du modèle ...324

23.2.4

Mise en ceuvre du modèle logistique et interprétation des paramètres ... 325

23.2.4.

I

Variable

X

binaire... ... 325

23

.2.4.2

Variable

X

qualitative polytomique . ...327

23.2.4.3

Variable

X

ordinale... ... 328

23.2.4.4

Variable

X

quantitative... ... 328

23.2-4.5

Interaction entre deux variables

explicatives

...329

23.2.4.6

lnteraction

mixte...

...332

23.2.5

Inférences et tests de signification des coefficients B et

dep

...333

23

.2.5.1

Rapport de cotes et tests associés ... 333

23.2.5.2

Inferences basées sur la variance de B (test de

Wald)...

...335

23

.2.5.3

Test du rapport de vraisemblance... 335

23.2.5.4

Intervalle de conhance d'une probabilité prédite par le

modèle

...336

23.2.5.5

Estimation du rapport de cotes à partir du modèle de régression logistique ... 337

23.2.5.6

Tests de

contraste

...337

23.2.6

Sélection du

modèle

...341 22.1.3.4

zL- 1a1À| -a

22.1.4.1 22.1.4.2 22.1.4.3 22.1.4.4 22.1.5

22.1.5.2 22.1.6 22.1.6.1 22.1.6.2 22.r.6.3

7tt

)1

1

22.3.1 22.3.2 22.3.3 22.3.4

223.5

22.3.6 22.3.7 22.4

(5)

Table des maiières

23.?.6.1

Test cle signification du modèle : test clu rapport de vraisembIance...34 I

23.2.6.2

Tests cl'adéouation clu modè1e... ...342

23.2.6.3

Choix des termes du modè1e...343

23.2.7

Validite clu

rnodèIe...

...349

23.2.7.1

Types de

résidus...

...349

23.2.7.2

Valeur

1evier...

...351

23.2.7.3

Mesure de ia conribution de la

i

observation à la déviance ou au khi calré...352

23 .2.1

.4

Mesure de l'influence de la l* obselvaturn sur 1e.7' paramètre... ...3 52

23.2.7.5

Mesure de l'influence de la i'observation

'

sur I'ensemble des palamètres... 3-53

23.2.7.6

Mesure de la contribution de

l-à

I'explication de i'... 3-53

23.2.7.1 Diagnostic

...353

2-3.2.8

Empkri de la régression logistique dans les études cas-térnoins... 3 56

23.2.9

Calcul d'effectilÈ d'échantillons et de

puissance...

...3-58

23.3 Modèlelogistiquepol,vtonrique...359

23.1 Modèle logistique ordinal

(régression des

eotes)...

.^"...36i

:3.4.1

Méthodes d'analyse cle dor.urées catégoriel les ordonnées... 3 64

23.4.2

Régression des cotes et test de Mann-

Whitney'

...365

13.4.3

Modèle de régression cles cotes et interprétation des par"amètres...3 67

?3.4.1

Mise en æuvre du modèle de régression des

cotes...

...368

23.4.5

Justesse du

rnodèIe....

...371

13.4.6 Puissance...

...372

23.5

RégressiondePoisson...373

23.6 Modèle log-linéaire..

...375

13.6.1

Paramètres du

modèle

...375

23.6.I

.l

Tableau de contingence 2 x 2 ...377

23.6.1

.2

'l'ableau de contingence k^

x

kr...319

23.6.1

.3

Modèle log-linéaire hiérarchiclue et non

hiérarchiclue

...379

23.6.1

.4

Tableau cle contingence À,\ x ke

x

fu...380

13.6.

1.5

Tableau cle contingence à plus de trors

dimensions...

...384

23.6.1.6

Slistèrne de

notation

...384

23.6.2

Estinration des paranrètres du modèle...386

23.6.2.1

Ëstirnateurs du maximum de vraisemblance et des rnoindres carrés... 3 87

23.6.?.2

A.nalVsS de données catégorielles par la régression

pondérée

...388

23.6.3

Mesures et tests d'adéquation du rnodèle.388

23.6.3.l Khi

carré de

Pearson

...388

23.6.3.2

Déviance et statistiqlre du rapport de vraisemblance ... 3 89

23.6.3.3

Clritère cl'infbnrration

d'Akaiké

...390

23.6.1

'fests de signifrcation des tennes cl'un

modèle

...391

23.6.4.1

Test de

Walcl...

...391

23.6.4.2

Test cl'association marginale de

Brown...39l 23.6.4.3

Test cl'association partielle de Bro\.vn...391

23.6.5

Constmction de

rnodèle

...395

23.6.5.1

Sélection a

priorid'un

rnodèle à des fins d'analy'se

conflrmative

...395

23.6.5.2

Méthode

combinatoire

...396

23.6.-5.3

Sélection clescendante ou rétrograde des tefmes

d'un modèle

...396

23.6.5.4

Sélection a posteriori des tennes

d'un

modèle incluant des variables à expliquer et des facteurs dont on cherche I'eiTet...397

23.6.5.5

Sélection ascendante des termes

d'un modèle

...397

23.6.5.6

Choix de la méthode de sélection ...398

23.6.6

Diagnostic" validité du modèle et analyse des

résidus

...401

23.6.1

Problème des cases vides et de l' éparpil 1ernent... 403

23.6.8

Relation avec le modèle logistique ...404

23.6.9

Relation avec le rapport de cotes et le test de Cochran-Mantel-l-laenszel .. ".... ^.. "... 405

23.6.10

Puissance et taille d'échanti1lon...407

RÉtrriRLINCus...

...408

CHAPITRE 24

Ana lyse de

survie

...^...409

24.1 Estimation

de la

nrurtre

de survie...412

24.1.1 Fonctionempiriquedesurvie...4l2

24.1

.2

Tableau cle

survie...

..."...412

24.1

.2.1

Estirnatiorr actuarielle de la survie ...412

24.1.3

Estimation deKaplan-Meier...414

?.4.1.4

Estimation de la rnédiane et des fractiles de

tenps

de

survie

...416

?4.2 Fonctions

utiliséss en analyse de

survie...

...-...417

24.2.1

Fonction cle survie : .1r,... ...417

24.2.2 Fonctiorrderépatition

: F1,t...417

24.2.3

Fonction de densité de protrabilité :J'i,,...418

24.2.4

ïronction de risque instantané : h,,,...418

24.2.5

Fonction de risque instarrtané cumulé :

l{,,... ...42t 24.2.6

Notions de risques propoftionnels et de risclues relat i f .\ instantanés ... ^...,. 425

24.2.1

Fonstion cl'excès de risque..."...426

24.3 Comparaison

de courbes de sun,ie...426

24.-1

.1

Tests non pararnétriques de cornparaison de deux

groupes...

..."..426

24.3.1.1

Test du

log-rank..

...427

24.3.1

.2

Test de Cehan-Wilcoxr-ur ... ...428

21.3.1.3

Test de

Tarone-Ware

...428

24.3.1.4

Test de

Prerrtice...

...428

24.3.1.5

Test de Peto-Peto et Peto-Peto modifié....428

24.3.1.6

Test de Fleming-l-Iarrington...429

24.3.1.7

'I'est de

Savage

...429

24.3.1.8

'I'est de

ften-vi...

...429

24.3.2

Comparaison de plus de deux gloupes...43 I

(6)

243.3

Comparaison de deux groupes avec ajustement à un facteur de confusion :

tests stratifiés... ... 432

24.3.4

Test de

tendance

...432

24.4

Modèle de

Cox...

...435

24.4.1

Présentation du modèIe...435

24.4.2

Estimation des paramètres du

modèle

....437

24.4.2.1

Construction de la fonction de vraisemblance... ... 437

24.4.2.2

Maximisation de la fonction de vraisemb|ance... 43 8

21.4.2.3

Estimation de

ho(ti)

...438

24.4.3 Temes

du

modèle

,...438

24.4.3.1

Variable

quantitative

...438

24.4.3.2

Variable qualitative ou catégorielle ... 439

24.4.3.3

Interaction entre deux variables

catégorielles.

... 439

24.4.3.4

Interaction

mixte...

...440

24.4.4

Contribution

d'un

ou de plusieurs tennes du

modèIe....

...440

24.4.4.1

Test du rapport de vraisemblance... 44 I

24.4.4.2

Test du

score...

...441

24.4.4.3

Test de

Wa1d...

...442

24.4.5

Construction du modè|e...442

24.4.6

Estimation du risque relatif...443

24.5 Modélisationparamétrique...448

24.5.1 Loi

exponentie|le... 448

24.5.2 Loide Weibull...

...449

24.5.3

Formes de la fonction de risque selon les

lois

...450

24.5.4

Estimation des paramètres...451

24.5.5

Justesse du modèle et outils diagnostiques... 456

24.6 Modélisation

des risques non

proportionnels

... 459

24.6.1 Evolution

des risques par groupe...159

24.6.2

Modèle de Cox morcelé...460

24.7 Variables

explicatives dépendantes

du

temps

(VEDT)...

...460

24.8 Modèle

des temps accélérés d'échec...,.461

24.9 Modèlelog-linéairedesurvie...464

24.10 Calcul

de

puissance

...465

24.10.1 Taille

de

l'échantillon.

...465

24.1A.2 Puissance

...466

24.11 ProcéduresS4S8...467

nÉrÉneNcss ...

...467

CHAPITRE 25

Méthodes

factorielles,

analyses

discriminanles,

canoniques et méthodes de

groupement

...469

25.1 Rudimentsd'analysegénérale...470

25.2 Analyseencomposantes principales...472

25.2.1

Principe de calcul et propriétés des composantes principales... ... 172

25.2.1.1

Principe général de

l'ACP

...473

25.2.1.2

Quelques rappels d'algèbre linéaire pour comprendre Ie détail des opération s ... 4"1 5 25.2.1

.3

Principe de calcul des valeurs et vecteurs

propres...

...4'76 25.2.1

.4

Représentation des ie éléments dans Rp ...478

25.2.1.5

Signification des valeurs propres...480

25.2.1.6

Représentation desp variables dans

R'

: rôle des

variables...

...481

25.2.2

Quelques aides à la réalisation et à I' interprétation d'une ACP ... ... 481

25.3

Analyse

factorielle

des correspondances ... ...,.. 497

25.3.1

La méthode du barycentre...498

25.3.2 Profils

des lignes et des colonnes ...500

25.3.3

Principe de calcul de l'A.F.C...502

25.3.3.1

ACP sur les

profils

...502

25.3.3.2 Notion

de distance et de mékique ...503

25.3.3.3

Centrage du

nuage...

...504

25.3.3.4

Matrice des variances et covariances,...505

25.3.3.5

Calcul des coordonnées sur les nouveaux axes

...

...,...506

25.3.3.6 Notion d'inertie

...506

25.3.3.7

Analyse dans R:' : problème dual...508

25.3.4

Propriétés et aides à I'interprétation de

l'AFC ...

...509

25.1

Analyse

factorielle

des correspondances

multiples (AFCM)

...514

25.4.1

Le tableau de

données

... 515

25.4.2 Distance...

... 517

. 25.4.3

Calcul des axes factoriels ...517

25.4.4

Conduite et interprétation d'une

AFCM..

,5 I 8

25.4.4.1

Préparation des

données

...518

25.4.4.2

Choix de

l'analyse

...520

25.4.4.3

Première analyse :

AFCM

sur les

variables extrinsèques

...520

25.4.4.4

Deuxième analyse :

AFCM

sur les variables

intrinsèques.

...522

25.4.4.5

Troisième analyse :

AFCM

sur les variables extrinsèq ues et intrinsèq ues ... 523

25.4.4.6

Quatrièrne analyse :

AFC

croisant les variables extrinsèques avec les

intrinsèques

...523

25.4.4.7

Cinquième analyse :

ACC

ou

ACPVI

...523

25.4.5

Propriétés des rnéthodes de groupemenl et de classification...

25.5

Méthodes de

groupement

et de

classification

...528

25.5.1

Coefficients de similarité... 529

25.5.1

.l

Problème du double zéro... ...529

25.5.1

.2

Coefficients binaires de similarité versus coefhcients

quantitatifs

...529

25.5.1.3

Coefficients binaires de similarité incluant les doubles zéros... 530

25.5.1.4

Coefficients binaires de similarité

excluant les doubles zéros ... 53 I

(7)

.rI

Table des matières XV

255.r.s

25-5.r.6

25.5.r.7

25.5.2 25.5.3 25.5.4 25.5.4.r 25.5.4.2 25.5.5

Ë.6

7.1

7.r.1

Coefficients, quantitatifs dé similarité incluant les doubles zéros ...53 I Coefficients quantitatifs excluant les

doubles zéros ...:... ...532

Coefficients probabilistes...532

Distances...:... ;...,... 534

Coefficients de corrélation et

d'association

:...535

Méthodes de groupement et de

classification

...535

Classification hiérarchique...536

Classifi cation non hiérarchique... 53 9 Propriétés des méthodes de groupement ou de classification ...54 1 Analyse

factorielle

des

proximités

et des simif arités... ...544

Anafyse

discriminante

...544

Analyse factorielle discriminante...545

Approche

géométrique.

...545

Principe de calculs des axes factoriels

discriminants

...546

Sélection des axes et des variab1es...547

Propriétés de

I'AFD

et aide à l'interprétation ...548

25.7.2

Analyse factorielle discriminante pour- variables qualitatives .-...,.548

25.1.3

Classement en grcupe ou algorithme de détermination

d'un

athibut ... 548

25.7.3.1

Cas de deux

groupes

...549

25.7.3.2

Cas de

fois $oupês

et plus ...550

25.8 Analysecanonique(AC)...-..552

25.8.1

Principe général de calcul de I'analyse

canonique...

...:...553

25.8.2

Propriétés et aide à l'interprétation de

25.9

Analyse canonique

I'AC

des correspondances

(ACC)

ou de

redondance (ACR)... 5 56

nÉpÉneNcEs...

...55e

INDEX...

Annexe

IV Tableaux

de données

* À

consulter sur le Web à l'adresse suivante :

www.chencliere.ca/Scherrer

7.1.2

7-1.3 7.1.4

(8)

a

Volume 2

2" édition

Cette

2e

édition s'adresse aux étudiants, aux chercheurs et aux professionnels dont le

bagage

mathématique

est

élémentaire. À partir des méthodes les plus simples, nous proposons, avec Biostatistique, volume

1, 2"

édition, un cours

accessible

d'initiation

à la

biostatistique.

Avec

Biostatistique, volume 2,2'édition, nous proposons un cours

de

biostatistique avancée (modélisation) qui fait appel

à des

techniques plus

élaborées.

Enfin,

grâce à des

moyens plus

complexes,

nous tentons

de

répondre

aux

préoccupations

des

praticiens exploitant

des données.

La 1'"

édition

de

Biostatistiqueaété

conçue au

tournant

des années

1980.

-,.--

Depuis

cette époque

l'application

des

statistiques

aux sciences

dtvivayy'

(biologie,

médecine, etc.) a évolué sous

l'impulsion

de

difÉrents actefrs' notamment la Food and Drug Administration, Au cours

des années 1980, cette

organisation

a su en effet

imposer une démonstration avant d'accorder

une

autorisation.

Or,

montrer un

effet est chose

relativement

"facile, mais le

démontrer

nous impose le fardeau de la preuve. Le

volume

1

expose aux

chapitres

2

(protocole)

et 14

(multiplicité

des tests)

plusieurs

exigences

méthodologiques

liées à la

démonstration.

Le

volume

2

poursuit

dans

la même

veine,

mais

dans le cadre de

la modélisation.

Si le

pragmatisme I'emporte souvent

sur la

théorie,

l'exposé

du principe

des

méthodes

reste

bien présent. Létude

des

propriétés

des

méthodes permet d'en dégager les mérites respectifs et de déterminer oir

elles

s'avèrent

efficaces et

non

biaisées.

En

cas de

biais,

sa

direction

selon les

situations

est recherchée.

Nous

avons présenté la

notion

de

statistiques robustes pour pallier

<

I'insuffisance chronique,

de connaissance de

la loi

de

distribution

des

populations d'origine.

Les données

recueillies

ne sont pas

toujours

aussi propres qu on le

souhaiterait

et des méthodes

sont proposées pour remédier au problème

des

données manquantes qui déséquilibrent un plan d'expérience,

des données

exceptionnelles ayant un poids

démesuré dans I'analyse, des données censurées

qui apportent

une

information non

négligeable, etc. Cet ouvrage

traite particulièrement

de la

modélisation

et de la

modélisation semi-paramétrique, comme

aide

à la

construction

des

modèles

a

priori.

De très

nombreux

exemples

tirés de

cas réels

facilitent la compréhension

et

l'application

des

méthodes,

la

comparaison

de

différentes

approches et

l'interprétation

des résultats.

Le

choix

des exemples ne vise pas

un

résultat

significatif

et sans équivoque, mais

conduit

à une

réflexion

sur la

pertinence

de la méthode.

Enfin' nous proposons

des codes. de

programmation applicables aux techniques

les

plus

élaborées.

Bruno Scherrer,

Ph. D. et

M.B.A., professeur

de

biostatistique pendant

17 ans à

l'Université du Québec

à

Montréal, fut également professeur invité

à

l'Écolç,polytechnique

fédérale de

Lausannê

(Suisse) et à

l'Université

de

Bourgogne (Dijon). Promoteur

des

statistiques appliquées

à

I'environnement, il dirigea

le

Centre d'études

et de recherche en sciences de

I'environnement (UQAM), fut président du Groupe

de recherche et

d'études

en

biostatistique

de

I'environnement (Montréal), puis

responsable

scientifique

à

l'Office national

de

la

chasse

(Paris).

En

1988,

Bruno Scherrer s'oriente

vers la

biostatistique appliquée

à

la biopharmacie (développement

de

médicaments). Il

crée et

dirige

le

département

de

biométrie

des

Laboratoires Jouveinal

(Fresnes),

puis dirige le département Technical Operations, Statistics and

data

management

chez Parke

Davis Warner Lambert

et

enfin devient directeur senior

de

la division Biostatistics and Reporting

à

Ann Arbor (Michigan)

chez P ftzer

Global

Research

and Development.

Aujourd'hui,

dans le cadre

d'une

retraite active,

il agit

dans

l'industrie pharma- ceutique

et dans

plusieurs universités

et

organisations internationales

en

tant

que

consultant indépendant

en

biostatistique

et

méthodologie.

I gaëtan Ilorin I éditeur

tsBN 978-2-89632-005-5

tfr

ilililililI illllllll

ll ll

g"782896"

320066"

cHENELIÈREZCATION www.cheneliere.ca

Références

Documents relatifs

6.2.1.2.1. L'intervalle interquartile est l'étendue de la distribution sur laquelle se trouvent concentrée la moitié des éléments dont les valeurs de X sont les

 La somme des carrés des différences de tous les termes d'une série statistique à un nombre quelconque est minimal lorsque ce nombre es la moyenne

Les questions figurant dans cet ouvrage sont de difficulté variable et couvrent l'intégralité du programme (pièges compris !): certaines sont relativement faciles

Notion de série statistique Le tableau de données brutes Série statistique simple Tableaux de distribution de fréquences.. Variables quantitatives Variables

Mais la structure du test d’hypoth`ese, d´etermin´ee par le choix de H 0 et de H 1 , est telle que, mˆeme s’il est vrai que le moyen du tour de taille s’est r´eduit,

On veut rejeter l’hypoth`ese nulle H 0 , et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeur p, qui est la probabilit´e d’observer une

Notons π 1 la proportion des employ´es qui arrˆetent de fumer chaque an de tous les entreprises (disons nord-am´ericaines) avec l’interdiction de fumer, et π 2 la proportion

A est maintenant considérée comme un tableau de mesures sur 4 individus (lignes) et 4 variables (colonnes). ? Ce tableau est centré pour la pondération uniforme. ? Les variances