REPRÉSENTATION GRAPHIQUE

(1)

REPRÉSENTATION _GRAPHIQUE

DE POPULATIONS MULTINORMALES PAR DES ELLIPSES DE CONFIANCE

J.-M. CORNUET

Station de Zoologie, ^LN.R.A.,⁸⁴¹⁴⁰Montfavet

RÉSUMÉ

Dans le but essentiel de faciliter l’interprétation ^desanalyses factorielles, ^nousprésentons ^une^méthode

de représentation graphique ^depopulations multinormales _pardes ellipses de confiance calculées à _par- tir des moyennes et de la matrice de covariances de ces populations.

INTRODUCTION

En biométrie de

l’Abeille,

^l’étuded’une nouvelle

population

passe le

plus

^souvent

par ^une

étape

^de

comparaison

^{à des}échantillons de référence

représentant

^des^races^ou

des

écotypes

^connus.^La

procédure employée

habituellement

(C ORNUET

^etal., 1975;

G A

nstrt et al.,

1979;

^C^ORNUET^etal.,

1982)

consiste à situer les colonies inconnues sur

les

premiers plans

^d’une

analyse

factorielle discriminante effectuée sur la base des

populations

^deréférence. Ces dernières forment des _nuages

plus

^oumoins distincts de

points-colonies

^dontl’effectif total atteint souvent un nombre

important (généralement

entre 100 et

200).

Îlên^résulteûne

représentation graphique

^assez^confuse

qui

^rend

laborieuse

l’interprétation

^desrésultats. C’est

pourquoi,

dans le but

d’alléger

^ces

repré- sentations,

nous avons

pensé remplacer

l’ensemble des

points-colonies

^de^référencepar des

ellipses qui,

^au

prix

^de

l’hypothèse

^demultinormalité des

populations, engloberaient statistiquement

^une

proportion

^donnéedes individus.

RAISONNEMENT

Considérons une

population

^deⁿ^individuscaractérisés

par

k variables. Nous asso-

cions à

chaque

îndividu^rûn^vecteurâléatoire

X,

^dedimension k en faisant les

hypothè-

(2)

ses

classiques

^que^cesⁿ^vecteursaléatoires sont

indépendants

^et^suivent^une^{même loi}

de

probabilité d’espérance

11 ^etde matrice de covariance Z.

Soit X. le vecteur moyenne

(X. = 1 !

_n_r

^X ^r ^).

La matrice aléatoire S

= 1 ¿ (X r - ^{X.)’(X, -} ^X.)

^est ^un estimateur non

n-1

^r

biaisé de r.

Si nous supposons que la loi de

probabilité

^des

X r

^est^une^loi

multinormale,

^nous

savons alors que la variable

n t (X r -1 1 )S- 1 (Xr -11) suit

^une^loi^de^T²

^(k,

^{n -}

^{1 )}

^{de Hotel-}

ling,

^car

X r - 11

^suit^une^loimultinormale de moyenne 0

(vecteur

^{dont les}^{k éléments}

sont

nuls)

^etde matrice de covariance r. De même, ^X^r^-^X.^suit^uneloi multinormale de moyenne 0 et de matrice de

covariance n r.

n

Il en résulte

que——’(X,.-X.)S’’(X,.-X.)

^in-¹ ^suit

^également

^une ^{loi de}

T

2

(k, n - 1). ).

Dans une

représentation plane,

^nous^n’avonsque 2 dimensions. Nous ^endédui-

sons donc

l’équation

^{de la}

région

de confiance au niveau 1 ^-a de la

population qui

s’écrit :

avec :

n : nombre d’individus de la

population;

x et y : coordonnées d’un

point

appartenant ^à^la

région

^de

confiance;

x. et y. : coordonnées du

barycentre

^de^la

population;

ax, u2et

ax, : ^variances^etcovariance de la

population;

t

2

(a,

2, ^{n -}

1) :

^valeurlue dans la table de la variable Tz

pour

^le^seuil^a,²^dimensions

et un nombre de

degrés

^de^liberté^de^{n -}^1.

Remarquons

^aupassage que la table T2 se déduit sans difiïculté de celle du F de

Fischer,

^caril existe ^entreces deux lois la relation suivante :

r (!, ! - 1) = !&dquo;’! F (! - !)

^{n -}^k

Le

développement

^de

l’inéquation (1)

^conduit^à^une^surface^limitéepar ^une

ellipse

d’équation paramétrique

ênÔÊ

(0, 2!c) :

(3)

où

DISCUSSION

La condition essentielle _pour_quece mode de

représentation

soit valide réside dans la binormalité des

populations représentées

^sur^les

plans

discriminants. Les axes discriminants sont des combinaisons linéaires des variables initiales. Ces dernières sont des moyennes de mesures

morphologiques.

^Il

apparaît

^doncque ^noussoyons dans ^une situation assez favorable _pouradmettre la normalité des variables.

Cette méthode a été

développée

dans le cadre de l’utilisation de _moyensinformati- ques ^et

prend

^tout^sonintérêt si l’on peut

disposer

d’une table traçante. ^Le

jeu d’équa-

tions

[2]

se

prête

^en^effet^sans

grande

difficulté à la

programmation.

Un

exemple

^detracé témoin

apparaît

^{à la}

figure

¹^où^sont

représentés

^{à la fois}^les

points-colonies

^et^les

ellipses

^de^chacune^des

populations.

^Il^est

possible

^de^constater^la

bonne coïncidence entre les _nuagesréels et les surfaces

elliptiques

^ainsi

qu’entre

^le^seuil

prévu (5 %)

^etla fraction de colonies extérieures aux

ellipses (7

^sur^un^{total de}

159,

^soit

4,4 %).

Outre

l’augmentation

^{de la}lisibilité et son automatisation

possible,

^cetype ^de

représentation

permet

d’apporter

^une^certaine

objectivité

^{dans le}tracé des contours

d’une

population.

GRAPHIC REPRESENTATION OF MULTINORMAL POPULATIONS BY CONFIDENCE ELLIPSES

Introduction

When a new honeybee population is under ^abiometrical study, ^{it is}generally compared ^tosamples ^of

known origin. Usually (CORNUET ^etal., 1975; GADBIN et al., 1979; CORNUET et al., 1982), ^we

(4)

locate unknown colonies in the first planes ôfâdiscriminant factorial analysis ^carriedôutôn^the^basisôf

reference populations. The latter form clouds of ^{more or}less distinct colony-points, which number _may be quite important (generally ^between¹⁰⁰^and200).

Consequently, ^thegraphic representation ^becomesconfusing ând^theinterpretation ôfresults, difficult. That is why, ^{in order}^tosimplify ^theserepresentations, ^wethought ôfreplacing reference colo-

ny,points :

by ^ellipseswhich would include statistically ^agiven proportion of individuals, ^themultinormality

of populations being ^assumed.

Rationale

Let us consider a population ^ofⁿindividuals characterized by ^kvariables. With each individual r, we associate an aleatory ^vectorX, of dimension k. As it is classically assumed, these n aleatory ^vectors

are supposed ^to^beindependant ând^tofollow the same law of probability ^withâmean and â^covariance

matrix E.

Let X. be the mean vector (X.

= 1 n 1 Y,,

^X,).

The aleatory ^matrix^S

= ——. !

^{(X, -}^X.)’(X,— X.) ^is^anunbiased estimator of E.

n 1

,

(5)

If we assume that the law of probability ^ofX., ^ismultinormal, ^wethen know that the variable

M

’(X,—

;

u) ^S-¹(X,-,u) ^followsâ^{law of ’h}^(k,^n-¹⁾ôfHotelling, ^sinceX!_p ^followsâmultinormal law with a mean vector 0 (vector ^which^kêlementsâre0) ândâcovariance matrix E. In the same way, X, - ^X.^followsâmultinormal law with a mean vector 0 and a covariance matrix

n - 1 L.

Hence,

n

In a plane representation, ^there^areonly ^twodimensions. The equation of the confidence area at the

(1 - &oelig;) ^level^{of the}population is therefore ^asfollows :

with :

n : number of individuals of the population;

x, y : coordinates of a point belonging ^tothe,confidence area;

x., y. : coordinates of the mean of the population;

ax,

ay,

a,, : variances and covariance of the population;

t

z(a, 2, ^{n -}1) : value read in the table of the T2 variable for a ( 1 - cr) level, ^twodimensions and (n - 1) degrees of freedom.

The T2table is easily deduced from the F (Fischer) table, since these two laws are related as follows :

Resolving ^theinequality (1) ^leads^toânârea^limitatedby ânellipse ^whichparametric equation ⁱⁿO, (

O^E (0,2 7r)) ^{is :}

where :

Discussion

This type ^ofrepresentation ^{is valid}only ^{when the}binormality ^ofpopulations in the discriminant

planes ^can^beâssumed. The discriminant axes are linear combinations of the initial variables. The latter are means of morphometric ^data. Therefore, ^{we are}ⁱⁿâ^fairposition ^toâdmit^thenormality ^{of the}

variables.

This method was worked out to take advantage ôf^theûseof a computerized plotter. As a matter of fact, the formulas (2) âreeasily programmable.

(6)

An example ôfâ^testdrawing îsgiven (Fig. 1) displaying ^both^coloniesândellipses ôfêach population. Âgood agreement îsnoticed between the actual clouds and the elliptical ^surfacesând

between the given ^level(95 %) ^{and the}proportion of colonies within their ellipses (152/157 ⁼95,6 %).

In addition to the increase in legibility ^{and the}possible computerization, this type of representation gives â^certainobjectivity ^to^thedrawing ôf^theôutlinesôfpopulations.

Reçu pour publication ^en^decembre1981.

Eingegangen ^im^Dezember^1981.

REFTRENCES BIBLIOGRAPHIQUES

C

ORNUETJ.-M., ^{J. F}^RESNAYE^et^L.TASSENCOURT, ^{1975. -}Discrimination et classification de populations

d’abeilles à partir de caracteres biométriques. Apidologie, ⁶(2), ^145-187.

C

ORNUETJ.-M., J. ALBISETTI, N. MALLET et J. FRESNAYE, 19H2. - Étude biom6trique ^d’unepopulation

d’abeilles landaises. Apidologie, ¹³(2), ^3-13.

G

ADBIN C., ^J.-M.^C^ORNUET ^et^J.FRESNAYE, 1979. - Approche biométrique ^{de la}variete locale d’Apis mellifica ^L.dans le sud tchadien. Apidologie, 10 (2), ^137-148.

REPRÉSENTATION GRAPHIQUE

REPRÉSENTATION GRAPHIQUE

l’Abeille,

population

plus

étape

comparaison

représentant

écotypes

procédure employée

(C ORNUET

1979;

1982)

premiers plans

analyse

populations

plus

points-colonies

important (généralement

200).

représentation graphique

qui

l’interprétation

pourquoi,

d’alléger

repré- sentations,

pensé remplacer

points-colonies

ellipses qui,

prix

l’hypothèse

populations, engloberaient statistiquement

proportion

population

par

chaque

X,

hypothè-

classiques

indépendants

probabilité d’espérance

(X. = 1 !

X r ).

= 1 ¿ (X r - X.)’(X, - X.)

n-1

probabilité

X r

multinormale,

n t (X r -1 1 )S- 1 (Xr -11) suit

(k,

1 )

ling,

X r - 11

(vecteur

nuls)

covariance n r.

que&mdash;&mdash;’(X,.-X.)S’’(X,.-X.)

également

(k, n - 1). ).

représentation plane,

l’équation

région

population qui

population;

point

région

confiance;

barycentre

population;

ax, u2et

population;

(a,

1) :

pour

degrés

Remarquons

Fischer,

r (!, ! - 1) = !&dquo;’! F (! - !)

développement

l’inéquation (1)

REPRÉSENTATION _GRAPHIQUE

^X ^r ^).

= 1 ¿ (X r - ^{X.)’(X, -} ^X.)

^(k,

^{1 )}

que——’(X,.-X.)S’’(X,.-X.)

^également

= ——. !