Liaison entre une variable qualitative et une variable quantitative
Sidi Mohamed MAOULOUD
13 avril 2015
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 2 / 17
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 4 / 17
Soientn observations portant simultan´ement sur une variable qualitative X `ak modalit´esx1,· · ·,xi,· · · ,xl et sur une variable quantitative Y
L’objectif ici est d´eterminer s’il y a un lien entre les variablesX etY La variable X partitionne la population enk groupe : le groupe d’individus poss´edant la modalit´e x1, le groupe d’individus poss´edant la modalit´e x2, etc...
Lorsqu’il y un lien entre les variables, la mesure de la variable quantitative devrait ˆetre diff´erente d’un groupe `a l’autre.
l’objectif est donc de d´eterminer une fa¸con de mesurer cette diff´erence.
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 6 / 17
Supposons que l’on dispose d’un tableau de contingence des variablesX et Y o`u Y est regroup´ee en intervalles I1,· · ·,Ic. Par exemple, le tableau suivant croise deux variables : en ligne esp`ece et en colonne la longueur de s´epale d’un ´echantillon de 150 iris.
XXXX
XXXX XXX esp`ece
longueur
[4,5[ [5,6[ [6,7[ [7,8]
setosa 20 30 0 0
versicolor 1 25 23 1
virginica 1 6 31 12
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 8 / 17
On peut tracer les boites `a moustaches de la variable quantitative pour chacun des groupes constitu´es par les modalit´es de la variable qualitative.
Cela donne pour notre exemple :
setosa versicolor virginica
4.55.05.56.06.57.07.58.0
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 10 / 17
On peut aussi ´evaluer les moyennes et les variances des groupes XXXX
XXXX XXX esp`ece
longueur
[4,5[ [5,6[ [6,7[ [7,8] y¯ σ2
setosa 20 30 0 0 5.1 0.24
versicolor 1 25 23 1 5.98 0.33
virginica 1 6 31 12 6.58 0.43
Ensemble 22 61 54 13 5.87 0.70
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 12 / 17
le groupe d’individus poss´edant la modalit´exi de la variable qualitative X sera not´e Gi.
Pour chaque groupe Gi, on note par ¯yi,σi2 et ni, la moyenne, la variance de la variable Y ainsi que l’effectif du groupe.
On note par ¯y et σ2 la moyenne et la variance de la variable Y sur l’ensemble de la population
On a la d´ecomposition suivante
σ2= 1 n
l
X
i=1
niσi2+ 1 n
l
X
i=1
ni(¯yi −y¯)2
Ce qui se traduit
Variance totale=Variance intra-groupes+Variance inter-groupes
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 14 / 17
Si les variablesX etY sont ind´ependantes, alors il n’y aura pas de diff´erences entres les moyennes des groupes
Dans ce cas la variance inter-groupes sera petite devant la variance intra-groupe.
A l’inverse plus la variance inter-groupe est grande par rapport `a la variance intra-groupe plus les variables sont li´ee.
On construit ainsi une mesure de la force de liaison, appel´e rapport de corr´elation
ρ= Vinter Vtotal
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Sidi Mohamed MAOULOUD Liaison entre une variable qualitative et une variable quantitative13 avril 2015 16 / 17
On a 0≤ρ≤1
Le casρ= 0 correspond au cas ou Vinter = 0. Ce qui signifie que tout les groupes ont la mˆeme moyenne et donc les variables sont
ind´ependantes
Le cas ou ρ= 1 correspond au cas ouVinter =Vtotal et donc
Vintra= 0. Ceci correspond au cas ou la variableY est constante dans
chaque groupe. Ce qui correspond `a une d´ependance fonctionnelle. La connaissance du groupe (et donc de la variableX) permet de
connaitre la valeur de la variable Y
Les deux cas pr´ec´edents correspondent `a deux situations th´eoriques qu’on rencontre pas dans la pratique. En g´en´eral 0< ρ <1 et plus ρ≈1 plus la liaison est forte.