La Corrélation et la Régression
Ch. Visticot - 2002 -
Laisser un message [email protected]
La question qui se pose est de savoir, pour prendre un exemple, si les ventes dépendent ou non du budget publicitaire, et si oui, quelle est la relation entre l'importance du budget publicitaire et le montant
des ventes. Considérons les données suivantes :
Année Budget Publicitaire en K.euros Ventes en K.euros
1994 100 1250
1995 120 1400
1996 135 1650
1998 165 1920
1999 180 2100
2000 195 2250
On peut représenter graphiquement l'évolution des ventes comparée à celle du budget publicitaire.
On utilise une échelle semi-logaritmique pour compenser les différences d'échelles de valeurs
On constate que les deux courbes ont à peu près la même allure. On peut en déduire a priori, que les deux phénomènes, la publicité et les ventes évoluent de la même façon.
Mais les termes à peu près, a priori, ne sont pas précis et ne suffisent pas pour décider de la réalité du phénomène étudié.
1
2 Pour répondre à ces deux questions, on utilise un tableau de calcul ou xi ne représente plus
le temps, mais le budget publicitaire dont est sensé dépendre le montant des ventes yi
Pub Ventes
xi yi (xi - xm) (yi - ym) (xi-xm)(yi-m) (xi - xm)² (yi - ym)²
100 1250 - 49,16 - 512 25157 2417 261803
120 1400 - 29,16 - 362 10549 851 130803
135 1650 - 14,16 - 112 1582 201 12469
165 1920 15,83 158 2507 251 25069
180 2100 30,83 338 10432 951 114469
195 2250 45,83 488 22382 2101 238469
xm = 149,16
ym =
1761,66 XXXXXXXXX XXXXXXXX SXY = 72608 SXC = 6771 SYC = 783083
Bien remarquer :
- ce que l'on met en xi : le budget publicitaire, ce que l'on met en yi : les ventes.
- en bas des colonnes des xi et des yi, on calcule les moyennes xm et ym
- en bas des colonnes (xi-xm)(yi-ym), (xi-xm)², yi-ym)², on calcule les sommes SXY, SXC, SYC.
Ce qui permet de dire si les deux phénomènes sont dépendants l'un de l'autre est le coefficient de corrélation donné par la formule :
Si r est trés proche de 1, c'est-à-dire compris entre 0,6 et 1, on dit que les deux phénomènes sont fortement corrélés.
Si r est compris entre 0,4 et 0,6, on dit que les phénomènes sont faiblement corrélés.
Si r est < 0,4, on dit que les phénomènes ne sont pas corrélés.
Si les deux phénomènes sont fortement corrélés, on dit ausi qu'il y a une relation fonctionnelle entre les deux.
Cette relation est du type y = ax + b où a est donné par la formule des moindres carrés. (voir la feuille réservée à ce calcul)
b = ym - a.xm
Dans notre exemple :
r = 72608 / Racine de (6771 * 783083) = 0,997 ==> x et y sont fortement corrélés.
a = 72608 / 6771 = 10,72
b = 1762 - (10,72 * 149,16) = 162,05
La droite d'équation y = 10,72 x + 162,05 s'appelle droite de régression des ventes
3
Utilisation en Prévision
Pour avoir une prévision des ventes y, il faut connaître une prévision sur x.
Par exemple, si on nous dit que le budget publicitaire de 2001 sera de 210 K , on peut appliquer cette valeur dans l'équation :
y = 10,72 x + 162,05 = (10,72 * 210) = 2413,25 K.euros
Inversement, on peut se demander quel doit être le budget publicitaire pour espérer atteindre un montant des ventes donné.
Par exemple : quel doit être le budget publicitaire 2001 pour réaliser un chiffre d'affaires de 2500 K ?
Il suffit de retourner l'équation : y = ax + b ==> x = (y - b) / a
x = (2500 - 162,05) / 10,72 = 218,1 K.euros