• Aucun résultat trouvé

Statistiques deux variables

N/A
N/A
Protected

Academic year: 2021

Partager "Statistiques deux variables"

Copied!
4
0
0

Texte intégral

(1)

BTSA M41 Mme LE DUFF

- 1 -

Modèle linéaire

La relation entre les variables sera exprimée sous la forme d'une équation de droite : Y = a.X + b.

Représentation graphique des données.

Calcul du coefficient de corrélation linéaire et interprétation. Détermination de la droite de régression et des résidus.

Calcul du coefficient de corrélation linéaire

On l’obtient à l’aide de la calculatrice graphique.

TI 82 Casio Graph 25

Stat 1 Edit : permet d’entrer les valeurs de x dans L1, puis celle de y dans L2.

Stat 3 Calc : Linreg(aX+b), puis (Sdn L1 , Snd L2) Enter

Ceci nous donne a et b et r.

Dans le menu Stat, entrer les valeurs de x dans List 1, puis celle de y dans List 2.

Calc

Set, entrer dans 2VarXList : List 1 2VarYList : List 2 Exe puis Calc Reg X (Linear) Ceci nous donne a et b et r.

Le résultat d'un coefficient de corrélation sera toujours compris dans l'intervalle [-1;1].

Un coefficient de corrélation positif (resp. négatif) indique que le nuage de points est croissant (resp. décroissant).

Un alignement parfait du nuage de points donne une corrélation de -1 ou de 1. Lorsqu'il n'y a

aucune relation entre les variables, le coefficient de corrélation vaut 0.

Le coefficient de corrélation linéaire est un indice qui mesure le degré de relation entre les deux variables étudiées. La qualité de la relation est basée sur la linéarité des points (relation linéaire). Le coefficient de corrélation est habituellement noté r.

(2)

BTSA M41 Mme LE DUFF

- 2 -

Interprétation du coefficient de corrélation

Dans beaucoup de situations, le coefficient ne prend pas des valeurs idéales telles que -1, 1 ou 0. Pour retenir l'hypothèse de corrélation entre les variables, il faut comparer le coefficient de corrélation calculé aux coefficients de corrélation critiques lus sur la table statistique.

Pour utiliser cette table statistique vous devez : Définir la ligne sur laquelle les valeurs critiques du coefficient de corrélation seront lues. Cette ligne correspond au

degré de liberté défini par n-2 (effectif total

- 2).

Les deux coefficients correspondent aux valeurs du coefficient de corrélation pour un risque de 5% et 1%. Ce risque est la

probabilité de se tromper si on admet que

les séries sont corrélées.

En comparant le coefficient de corrélation calculé à ceux lues sur la table, la

conclusion est :

o qu'il n'y pas de corrélation si le coefficient calculé est inférieur à celui donné pour un risque de 5%.

o que la corrélation est moyenne si le coefficient calculé est compris entre les deux valeurs de la table.

o que la corrélation est forte si le

coefficient calculé est supérieur à celui donné pour un risque de 1%.

(3)

BTSA M41 Mme LE DUFF

- 3 -

Droite de régression

Les coefficients a et b sont obtenus à l’aide de la calculatrice graphique.

TI 82 Casio Graph 25

Stat 1 Edit : permet d’entrer les valeurs de x dans L1, puis celle de y dans L2.

Stat 3 Calc : Linreg(aX+b), puis (Sdn L1 , Snd L2) Enter

Ceci nous donne a et b et r.

Dans le menu Stat, entrer les valeurs de x dans List 1, puis celle de y dans List 2.

Calc

Set, entrer dans 2VarXList : List 1 2VarYList : List 2 Exe puis Calc Reg X (Linear) Ceci nous donne a et b et r.

Calcul des résidus

Les résidus ei représentent l'écart entre les points observés et les valeurs théoriques obtenues à l'aide de

la droite de régression. Ces valeurs sont synthétisées dans un tableau. Formule à retenir pour le calcul des résidus :

La somme des résidus est nulle dans le cas d'un modèle linéaire

Autres modèles.

Représentation graphique de la série : le nuage de point n'est pas linéaire.

Réalisation d'un changement de variable afin de linéariser le nuage. Calcul du coefficient de corrélation linéaire et interprétation. Détermination de la droite de régression.

Détermination de la courbe d'ajustement afin de revenir aux variables d'origine. Détermination des résidus à l'aide de la courbe d'ajustement.

Modèle exponentiel

Les croissances exponentielles sont souvent citées pour illustrer des évolutions rapides.

Changement de variable

La linéarisation des données passe par la modification suivante :

(4)

BTSA M41 Mme LE DUFF

- 4 -

Détermination de la courbe d'ajustement

Le passage de la droite de régression à la courbe d'ajustement utilise les propriétés de la fonction exponentielle.

Droite de régession : Z = a.X + b

Ainsi, d'après le changement de variable : ln(Y) = a.X + b Utilisation de la fonction exponentiel : eln(Y) = ea.X + b

D'où : Y = ea.X + b Ainsi : Y = ea.X . eb Donc : Y = (ea)X . eb

Ainsi : Y = B.AX avec A=ea et B=eB

Modèle puissance

La linéarisation du nuage de points s'effectue à l'aide d'un double changement de variable :

T = ln(X) et Z = ln(Y)

Détermination de la courbe d'ajustement :

Droite de régression : Z = a.T + b

Ainsi, d'après les changements de variable : ln(Y) = a.ln(X) + b Utilisation de la fonction exponentiel : eln(Y) = ea.ln(X) + b

D'où : Y = ea.ln(X) + b Ainsi : Y = ea.ln(X) . eb

Donc : Y = (eln(X))a . eb

Ainsi : Y = B.Xa avec B=eB

Ajustement logarithmique.

Changement de variable On poseT =lnX .

Détermination de la courbe d'ajustement :

b x a

Références

Documents relatifs

Bien que ces deux critères aient été construits à partir d’idées différentes, distance (entre deux tables de contingence) pour le X2 et coefficient de

Cependant il peut être satisfaisant de constater qu'un facteur est étroitement corrélé à une variable qui ne figure pas explicitement dans le tableau d'où est issu ce facteur;

En 1846, Auguste Bravais publia dans les Mémoires de l'Institut de France une commu- nication intitulée : « Analyse mathématique sur les probabili- tés des erreurs de situation d'un

On a introduit ( [ 10]) la notion d’homogénéité du transfert entre deux distributions p et q d’une variable ordonnée : c’est le cas dans lequel l’ordre de

Pour pouvoir obtenir des procédures de décision qui permettent d’accorder la même confiance à toutes les décisions, il faudra accepter parmi l’ensemble des décisions

On expose une méthode permettant de mesurer la corrélation entre deux échan- tillons de valeurs de variables ordinales X et Y, X étant dichotomisée.. Ensuite,

Pour exprimer l’écart entre ces deux coefficients on pourra utiliser les relations matricielles qui précèdent (KENDALL est à CONDORCET ce que SPEARMAN est à

des relations entre variables ou les ressemblances entre individus, incite à penser que les méthodes les plus classiques, Analyse en Composantes Principales