• Aucun résultat trouvé

UE 10 E2 M. Delignières Outils de mesures quantitatives et qualitatives Cours 1, lundi 19 septembre 2005. 14h10- 17h55

N/A
N/A
Protected

Academic year: 2022

Partager "UE 10 E2 M. Delignières Outils de mesures quantitatives et qualitatives Cours 1, lundi 19 septembre 2005. 14h10- 17h55"

Copied!
1
0
0

Texte intégral

(1)

UE 10 E2 M. Delignières

Outils de mesures quantitatives et qualitatives Cours 1, lundi 19 septembre 2005. 14h10- 17h55 Définition de la mesure.

Qu’est ce que mesurer ?

C’est établir une correspondance bijective entre 2 ensembles, les phénomènes (ce qui est observé, ce qui existe) et les nombres (c’est abstrait mais utile pour calculer), en postulant qu’il y a une correspondance entre les opérations que l’on peut faire sur les phénomènes et les nombres. Les simulations permettent grâce aux nombres d’étudier les phénomènes sans qu’ils aient lieu.

« Les nombres » est un terme générique. Il y a plusieurs ensembles : E : les entiers (1 2 3 4 ….)

N : les entiers naturels (avec les décimaux) R : les réels (de – à + l’infini avec les décimaux) C : les complexes (i= racine -1)

Il y a donc une infinité d’opérations réalisables selon l’ensemble qui est choisit.

Il y a des niveaux d’opérations (simple pour les entiers, complexe pour les complexes).

Il y a 4 niveaux de mesure identifiable.

1. les échelles de mesure 1.1. Mesures nominales

Les nombres désignent un ou des phénomènes, mais les opérations sont impossibles.

1 : homme 2 : femme

1 + 2 ne veut rien dire.

a=b

On peut faire une substitution terme à terme.

1.2. mesures ordinales

On rajoute aux mesures nominales de l’ordre.

a>b

On ne connaît pas l’intervalle.

On peut changer les chiffres si l’ordre est conservé.

1.3. mesures d’intervalles

On rajoute l’égalité entre les intervalles, on peut donc additionner et soustraire.

a-b = c-d

On peut transformer selon l’équation y=a x +b.

1.4. mesure de rapport

On rajoute l’égalité des rapports avec la nécessité du 0.

a/b = c/d

On peut transformer avec la multiplication pas une constante, y= a x 2. les résumés statistiques

2.1. tendance centrale

Pour les échelles nominales, c’est le mode, il peut y en avoir plusieurs. C’est la (ou les) catégorie la plus représentée. Le mode dépend de la manière dont on classifie les phénomènes.

Pour les échelles ordinales, on utilise la médiane. C’est la valeur pour laquelle 50% des valeurs sont supérieures et 50% inférieures.

La médiane et le mode sont une des valeurs de l’échantillon ce qui n’est pas le cas de la moyenne.

Pour les échelles d’intervalles, on utilise la moyenne arithmétique.

(2)

Pour les échelles de rapport ou utilise les moyennes harmonique ou géométrique.

2.2. dispersion Variable nominale.

La variance est exprimée au carrée de la mesure, elle n’est donc pas utilisable. En abaissant à la racine la variance on obtient l’écart type qui est la distance moyenne des valeurs par rapport à la moyenne.

L’entropie mesure la probabilité d’identifier une mesure prise au hasard faisant partie du mode. L’entropie est forte si un mode se détache fortement.

Les cristaux ont un maximum d’entropie les gaz ont une entropie la plus faible.

Variable ordinale.

La médiane coupe l’échantillon en 2. Les médianes des 2 échantillons coupent l’échantillon en 4 ce qui donne les quartiles. Cette séparation peut se faire en décile où l’on a 10% des mesures entre chaque décile.

Echelle de rapport.

Coefficient de variation= écart type/moyenne

Nominale mode entropie

Ordinale médiane Quartiles Intervalles moyenne écart type

Rapport moyenne géo

ou harmo coefficient de variation

Cours 2, jeudi 13 octobre 2005. 14h07-16h00 3. l’exploitation des outils de mesures

Pour vérifier qu’une distribution est normale on utilise le test de KS (Kolmogorov Smirnof).

La distribution est symétrique autour de la moyenne (avec du bruit).

Pour faire une comparaison de 2 moyennes on utilise le t de Student. La grandeur de la différence ne permet pas de conclure sur la différence des distributions. On doit prendre en compte la différence entre les 2 moyennes mais aussi la grandeur de l’écart type.

On prend la valeur absolu de la différence des moyennes et on divise par l’écart type ce qui correspond au t de Student.

Lorsque le t est calculé la valeur du p nous indique notre pourcentage de chance de nous tromper. La convention est de 5%.

Exemple, on compare la taille des filles et des gars et le poids avant et après régime.

On a 2 échantillons appariés dans un cas et 2 échantillons indépendants dans l’autre cas.

Le t de Student n’est pas le même pour des groupes indépendant et pour des groupes appariés.

Le t de Student ne peut comparer que 2 groupes et 2 moyennes.

Lorsque l’on compare 3 groupes on utilise une analyse de variance ou Anova.

L’Anova fait comme le t de Student, elle compare les moyennes. Même pour 2 moyennes l’Anova peut être utilisée.

L’Anova calcul le F de Snedecor.

Anova à un facteur (comparaison du salaire de 3 ou 10 CSP). Le F de Snedecor nous dit s’il y a une différence, mais il ne nous dit pas où sont les différences.

(3)

Après l’Anova on utilise donc des tests post hoc qui vont eux comparer 2 à 2 les échantillons. Il y a une dizaine de tests dont les tests de Scheffé, de Tukey, et de Newmnn Keuls.

Un seul test post hoc est nécessaire. A nous d’utiliser le test qui nous donne les résultats que nous attendons.

L’analyse variance peut travailler sur des groupes indépendants ou appariés.

Anova à groupe indépendant.

Anova à mesures répétées.

Anova à 2 facteurs (comparaison du salaire de 3 CSP selon le sexe) Effet CSP, effet sexe, et effet d’interaction en CSP et sexe.

1er facteur 3 niveaux (3 CSP).

2ème facteurs 2 niveaux (homme ou femme)

Le F de Snedecor nous donne les résultats selon chaque facteur.

F CSP F sexe

F interaction CSP par sexe

On peut faire des analyses de variance en multipliant les facteurs, mais c’est déconseillé pour nous, car communiquer sur de tels résultats est difficile.

On peut inférer une relation de causalité avec l’Anova.

Les corrélations.

On a 2 échantillons appariés, x et y.

Est-ce qu’il y a une relation entre les valeurs et x et celles de y.

C’est le cas si l’on a une droite proportionnelle.

Si les points sont éparpillés, où lorsque l’on a une droite parallèle à une des axes, il n’y a pas de corrélation.

Pour calculer la corrélation on utilise de r de Bravais-Pearson. -1< r <1.

Si r= +1 on est dans une droite parfaite et l’on doit se poser la question de savoir si on a pas calculer la même chose.

A 0,8 ou 0,9 on a une corrélation très forte.

Si r = -1 on a aussi une relation parfaite mais négative.

Le r = 0 est le cas d’une droite parallèle à un axe ou des points appariés.

On n’a pas le droit d’inférer de relation causale sur la base d’une corrélation.

Pour les test paramétrique.

On utilise ceci si :

- les mesures sont au moins d’échelle d’intervalle - les distributions sont normales

Test paramétrique test non paramétrique.

t de Student pour échantillons indépendant U de Mann-Whitney

analyse de variance pour groupe indépendant Kruskal-Wallis (1 seul facteur) t de Student pour échantillons appariés Wilcoxon

analyse de variance à mesures répétées Friedman (1 seul facteur) la corrélation de Bravais-Pearson Spearman ou Kendal

Un petit effet est trouvé par une Anova mais par les tests non paramétriques qui sont beaucoup moins sensibles.

La régression multiple.

Avec des échantillons normaux.

On exprime la variable Y en fonction de prédicteurs.

Y=a1X1 + a2X2 + A3X3 + a4 Equation en données normalisées.

Les a sont alors proches d’une même valeur

(4)

La régression multiple est basée sur des mesures de corrélation, il n’y a donc pas de causalité.

Si on n’a pas assez de sujet on fait une prédiction a partir de 50 sujet, puis on calcul les facteurs faciles à mesurer les X, on fait alors une équation de régression a partir de 50 sujet pour avoir les a et des X qui sont mesurer chez beaucoup de personnes.

C’est un bon outil pour convaincre un employeur.

Le chi 2

Tableau d’effectif.

Seulement avec des effectifs. Variables nominales. Si on n’a pas d’effectif on oublie le chi 2.

Les plans d’expériences.

Groupe contrôle (ne subit pas le traitement) et groupe expérimentale (qui subit le traitement).

Il est important que les groupes ne diffèrent que par l’effet expérimental.

La distribution aléatoire pour faire les groupes est absente de biais.

Les procédures aveugles et double aveugles.

Le fait que les sujets sachent ou non qu’ils appartiennent au groupe contrôle ou au groupe expérimental.

Les sujets ont souvent tendance à aller dans le sens de l’expérimentateur.

En aveugle les groupes ne savent pas s’ils sont expérimentaux ou contrôle.

En double aveugle, ni les groupes ni l’expérimentateur ne savent qui sont les groupes contrôles et expérimentaux.

Cours 3, vendredi 14 octobre 2005. 8h11-11h34 Pause de 30 minutes.

Comment calculer ce qui n’est pas mesurable ?

Avec les échelles nominales, on ne peut pas faire grand-chose !

Avec les échelles ordinales, on peut mettre des valeurs sur des effets, des sensations…mais les opérations sont interdites.

Beaucoup de questionnaires où l’évaluation se fait par échelle se permettent de calculer des moyennes et de faire des analyses statistiques qui ne sont pas corrects. Les échelles de Lickert en font partie.

Les échelles ordinales ont tendance à se sophistiquer pour ressembler le plus possible aux échelles de rapport.

Les échelles analogiques visuelles permettent, à l’aide d’un curseur, d’avoir une échelle de rapport. Les intervalles ont du sens.

L’analyse factorielle ou analyse en composante principale, permet de vérifier que plusieurs items mesurent la même chose.

Il faut au moins 150 sujets.

L’analyse factorielle permet de déterminer les causes de corrélation, mais on ne sais pas lesquels. Ça nous permet d’en déduire le nombre de test pour mesurer.

Références

Documents relatifs

Si l'air est pollué, Monsieur le Pré- sident aux grands discours, c'est peut-être parce que vous autres, membres de Conseils d'Adminis- tre-Rations influents, avez fait tout,

La vache voulait qu’on lui dise s’il te plait (message de

C’est Igor qui est le plus malin, il attrape la galette en disant qu’il n’est pas intéressé / c’est le renard qui est le plus malin et qui attrape la galette en faisant

C’est Igor qui est le plus malin, il attrape la galette en disant qu’il n’est pas intéressé / c’est le renard qui est le plus malin et qui attrape la galette en faisant

les approches cognitives dans le dialogue

Mes tenues sont sobres, élégantes et, si possible, assorties avec mes yeux bleus.. Je ne suis

je me suis rabattue sur une couleur assez proche (mais plus foncée) mais ça n'est pas ce que je voulais.. Qui

I'll tell you two things : I don't like pink and I've got my left hand on my hip?. As Emily, I am wearing