• Aucun résultat trouvé

4.2 Validation des dimensions arithmétiques : problématique et hypothèses 41

4.3.6 Analyses statistiques

Quatre types d’analyses statistiques, détaillés ci-dessous, sont réalisés, selon l’hypothèse considérée. Le seuil de significativité est fixé à p = 0, 01 dans chaque cas.

H1 - Magnitude, granularité et dernier chiffre significatif Pour tester les hypo-thèses d’un effet individuel de la magnitude, de la granularité et du dernier chiffre signi-ficatif, nous comparons la distribution des distances ∆Ppb(x) de plusieurs ENA (par ex., “environ 20 ” vs. “environ 30 ”).

Dans la mesure où les distributions observées ne sont pas normales, les comparaisons entre deux ENA sont réalisées en utilisant le test des rangs signés de Wilcoxon, conçu pour des mesures répétées.

Lorsque les comparaisons impliquent plus de deux ENA, le test de Friedman est em-ployé. En cas d’effet significatif détecté par celui-ci, des analyses post-hoc sont réalisées en utilisant le test de Nemenyi, conçu pour des comparaisons multiples deux à deux.

H2 - Modèle tridimensionnel à l’échelle logarithmique Pour tester la pertinence d’une combinaison des trois dimensions arithmétiques que nous proposons, la magnitude, la granularité et le dernier chiffre significatif, dans l’interprétation des ENA, nous proposons de construire un modèle combinant linéairement ces trois dimensions, noté MGLSD.

Nous comparons ce modèle linéaire à trois modèles correspondant aux approches de la littérature détaillées dans le chapitre 3. Pour chacune d’entre elles, un modèle combinant

48Chapitre 4. Interprétation des ENA : définition et validation empirique des dimensions

linéairement les dimensions qu’elles prennent respectivement en compte est construit. La comparaison est réalisée sur la base d’analyses bayésiennes.

Le modèle proportionnel RM (Krifka, 2007) est uniquement basé sur la magnitude, il est donc de la forme : ∆Ppb(x) = α0+ α1· x.

Le modèle basé sur des échelles SBM (Sauerland & Stateva, 2007; Solt, 2014) ne tient compte que de la granularité Gran(x), il est donc de la forme :

∆Ppb(x) = β0+ β1· Gran(x).

Le modèle régressif REGM (Ferson et al., 2015) est basé sur une combinaison de la magnitude, de la granularité et de la fiveness (voir section 3.2.3 p. 32), formellement : ∆Ppb(x) = γ0+ γ1· x + γ2· Gran(x) + γ3· f (x).

Enfin, l’approche MGLSD que nous proposons comme référence tient compte de la magnitude, de la granularité et du dernier chiffre significatif, formellement :

∆Ppb(x) = 0+ 1· x + 2· Gran(x) + 3· LSD(x).

Pour chaque modèle, le facteur de Bayes résultant de sa comparaison à l’absence de relation avec la variable dépendante, ∆Ppb(x) est rapporté. Les facteurs obtenus par com-paraison entre les modèles eux-mêmes sont ensuite présentés.

Pour tester l’hypothèse H2.2, prédisant que lorsque les modèles sont portés à l’échelle logarithmique, ils rendent mieux compte des intervalles observés, une seconde itération de la procédure décrite ci-dessus est réalisée, en utilisant le logarithme des variables.

On peut toutefois noter que le logarithme de la variable fiveness proposée par Ferson et al. (2015) ne peut être calculé car la fonction ne peut prendre que deux valeurs : 0 et 1.

Pour cette hypothèse, les modèles prennent respectivement les formes suivantes : — modèle proportionnel : log10(∆Ppb(x)) = α0+ α1· log10(x)

— modèle basé sur des échelles : log10(∆Ppb(x)) = β0+ β1· log10(Gran(x)) — modèle régressif :

log10(∆Ppb(x)) = γ0+ γ1· log10(x) + γ2· log10(Gran(x)) + γ3· f (x) — modèle MGLSD proposé :

log10(∆Pb

p(x)) = 0+ 1· log10(x) + 2· log10(Gran(x)) + 3· log10(LSD(x))

H3 - Symétrie des intervalles Pour tester l’hypothèse de symétrie des intervalles, nous proposons de ne pas utiliser le test des rangs signés de Wilcoxon. En effet, ce test donne un résultat significatif lorsque la différence moyenne des rangs entre les distributions est significativement différente de zéro. Par conséquent, il n’est pas adapté pour détecter des différences individuelles entre valeurs de bornes s’il n’y a pas de tendance claire de ces différences dans un sens ou dans l’autre.

Nous proposons donc d’évaluer l’égalité entre la distribution des distances des bornes inférieures à la valeur de référence x et la distribution des distances des bornes supérieures

4.3. Méthodes 49

à la valeur de référence en comptant le nombre de celles-ci qui sont égales.

Formellement, nous proposons que l’égalité Eq entre des deux distances de bornes à la valeur de référence, respectivement ∆1et ∆2, tienne compte d’une erreur relative autorisée de 10%, et soit calculée comme :

Eq(∆1, ∆2) =    1 si |∆1− ∆2| min(∆1, ∆2) ≤ 0, 1 0 sinon (4.2)

Le score de symétrie Sym(x) pour une ENA “environ x”, qui agrège l’égalité entre distances de bornes sur l’ensemble des participants P(x) pour lesquels l’intervalle corres-pondant à “environ x” n’est pas considéré comme aberrant, est calculé comme :

Sym(x) = 1 |P(x)|

X

p∈P(x)

Eq(∆Pp(x), ∆Pp+(x)) (4.3)

Heuristiques mises en place par les participants Le dernier item du questionnaire en ligne est dédié aux heuristiques mises en place par les participants pour estimer les intervalles correspondant aux ENA proposées. Les réponses à cette question ouverte sont codées et catégorisées selon les trois dimensions arithmétiques évoquées par les participants. La magnitude relative étant la combinaison de la granularité et du dernier chiffre significatif, nous considérons que l’emploi de termes se référant à cette dimension, comme “précision” (8150 étant plus précis que 8000 ou 8100 par exemple), renvoie à ces deux dimensions.

Les réponses sont classées dans l’une des quatre catégories suivantes, nommées selon la dimension correspondante :

1. Constante : cette heuristique consiste à placer les bornes de l’intervalle à une distance constante de la valeur de référence, quelle que soit l’ENA considérée. Par exemple, “fourchette systématique entre -5 et +5 ”.

2. Magnitude : les participants ayant rapporté cette heuristique lient la taille de l’intervalle à la magnitude de la valeur de référence de l’ENA, par exemple, “marges plus ou moins en proportion des grandeurs proposées”.

3. Magnitude relative : la magnitude relative, qui combine la granularité et le der-nier chiffre significatif, apparaît comme la dimension clé dans cette heuristique : “je pense que j’avais tendance à faire + ou -2 unités, dizaines, ou centaines, selon si les nombres étaient arrondis à l’unité, la dizaine, la centaine, ou au millier ”. 4. Autre : bien qu’il ne s’agisse pas à proprement parler d’une heuristique, cette

catégorie regroupe toutes les réponses qui ne peuvent être incluses dans les trois précédentes. Ces réponses concernent les heuristiques qui ne sont rapportées que par un seul participant, par exemple : “pas vraiment, mais il me semblait que le

50Chapitre 4. Interprétation des ENA : définition et validation empirique des dimensions

nombre maximal devait être plus proche du nombre exact, comme s’il ne fallait pas trop dépasser ”.

Variabilité inter-individuelle : compétences arithmétiques Deux items du ques-tionnaires sont dédiés aux compétences en arithmétique. L’objectif est d’examiner si l’usage régulier des mathématiques ou le niveau en calcul mental affectent l’interprétation des ENA.

L’effet d’un usage régulier des mathématiques est étudié en utilisant le test de la somme des rangs de Wilcoxon. Nous comparons les valeurs des bornes données par les participants pour chaque ENA séparément pour examiner la différence entre les intervalles donnés par les participants qui font un usage régulier des mathématiques et les intervalles donnés par les autres.

L’effet du niveau en calcul mental est testé en utilisant le même test. Pour ce faire, dans un premier temps, deux groupes sont créés, selon le niveau en calcul mental rapporté : les participants donnant un score compris entre 1 et 3 inclus sont affectés au groupe “faible niveau” ; le groupe “haut niveau” est composé de participants ayant rapporté un score de 4 ou 5.