• Aucun résultat trouvé

Au delà de la question de la représentation et de l’interprétation des ENA, se pose celle de leur combinaison dans le calcul. Nous examinons ici les études issues de la psychologie cognitive qui traitent du calcul imprécis.

Les adultes, les enfants et les animaux dépourvus de langage verbal sont capables de réaliser des calculs arithmétiques avec des opérandes approximatives (Barth et al. 2006; 2008 ; Gilmore et al., 2010; Knops et al., 2009), en particulier l’addition et la soustraction. Ces habilités cognitives sont examinées dans le cadre d’études portant sur le système approximatif des nombres (voir section 2.2 p. 17). Les méthodes mises en œuvre dans les études portant sur le calcul approximatif se déroulent en deux étapes. La première consiste à présenter deux tableaux de points aux sujets, correspondant à une représentation non-symbolique des opérandes considérées. Dans la seconde étape, un ou plusieurs tableaux de points sont présentés, correspondant au résultat du calcul considéré. Dans le premier cas, les sujets doivent dire si le nombre de points présents dans le dernier tableau est inférieur ou supérieur à la somme ou à la soustraction des deux opérandes (Barth et al. 2006; 2008 ; Gilmore et al., 2010). Dans le second cas, le sujet doit sélectionner parmi plusieurs tableaux de points celui qui correspond au résultat de l’opération (Knops et al., 2009).

Ainsi, dans ces études, le problème de l’imprécision et de sa propagation n’est pas directement traité. En effet, à aucun moment, l’imprécision associée aux opérandes n’est évaluée, par exemple, en demandant au participant d’estimer la plage de quantités de points que contient un tableau présenté. De plus, il ne lui est pas demandé de produire lui-même le résultat d’un calcul imprécis. Les données ainsi collectées ne permettent donc pas de mettre en relation l’imprécision associée aux opérandes et celle associée au résultat. Pourtant, l’étude de la propagation des imprécisions dans le calcul imprécis, que nous nous proposons de traiter dans cette thèse, ne peut faire l’économie d’une estimation, de la part des participants, des imprécisions liées aux opérandes et au résultat d’un calcul.

De plus, les opérandes utilisées dans ces études sont représentées non-symboliquement, contrairement aux ENA considérées dans cette thèse. A notre connaissance, aucune étude

3.4. Bilan 35

du calcul impliquant des opérandes symboliques, telles que les ENA, n’a été publiée. Bien que la problématique de ces études diffère sensiblement de celle que nous nous proposons de traiter, on peut relever que la loi de Weber-Fechner (voir section 2.2 p. 17) apparaît comme valable pour les calculs imprécis (Knops et al., 2009) : ceci indique que le système approximatif des nombres est impliqué dans le calcul imprécis, bien que le calcul arithmétique soit une tâche qui relève typiquement du système exact des nombres (De-haene, 2003).

3.4 Bilan

Dans ce chapitre, nous avons présenté un état de l’art portant sur le traitement des ENA, selon trois axes : leur représentation formelle, leur interprétation et leur combinaison dans le calcul.

En premier lieu, nous avons présenté deux approches formelles classiquement utilisées pour représenter les imprécisions numériques : l’approche par intervalles, correspondant à la perspective épistémique du vague et l’approche par sous-ensembles flous, correspondant à la perspective sémantique. Ces deux approches sont celles qui sont mises en œuvre dans nos travaux pour représenter l’imprécision dénotée par une ENA (voir chapitre 5).

Dans un deuxième temps, nous avons examiné trois modèles d’interprétation des ENA identifiés dans la littérature. Cet examen suggère que trois dimensions arithmétiques de la valeur de référence d’une ENA, formalisées différemment selon le modèle considéré, seraient impliquées dans son interprétation : la magnitude, la granularité et le dernier chiffre significatif. Il nous a également permis de souligner l’hypothèse implicite de ces modèles, selon laquelle la plage de valeurs dénotées par une ENA est centrée sur sa valeur de référence. Cet examen motive nos travaux présentés dans le chapitre 4, portant sur une définition formelle des dimensions arithmétiques de la valeur de référence des ENA et sur l’étude de leur implication dans l’interprétation des ENA.

Enfin, dans la dernière section de ce chapitre, nous avons présenté les études qui peuvent être mises en rapport avec la problématique du calcul imprécis. Celles-ci portent essentiel-lement sur l’arithmétique appliquée à des quantités imprécises représentées visuelessentiel-lement. A notre connaissance, aucune étude portant sur le traitement et la propagation des impré-cisions exprimées verbalement n’a été publiée à ce jour. Cette lacune théorique motive nos travaux décrits dans le chapitre 8.

Chapitre 4

Interprétation des ENA : définition

et validation empirique des

dimensions

Ce chapitre présente notre contribution à l’étude de l’interprétation des Expressions Numériques Approximatives par l’être humain, selon deux axes. Le premier consiste à définir et formaliser les dimensions arithmétiques et cognitive rendant compte de l’inter-prétation des ENA, à partir de la revue de littérature et en tenant compte de la manière dont l’être humain traite et représente cognitivement les nombres.

Le second axe est une étude empirique au cours de laquelle des données réelles sont col-lectées auprès de non-experts, qui nous permettent de valider les dimensions arithmétiques que nous proposons comme impliquées dans l’interprétation des ENA. Cette étude consti-tue la première étape vers la modélisation computationnelle de l’interprétation : elles seront ensuite combinées dans le cadre de modèles computationnels décrits et expérimentalement validés dans le chapitre 5.

Dans la section 4.1, nous définissons et formalisons les dimensions arithmétiques et cognitive des ENA que nous proposons pour rendre compte de leur interprétation. La problématique et les hypothèses de cette étude sont détaillées dans la section 4.2. La section 4.3 décrit les méthodes mises en œuvre pour collecter, nettoyer, pré-traiter et analyser les données. La section 4.4 présente les résultats obtenus. Ceux-ci sont discutés à la lumière de la littérature dans la section 4.5.

Plusieurs parties de ce chapitre ont fait l’objet d’une publication, Lefort et al. (2017c).

38Chapitre 4. Interprétation des ENA : définition et validation empirique des dimensions

Dimension Définition formelle Exemple

Magnitude x 8150

Granularité Gran(x) = 10i où 10

i = min{i|ai 6= 0}

Dernier chiffre significatif LSD(x) = ai∗ 5 Magnitude relative RelM ag(x) = ai· 10i∗

50 Nombre de chiffres significatifs N SD(x) = q − i+ 1 3 Complexité Cpx(x) = N SD(x) − B(x) 2.5

TABLEAU 4.1 – Les six dimensions que nous proposons d’un entier positif x = Pq i=0ai· 10i, illustrées pour x = 8150 dans la dernière colonne. B(x), utilisé pour le calcul de la complexité, est défini dans l’équation (4.1).

4.1 Définition et formalisation des dimensions des ENA

Cette section introduit les définitions et notations des dimensions caractérisant les ENA, que nous avons conceptualisées à partir des caractéristiques sur lesquelles sont basés les modèles de la littérature (voir section 3.2 p. 29) ainsi qu’en les rapportant à la manière dont l’être humain traite et représente cognitivement les nombres et quantités (voir section 2.2 p. 17).

Les ENA considérées dans cette étude sont de la forme “environ x”, où x ∈ N. Pour isoler les dimensions liées à la valeur de référence d’une ENA, nous proposons de définir six caractéristiques d’un entier positif, résumées dans le tableau 4.1. Deux types, faisant respectivement l’objet des sections 4.1.1 et 4.1.2 sont distingués : les dimensions arithmétiques, en référence aux propriétés formelles des nombres et une dimensions cogni-tive, en référence à la représentation des nombres dans le système cognitif humain.

4.1.1 Dimensions arithmétiques

Dans le système décimal, un entier positif x s’écrit comme une somme pondérée de puissances de 10, x =Pq

i=0ai· 10i, où aiJ0, 9K étant ses chiffres.

Nous proposons de considérer cinq dimensions arithmétiques de x dont les définitions formelles sont données dans la deuxième colonne du tableau 4.1, avec un exemple pour le cas x = 8150. Les trois premières, la magnitude, la granularité et le dernier chiffre significa-tif sont celles dont nous supposons qu’elles sont impliquées dans l’interprétation des ENA (voir section 4.2 p. 41). Les deux autres, le nombre de chiffres significatifs et la magnitude relative sont utilisés dans la partie modélisation computationnelle (voir chapitre 5) comme caractéristiques des ENA.

4.1. Définition et formalisation des dimensions des ENA 39

Nous définissons la magnitude comme la valeur globale de x. Cette dimension est à rapprocher de l’ordre de grandeur proposé par Ferson et al. (2015) : Om(x) = log10(x).

La granularité est définie comme l’ordre de grandeur auquel le dernier chiffre significatif de x est associé dans le système décimal. Cette définition de la granularité peut être rapprochée de celle issue du modèle SBM GranC(x) (voir section 3.2.2 p. 30). En effet, GranC(x) = Gran(x) lorsque le système d’échelles sélectionné est le système décimal. La granularité telle que définie ici est également liée à la notion de rondeur proposée par Ferson et al. (2015) qui est égale à son logarithme en base 10 : Gran(x) = 10R(x).

Le dernier chiffre significatif, noté LSD(x) (Last Significant Digit ) est une dimension plus générale que la fiveness proposée par Ferson et al. (2015). En effet, les auteurs considèrent le chiffre 5 comme un cas particulier de dernier chiffre significatif par rapport aux autres, alors que nous proposons de considérer toutes ses valeurs possibles comme des cas distincts.

La magnitude relative RelM ag(x) est le produit de la granularité par le dernier chiffre significatif. Enfin, le nombre de chiffres significatifs de x est noté N SD(x) (Number of Significant Digits).

Parmi ces cinq dimensions, trois nous paraissent particulièrement pertinentes quant à la représentation et à l’interprétation des ENA : la magnitude, la granularité et le der-nier chiffre significatif. En effet, d’une part les travaux de Ferson et al. (2015) suggèrent qu’elles sont impliquées dans l’interprétation des ENA. D’autre part, elles renvoient aux deux sous-systèmes responsables de la cognition humaine des nombres (voir section 2.2 p. 17) : la magnitude correspond à la manière dont les quantités sont encodées dans le système approximatif des nombres, qui ne tient compte que de la valeur de référence x. La granularité et le dernier chiffre significatif renvoient quant à eux au système exact des nombres dans la mesure où l’interprétation des ENA est traitée par ce système comme un problème formel, à la manière du modèle SBM (voir section 3.2.2 p. 30).

4.1.2 Dimension cognitive : la complexité

Au-delà des dimensions arithmétiques, nous proposons d’introduire une mesure de com-plexité, notée Cpx(x), pour capturer la notion de saillance cognitive des nombres, c’est-à-dire le fait que certains nombres sont plus facilement évoqués que d’autres par les êtres humains (voir section 2.2 p. 17).

Dans le système numérique arabe, deux caractéristiques des nombres influencent leur fréquence d’apparition. Premièrement, plus un nombre possède de chiffres significatifs et moins il apparaît fréquemment (Dehaene & Mehler, 1992). Deuxièmement, les nombres dont le dernier chiffre significatif est 5 et, dans une moindre mesure, 2, apparaissent plus

40Chapitre 4. Interprétation des ENA : définition et validation empirique des dimensions

fréquemment (Jansen & Pollmann, 2001).

En prenant en compte ces observations, nous proposons de définir une mesure de com-plexité pour les entiers positifs exprimés dans le système décimal qui dépend de leur nombre de chiffres significatifs N SD(x) et de la valeur de leur dernier chiffre significatif LSD(x). Plus précisément, nous proposons de formaliser la complexité d’un entier positif comme son nombre de chiffres significatifs auquel est soustrait un bonus si la valeur de son dernier chiffre significatif est 2 ou 5 et son nombre de chiffres significatifs supérieur ou égal à 2 (voir tableau 4.1 page précédente et équation 4.1 ci-dessous).

Pour des raisons de symétrie autour des multiples de 10, nous proposons de considérer le cas des entiers dont le dernier chiffre significatif est 8 de la même manière que le cas des entiers dont le dernier chiffre significatif est 2 : tous les entiers tels que LSD(x) = 2 sont de la forme (10 · k + 2) · 10i(par ex., 320 = (30 + 2) · 10). Nous proposons de traiter de la même manière, dans la fonction de bonus B(x), leurs symétriques par rapport à (10 · k) · 10i, c’est-à-dire les entiers tels que LSD(x) = 8, qui sont de la forme (10 · k − 2) · 10i (par ex., 280 = (30 − 2) · 10). Cet argument de symétrie n’a pas besoin d’être appliqué aux entiers dont le dernier chiffre est significatif est 5 puisque leurs symétriques vérifient la même propriété : LSD((10 · k − 5) · 10i) = LSD((10 · k + 5) · 10i) = 5.

La fonction de bonus B(x) distingue par conséquent trois catégories d’entiers et prend trois valeurs différentes, selon la valeur du dernier chiffre significatif LSD(x), en respectant l’ordre de la fréquence d’apparition des entiers : B(x1) > B(x2) > B(x3), pour x1, x2, x3∈ N tels que LSD(x1) = 5, LSD(x2) ∈ {2, 8} et LSD(x3) /∈ {2, 5, 8}.

Comme l’exploitation proposée de la mesure de complexité est ordinale (voir section 5.1 p. 62), les valeurs choisies sont uniquement contraintes par l’ordre induit. Nous proposons de les fixer arbitrairement à 0,5, 0,25 et 0. La fonction de bonus est dès lors formalisée comme : B(x) =        0, 5 si LSD(x) = 5 et N SD(x) > 1 0, 25 si LSD(x) ∈ {2, 8} et N SD(x) > 1 0 sinon (4.1)

La figure 4.1 illustre les valeurs de la complexité Cpx(x) = N SD(x) − B(x) pour tous les entiers x compris entre 400 et 500. La valeur minimale est 1, pour les entiers ne possédant qu’un seul chiffre significatif, soit 400 et 500. Sur cette plage, la valeur maximale de la complexité est 3, pour les entiers possédant trois chiffres significatifs et donnant lieu à un bonus nul. On peut remarquer que 450 est l’unique valeur se voyant attribuer une complexité égale à 1,5 car il s’agit de la seule de cette plage qui possède deux chiffres significatifs, dont le dernier est 5, donnant lieu à un bonus de 0,5.

Un entier dont la complexité est moins élevée est considéré comme plus saillant qu’un autre dont la complexité est plus élevée. Par exemple, 400 est plus saillant que 401 car