• Aucun résultat trouvé

des consignes.

L’approche par bornes d’intervalles permet de surmonter cette difficulté en ce qu’un intervalle est une manière naturelle de représenter l’imprécision d’un terme, en particulier numérique. Toutefois, elle repose sur un certain nombre d’hypothèses a priori sur la forme que doit prendre le sous-ensemble flou ainsi que sur les statistiques à appliquer aux bornes des intervalles.

3.2 Interprétation des ENA

La section précédente présente les différents formalismes de représentation de l’im-précision liée à une ENA. Cette section considère plus spécifiquement le problème de leur interprétation, dont l’objectif est de quantifier l’imprécision qu’elles dénotent. Elle présente les trois modèles d’interprétation des ENA que nous avons pu identifier dans la littérature. Les deux premiers modèles, le modèle proportionnel (Ratio Model, RM Krifka, 2007) et le modèle basé sur des échelles (Scale-Based Model, SBM Sauerland & Stateva, 2007; Solt, 2014), se situent dans une approche théorique et linguistique alors que le troisième, le mo-dèle régressif (REGressive Model, REGM Ferson et al., 2015), se situe dans une approche empirique. Tous trois prennent le parti de l’approche par intervalles (voir section 3.1.1) : étant donnée une ENA “environ x”, ils construisent un intervalle, noté I(x). Dans chaque cas, nous soulignons les caractéristiques de x qui sont prises en compte. Les sous-sections suivantes détaillent les principes et formalismes de ces trois modèles d’interprétation des ENA. La dernière sous-section présente une synthèse de ces modèles.

3.2.1 Modèle proportionnel RM : la magnitude

Le Ratio Model, RM (Krifka, 2007) consiste à modéliser l’interprétation des ENA comme des intervalles en définissant la taille de ceux-ci comme étant un pourcentage fixe, défini par l’utilisateur, de la magnitude de la valeur de référence de l’ENA (Krifka, 2007, p. 116). En notant s ce pourcentage, l’intervalle est formellement défini comme :

IRM(x) = [x − x · s, x + x · s] (3.1)

Par exemple, en fixant s = 10%, “environ 300” est interprété comme l’intervalle [270, 330].

Ce modèle proportionnel est inspiré par la loi de Weber-Fechner impliquée dans la cognition humaine des nombres (voir section 2.2 p. 17). En effet, en conséquence de cette loi, pour une valeur de référence de magnitude x, toutes les valeurs v dont la différence

30 Chapitre 3. Etat de l’art : représentation, interprétation et calcul d’ENA

absolue à x est inférieure à s · x, c’est-à-dire telles que |v − x| ≤ s · x, où s est lié à la fraction de Weber c, sont indistinguables de x.

On voit donc que ce modèle, en ne tenant compte que de la magnitude de la valeur de référence des ENA, prend le parti d’une interprétation uniquement fondée sur la représen-tation des nombres dans le système approximatif des nombres (voir section 2.2 p. 17) et ne considère pas le système exact des nombres comme impliqué dans ce traitement.

Il peut produire des résultats contre intuitifs pour des ENA dont la valeur de référence possède plusieurs chiffres significatifs. Par exemple, dans le cas où x = 8150, avec s = 10%, on obtient IRM(8150) = [7335, 8965] : la taille de cet intervalle (1630) peut être considérée comme trop élevée par rapport au degré de précision de x, représenté par son dernier chiffre significatif et les zéros qui le suivent (50). Cette limite, qui n’apparaît pas pour les ENA dont la valeur de référence ne possède qu’un seul chiffre significatif, est due au fait que l’information communiquée par des nombres avec plusieurs chiffres significatifs est plus précise que celle communiquée par les nombres avec un seul chiffre significatif. Le modèle basé sur des échelles, présenté dans la sous-section suivante, traite de cette limite.

3.2.2 Modèle basé sur des échelles SBM : la granularité

L’approche pragmatique a été développée et formalisée par Sauerland et Stateva (2007) et Solt (2014) dans le modèle d’interprétation des ENA basé sur des échelles (SBM).

Principe général Dans ce modèle, un système d’échelles est défini comme un ensemble d’échelles exprimant différents niveaux de granularité de mesure. Par exemple, dans le domaine temporel, le système d’échelles peut être, de la granularité la plus fine à la plus grossière : minutes, quarts d’heure, demi-heures, heures, jours, etc. Dans le système décimal, les échelles peuvent être les unités, dizaines, centaines, etc.

Formellement, le système d’échelles est défini comme S = {s1, . . . , sn}, où si est le ième niveau de granularité, avec si+1> si. Un système d’échelles est dit optimal si si+1= ai · si, avec ai ∈ N (par ex., le système décimal S = {1, 10, 100, . . .}, où ∀i, ai = 10). L’ensemble des niveaux de granularité Grans(x) = {g1(x), . . . , gm(x)} auxquels appartient un nombre x est défini comme :

Grans(x) = [

{si∈S|x mod si=0}

{si} (3.2)

Par exemple, dans le système décimal, le nombre 100 appartient à trois niveaux : 1, 10 et 100, alors que 112 n’appartient qu’au niveau de granularité 1.

L’intervalle de valeurs dénotées par une expression numérique impliquant un nombre x dépend alors du niveau de granularité considéré : il contient les valeurs plus proches de x

3.2. Interprétation des ENA 31

que de tout autre point au niveau de granularité gi(x), formellement :

ISBMi (x) =  x −gi(x) 2 , x + gi(x) 2  (3.3)

L’interprétation d’une expression numérique peut être réalisée à tout niveau de granu-larité auquel elle appartient (Solt, 2014).

Considérons, par exemple, le cas x = 200. Les niveaux de granularité auxquels il appar-tient dans le système décimal sont Grans(200) = {1, 10, 100}. On peut penser comme rai-sonnable que l’interprétation se fasse au niveau des dizaines, correspondant à ISBM2 (200) = [195, 205], ou au niveau des centaines, donnant lieu à l’intervalle ISBM3 (200) = [150, 250].

Cas des ENA Dans le cas particulier des expressions numériques, les approximateurs sont utilisés pour modifier leur halo pragmatique (voir section 3.1.1 p. 23). Le locuteur peut s’en servir pour exprimer explicitement le niveau de granularité à utiliser pour l’inter-prétation (Solt, 2014). Dans le cas des ENA, pour lesquelles l’approximateur est “environ”, le niveau de granularité le plus grossier (Coarsest ) GranC(x) est utilisé (Solt, 2014). For-mellement, GranC(x) est calculé comme :

GranC(x) = sup

{si∈S|x mod si=0}

si (3.4)

L’intervalle de valeurs dénotées par une ENA “environ x” est alors être formellement défini comme : ISBM(x) =  x −GranC(x) 2 , x + GranC(x) 2  (3.5) Par exemple, ISBM(300) = [250, 350] et ISBM(340) = [335, 345].

Par conséquent, selon le modèle basé sur des échelles, la taille de l’intervalle correspon-dant à une ENA est égale au niveau de granularité le plus grossier auquel appartient sa valeur de référence.

Caractéristiques Cette approche théorique présente l’avantage de tenir compte de la granularité d’une ENA à travers un système d’échelles. On voit donc que ce modèle prend le parti de considérer que l’interprétation d’une ENA est réalisée au niveau du système exact des nombres (voir section 2.2 p. 17) et n’implique pas la magnitude de la valeur de référence et donc le système approximatif des nombres. Toutes les ENA appartenant au même niveau de granularité, quelle que soit la magnitude de la valeur de référence, conduisent à la même taille d’intervalle. Par exemple, |ISBM(8150)| = |ISBM(150)| = |ISBM(50)| = 10. Or, si le système approximatif des nombres est également impliqué dans l’interprétation des ENA, ces intervalles devraient être différents les uns des autres dans la mesure où la magnitude de la valeur de référence varie.

32 Chapitre 3. Etat de l’art : représentation, interprétation et calcul d’ENA

De plus, le modèle SBM est théorique et, à notre connaissance, n’a pas fait l’objet d’une validation empirique.

3.2.3 Modèle régressif REGM : magnitude, granularité et fiveness

A notre connaissance, seuls Ferson et al. (2015) ont empiriquement collecté des données pour proposer un modèle définissant quantitativement l’imprécision communiquée par des approximateurs.

Leur étude a consisté à demander à des participants de donner les valeurs des bornes des intervalles correspondant à différentes expressions numériques contenant des approxi-mateurs, comme : “Greece enjoysmore than 250 days of sunshine a year ” ou “Bats make up about 20% of all classified mammal species globally ”.

Le but des auteurs est de tester la pertinence de plusieurs dimensions arithmétiques de la valeur de référence des ENA comme prédicteurs de la taille des intervalles, en se basant sur des régressions linéaires.

Définitions Trois dimensions caractéristiques des nombres sont introduites pour rendre compte de l’interprétation des ENA, dont les effets sont considérés individuellement, deux à deux et tous ensemble : la rondeur (roundness), l’ordre de magnitude et la fiveness. La rondeur R(x) est définie comme la position décimale du dernier chiffre significatif (par ex., R(13) = 1 et R(130) = 2) et est liée à la granularité définie dans la section précédente : R(x) = log10(GranC(x)).

L’ordre de magnitude z(x) est lié à la valeur de référence x de l’ENA : Om(x) = log10(x). Enfin, la fiveness f (x) dépend de la valeur du dernier chiffre significatif : elle vaut 1 si le dernier chiffre significatif est 5 (par ex., 150) et 0 sinon (par ex., 140).

Dans ce modèle régressif REGM, l’intervalle correspondant à une ENA est formellement défini comme : IREGM(x) = " x −10 L(x) 2 , x + 10L(x) 2 # (3.6)

où L(x) est calculé comme :

L(x) = ω0+ ω1· Om(x) + ω2· R(x) + ω3· f (x)

+ ω4· Om(x) · R(x) + ω5· Om(x) · f (x) + ω6· R(x) · f (x)

+ ω7· Om(x) · R(x) · f (x) (3.7)

où ω0 à ω7 sont des paramètres empiriquement déterminés en réalisant une régression linéaire sur un ensemble de données collectées.

Les auteurs mettent en évidence que la combinaison de ces trois dimensions arithmé-tiques est un bon prédicteur de la taille des intervalles correspondant à des ENA. De plus,

3.2. Interprétation des ENA 33

ils montrent qu’elles sont impliquées dans l’interprétation des ENA à une échelle loga-rithmique : la rondeur et l’ordre de magnitude sont calculés comme les logarithmes de la granularité et de la magnitude de la valeur de référence.

Caractéristiques Ces résultats sont cohérents avec la manière dont sont traités les nombres et les quantités par le système cognitif humain (voir section 2.2 p. 17). En effet, l’ordre de magnitude correspond à la manière dont le système approximatif des nombres encode les quantités et la rondeur, liée à la granularité, renvoie au traitement opéré par le système exact des nombres en tant qu’interpréter une ENA est considéré comme un problème formel. Ce modèle appuie par conséquent l’hypothèse d’un compromis réalisé entre les deux sous-systèmes cognitifs responsables du traitement des nombres dans l’in-terprétation des ENA. De plus, ces dimensions relatives à la valeur de référence semblent impliquées à une échelle logarithmique, ce qui est cohérent avec le fait que la ligne mentale des nombres du système approximatif des nombres est logarithmiquement compressée (voir section 2.2 p. 17).

Toutefois, d’un point de vue méthodologique, une limite de l’étude de Ferson et al. (2015) tient au fait que les auteurs ne contrôlent pas le contexte sémantique des ENA. En effet, bien que le type d’unité auquel est rapportée chaque expression (discrète, longueur, temps, etc.) soit contrôlé, le questionnaire utilisé mélange plusieurs contextes sémantiques, ce qui peut conduire à différentes interprétations et donc à différents intervalles pour une même valeur de référence (Lasersohn, 1999; Sadock, 1977; Williamson, 1994). Par consé-quent, une étude dont le but est d’identifier les dimensions arithmétiques impliquées dans l’interprétation des ENA devrait utiliser comme matériel des ENA non contextualisées ou un contexte contrôlé.

3.2.4 Modèles d’interprétation des ENA : synthèse

De l’examen des trois modèles existants, RM (Krifka, 2007), SBM (Sauerland & Stateva, 2007; Solt, 2014) et REGM (Ferson et al., 2015), il ressort que la magnitude, la granularité (liée à la rondeur dans Ferson et al., 2015), et le dernier chiffre significatif de la valeur de référence d’une ENA sont des dimensions clés en jeu dans son interprétation. Cette analyse est cohérente avec la manière dont le système cognitif humain traite les nombres et les quantités (voir section 2.2 p. 17). En effet, la magnitude renvoie à l’encodage des quantités dans le système approximatif des nombres alors que la granularité et le dernier chiffre significatif renvoient au traitement opéré par le système exact des nombres lors de l’interprétation des ENA.

On peut également noter que les trois modèles de la littérature considèrent implicite-ment que les intervalles correspondant aux ENA sont symétriques, centrés autour de la

34 Chapitre 3. Etat de l’art : représentation, interprétation et calcul d’ENA

valeur de référence (par ex., I(100) = [95, 105]).

Enfin, ces modèles se situent dans le cadre de l’approche épistémique du vague et ne rendent pas compte du principe de tolérance lié aux expressions vagues. Par conséquent, les intervalles qu’ils définissent sont supposés correspondre à l’interprétation de tout un chacun. Or, qu’on se place dans la perspective épistémique ou la perspective sémantique du vague, un intervalle peut sembler correct pour une personne dans un contexte donné mais incorrect pour une autre personne ou dans un contexte.