• Aucun résultat trouvé

2.1.4 Représentations formelles du vague

Dans le domaine de la représentation des connaissances dans les systèmes informatiques, qui traitent par nature des données précises, le vague est l’une des formes que peut prendre une connaissance imparfaite (Smets 1991; 1997).

Dans ce champ théorique, on distingue essentiellement deux types de vague, comme nous l’avons vu dans la section 2.1.2 : les imprécisions et les incertitudes. Alors que l’in-certitude renvoie au statut de la proposition, l’imprécision porte sur le contenu de celle-ci (Bennett, 2010 ; Smets 1991; 1997).

Deux types d’imprécisions peuvent à leur tour être distingués (Smets, 1997). Première-ment, l’ambiguïté fait référence à une imprécision sémantique et qualitative, comme dans la proposition “ce livre est très bon”, où “très bon” peut renvoyer à “bien écrit ” ou à “cap-tivant ” par exemple. Dans ce cas, l’imprécision porte sur le sens même du terme.

Deuxièmement, l’approximation fait référence à une imprécision quantitative, lorsque des expressions numériques sont impliquées. Dans ce cas, la valeur numérique exacte n’est pas nécessairement connue par le locuteur bien que la plage ou l’intervalle de valeurs dans laquelle elle se trouve le soit.

Il existe différentes manières de formaliser les incertitudes et les imprécisions, parmi lesquelles la théorie des probabilités (Degroot, 1970; Fine, 1973), la théorie des possibi-lités (Zadeh, 1978; Dubois & Prade, 1988) et la théorie des sous-ensembles flous (Zadeh 1965; 1975 ; Dubois & Prade, 1980).

La théorie des sous-ensembles flous (Zadeh 1965; 1975) a été développé dans le but de formaliser les imprécisions. Dans cette perspective liée au point de vue sémantique du vague, l’extension d’un concept vague n’est pas nettement limitée. Dans le cadre de la théorie des sous-ensembles flous, le degré d’appartenance d’une entité à un ensemble, n’est pas limité à vrai ou faux, ou 0 ou 1, mais peut prendre une valeur réelle dans tout l’intervalle [0, 1] (voir annexe A p. 185). Par conséquent, dans le cadre de la théorie des sous-ensembles flous, un concept est plus ou moins applicable à une entité.

2.2 Cognition humaine des nombres

Le deuxième champ théorique auquel peuvent être rattachées les Expressions Numé-riques Approximatives, en plus de la notion intrinsèque de vague, est la manière dont les individus se représentent et traitent cognitivement les nombres. Nous présentons dans cette section les aspects cognitifs relatifs aux nombres. Dans un premier temps, nous proposons un rapide tour d’horizon des usages des nombres dans la langue naturelle, par exemple le dénombrement et la mesure. Dans un second temps, nous exposons l’état de l’art quant

18 Chapitre 2. Contexte

à la manière dont les nombres et les quantités sont traités et représentés par le système cognitif humain.

2.2.1 L’usage des nombres

Dans la langue naturelle, les nombres peuvent être utilisés dans différents contextes et à différentes fins. Dans la mesure où le contexte d’une approximation numérique, comme une ENA, peut influencer son interprétation (Lasersohn, 1999; Sadock, 1977; Williamson, 1994), il nous paraît pertinent de présenter brièvement les différents usages des nombres et de préciser quels sont ceux qui peuvent faire intervenir l’utilisation d’ENA.

Parmi l’ensemble des usages possibles d’un nombre, les plus courants sont la numéro-tation, l’ordonnancement, la localisation, la mesure, le dénombrement et le calcul (Groza, 1968) : la numérotation consiste à affecter un nombre unique à chaque élément d’un en-semble d’éléments. L’ordonnancement vise à classer les éléments d’un enen-semble suivant un nombre qui leur est affecté, du plus petit au plus grand ou du plus grand au plus petit, par exemple. La mesure consiste à déterminer la valeur d’une grandeur physique, généralement au moyen d’un instrument. Le dénombrement peut être rapproché de la mesure puisqu’il s’agit de déterminer la quantité d’éléments présents dans un ensemble. Enfin, le calcul consiste à effectuer des opérations mathématiques.

Intuitivement, les ENA peuvent s’appliquer dans le cadre de deux usages : le dénombre-ment et la mesure. En effet, en tant qu’approximations, les ENA portent sur des quantités et seuls ces deux usages en impliquent. On peut toutefois noter que ces deux types de quantités ne sont pas représentés dans les mêmes ensembles de nombres : le dénombrement est réalisé dans l’ensemble des entiers naturels, N, alors que la mesure peut être réalisée dans l’ensemble des réels, R.

2.2.2 Représentation et traitement cognitifs des nombres

Deux sous-systèmes cognitifs différents sont impliqués dans la cognition des nombres et des quantités (Dehaene 2003; 2009) : le système approximatif et le système exact des nombres. Nous les présentons dans un premier temps avant d’exposer la notion de saillance cognitive des nombres qui renvoie aux préférences des individus quant à certains nombres.

Deux sous-systèmes cognitifs Le premier sous-système cognitif responsable du trai-tement des nombres, appelé système approximatif des nombres (Approximate Number Sys-tem) repose sur des représentations approximatives, analogiques et non-symboliques (De-haene, 2003). Les nombres y sont représentés sur une ligne mentale logarithmiquement compressée, sur laquelle deux quantités x1 et x2 peuvent être distinguées si la valeur

ab-2.2. Cognition humaine des nombres 19

solue de leur différence absolue est supérieure à une fraction c, appelée fraction de Weber, de la plus grande des deux, formellement :

|x1− x2|

max(x1, x2) > c (2.1)

Cette indistinguabilité entre quantités proches conduit à des imprécisions lorsque des estimations sont réalisées. Par exemple, en estimant, sans compter, le nombre de points dans un tableau présenté visuellement, on ne peut distinguer s’il y en a 98 ou 101. La valeur de la fraction de Weber c varie d’un individu à l’autre et selon l’âge (Halberda et al., 2008). En moyenne, elle serait de 0, 11 (Halberda & Feigenson, 2008) ou 0, 12 (Pica et al., 2004). Les représentations issues du système approximatif des nombres sont abstraites et indé-pendantes de la modalité de présentation (Holyoak & Walker, 1976; Dehaene, 2003; Walsh, 2003). En effet, le rôle de ce sous-système est d’encoder la magnitude de la qualité considé-rée (nombre, espace, temps, luminosité, volume sonore, etc.). Enfin, on peut noter que la représentation des quantificateurs (voir section 2.1.2 p. 12) est réalisée sur la ligne mentale des nombres du système approximatif des nombres (Coventry et al., 2010).

Les représentations du deuxième sous-système, le système exact des nombres, sont exactes et symboliques (Dehaene, 2003; Gelman & Butterworth, 2005). Basées sur le lan-gage, elles ne souffrent d’aucune imprécision. Le système exact des nombres est responsable du traitement des faits arithmétiques.

Ces deux systèmes ne sont pas totalement indépendants l’un de l’autre. En effet, d’une part, le système exact des nombres est, d’un point de vue évolutif, plus tardif (Gelman & Gallistel, 2004; Gelman & Butterworth, 2005) et son développement est fondé sur le système approximatif des nombres (Berteletti et al., 2010).

Enfin, la sémantique des nombres repose sur le système approximatif des nombres (De-haene & Cohen, 1995). Autrement dit, une quantité exprimée verbalement ou communiquée par écrit, bien que traitée dans un premier temps par le système exact des nombres, ne prend sens que lorsque sa magnitude est encodée dans le système approximatif des nombres. Aussi, mettre en relation deux nombres, par exemple, dans une tâche de comparaison, ne peut se produire qu’au niveau des représentations analogiques du système approximatif des nombres.

Saillance cognitive des nombres Du point de vue représentationnel, certains nombres sont plus saillants que d’autres, c’est-à-dire sont plus facilement évoqués par le système cognitif que d’autres. En effet, il a été observé, dans des corpus de textes et de jour-naux quotidiens, que certains nombres apparaissent plus fréquemment que d’autres dans la langue naturelle (Dehaene & Mehler, 1992; Jansen & Pollmann, 2001).

20 Chapitre 2. Contexte

Il a été montré que dans le système numérique arabe, deux caractéristiques des nombres influencent leur fréquence d’apparition. D’abord, plus un nombre possède de chiffres signifi-catifs, plus il est complexe à générer et moins il apparaît fréquemment (Dehaene & Mehler, 1992). D’un point de vue cognitif, les nombres fréquents seraient stockés en mémoire sous forme d’information lexicale alors que les nombres moins fréquents seraient générés par une procédure de type pas à pas (Dehaene & Mehler, 1992). Deuxièmement, les nombres dont le dernier chiffre significatif est 5 et, dans une moindre mesure, 2, apparaissent plus fréquemment (Jansen & Pollmann, 2001).

Ces nombres plus fréquents sont appelés nombres référents (Dehaene & Mehler, 1992) et sont ceux qui couvrent une large part de la ligne mentale du système approximatif des nombres, sur laquelle sont représentées les quantités. Ils sont donc particulièrement adaptés pour servir de valeurs approchées dans le cadre de l’approximation de valeurs précises (Dehaene & Mehler, 1992).

2.2.3 Les ENA à la lumière de la cognition des nombres

Du modèle de la cognition humaine des nombres, deux perspectives dans le traitement des expressions numériques approximatives peuvent être considérées. Premièrement, inter-préter une ENA consiste à estimer l’imprécision, c’est-à-dire la part couverte par la valeur de référence de l’ENA sur la ligne mentale représentant les quantités dans le système ap-proximatif des nombres. Cette perspective conduit à considérer la valeur numérique de l’ENA comme pertinente puisqu’elle correspond à la magnitude encodée.

Deuxièmement, les ENA étant des expressions linguistiques et numériques, leur traite-ment implique égaletraite-ment le système exact des nombres. Cette perspective conduit à consi-dérer ce traitement comme un problème formel, entendu comme un raisonnement arith-métique, comme celui proposé par le modèle basé sur des échelles décrit dans le prochain chapitre (voir section 3.2.2 p. 30). En effet, formellement, estimer l’imprécision dénotée par une ENA relativement précise, par exemple “environ 4730 ”, uniquement à la lumière de sa magnitude conduirait à une plage de valeurs beaucoup trop large, car comparable à celle de “environ 4700 ” ou “environ 5000 ”. Or intuitivement, l’imprécision associée à “environ 4730 ” devrait être nettement inférieure à celle associée à “environ 5000 ”.

Il nous semble par conséquent raisonnable de penser que l’attribution d’une imprécision à une ENA résulte d’un compromis entre ces deux perspectives. Par exemple, dans le cas de “environ 8150 ”, l’imprécision liée à sa représentation analogique devrait être importante, proche de celle correspondant à “environ 8000 ” car l’ordre de grandeur de leur magnitude est similaire. Au contraire, pour le système exact des nombres et en tant que fait numérique, “environ 8150 ” est une description beaucoup plus précise de ce qui est évalué ou compté que