• Aucun résultat trouvé

3.2 Modélisation et manipulation d’informations imparfaites

3.2.4 Modélisation d’informations incertaines, incomplètes, imprécises, linguistiques79

3.2.4.1 La théorie des sous ensembles flous

La théorie des sous ensembles flous (« fuzzy sets ») a été initialement introduite par L. Zadeh [Zadeh, 1965]. Il s’agit d’une extension de la théorie des ensembles classiques aux ensembles définis de façon imprécise. Cette théorie sert de fondement à la logique floue. Ainsi un sous-ensemble flou F d’un sous-ensemble E, se définit au moyen d’une fonction d’appartenance de E dans , qui associe à tout élément x de E son degré d’appartenance au sous-ensemble F (c’est-à-dire que x appartient « plus ou moins » à F). Lorsque cette fonction d’appartenance est normalisée (il existe une valeur x de E telle que ) on peut alors interpréter comme la possibilité que F prenne la valeur x ( est alors une distribution de possibilité). Nous parlons alors de sous-ensemble flou de type 1, que nous noterons par la suite T1FS21. En pratique, on peut associer des variables symboliques (e.g. des mots du langage courant tels que « petit », « grand », etc.) à des sous-ensembles flous (on parle alors de « variables linguistiques »), permettant ainsi d’automatiser des raisonnements lors de la mise en œuvre de systèmes flous.

Les sous-ensembles flous de type 2, que nous noterons par la suite T2FS22, ont été introduits par l’argument que les sous-ensembles flous de type 1 modélisent uniquement le caractère vague de l’information, mais pas l’incertitude. Afin de traiter l’incertitude, [Zadeh, 1975] a introduit les « generalized » T2FS (sous-ensembles flous généralisés de type 2), dont la

21 T1FS est en réalité l’abréviation de « Type-1 Fuzzy Set »

80

fonction d’appartenance est tridimensionnelle. La troisième dimension de cet ensemble est la valeur de la fonction d’appartenance en chaque point du domaine à deux dimensions qui est appelé la FOU23. La FOU représente le caractère flou d’une fonction d’appartenance de type 1, et est caractérisée complètement par ses deux fonctions englobantes ; une fonction d’appartenance basse (lower membership function ou LMF) et une fonction d’appartenance haute (upper membership function ou UMF), qui représentent chacune des T1FS [Mendel et John, 2002]. Un cas particulier des « generalized T2FS » est les « interval T2FS » (sous-ensembles flous intervalles de type 2), dont les fonctions d’appartenance sont des intervalles nets. Ils ont reçu une attention particulière dans la littérature en raison de leur complexité de calcul moindre [Coupland et John, 2008], y compris dans le domaine de l’aide à la décision [Gong et al., 2015].

3.2.4.2 Les L-fuzzy-sets

Dans la théorie des sous-ensembles flous, le degré d’appartenance d’un sous-ensemble flou est défini sur [0, 1]. Goguen a montré que ce dernier pouvait être à valeurs dans un treillis : c’est la théorie des L-fuzzy-sets24 [Goguen, 1967]. Un treillis (« lattice ») est un ensemble partiellement ordonné dans lequel chaque couple d'éléments admet une borne supérieure et une borne inférieure. Il est muni d’une relation d’ordre ⊆ réflexive, transitive et antisymétrique. La borne supérieure et la borne inférieure définissent alors deux lois internes et commutatives, associatives et idempotentes ; et . On définit donc un sous-ensemble L-flou comme étant une application de E dans . Si , on retrouve la théorie « classique » des sous-ensembles flous introduite initialement par Zadeh. Les L-fuzzy sets permettent de considérer le flou intrinsèque aux attributs ainsi que l’indétermination qui se rattache aux degrés de vérité.

3.2.4.3 Modélisation prudente des incertitudes : l’arithmétique d’intervalles

L'arithmétique d'intervalles a été, dans un premier temps, utilisée pour contrôler les erreurs d'arrondis causées par le calcul sur des nombres à virgule flottante sur ordinateur [Moore, 1966] [Moore, 1979]. En effet, l’ensemble des réels étant infini et indénombrable, les résultats

23 « footprint of uncertainty », traduit littéralement par « empreinte d’incertitude »

81

de calculs numériques sur des nombres flottants peuvent engendrer des erreurs significatives lors de leur traitement sur ordinateur, considérant que leur représentation en mémoire est par définition limitée. Les nombres réels doivent en circonstance être représentés par des approximations, c’est-à-dire des intervalles sur lesquels sont effectués les calculs. La méconnaissance de la valeur exacte d'une variable nécessite de modéliser celle-ci par un intervalle. C’est également le cas lorsque des variables représentent des mesures de quantités physiques qui sont réalisées avec une certaine imprécision due aux appareils de mesure (e.g. bornes de l’erreur25 sur une mesure). On appelle cette approche arithmétique d’intervalles, calcul par intervalle, ou encore « calcul d'erreurs » en physique.

On utilise un couple de nombres pour représenter ces intervalles d'incertitude ; par exemple l'intervalle x = [xinf, xsup] ou bien x = [x - δx, x + δx] qui définit un intervalle autour de la valeur mesurée qui inclut la valeur vraie avec une probabilité plus ou moins grande en cas d’absence d’erreur systématique.

Dans le cas d’arrondi de nombres flottants, l’addition est définie comme étant l'intervalle [xinf

+inf yinf, xsup +sup ysup]. +inf (respectivement +sup) correspond à l’opérateur « addition » de deux nombres dont le résultat est arrondi au nombre flottant « représentable informatiquement » le plus proche dans la direction -∞ (respectivement +∞). Ces arrondis permettent de conserver la propriété d'inclusion : pour tout couple de valeurs réelles dans les intervalles x et y, leur somme se trouve nécessairement dans l'intervalle résultat x + y. Dans le cas de mesures physiques entachées d’erreurs aléatoires, on cherche généralement à évaluer le degré de l’erreur aléatoire commise, soit en trouvant un majorant (ce cas conduit à des intervalles très larges au fur et à mesure des calculs) soit par l’analyse statistique d’un ensemble de mesures permettant de caractériser leur distribution de probabilité des valeurs prises et d’estimer la valeur moyenne et la variance de cette distribution.

On peut alors effectuer des opérations arithmétiques sur les différents intervalles, comme sur les nombres réels, telle que l'addition de deux intervalles x + y. Par exemple, l’addition des

25 Dans le cadre de mesures physiques on distingue en général les erreurs aléatoires, caractérisées par une distribution de probabilité répartie autour de la valeur vraie dans le cas d’erreurs purement aléatoires (on parle alors d’échantillon Bernoullien), des erreurs systématiques qu’une étude statistique ne peut détecter, comme par exemple une erreur d’étalonnage (valeur vraie inconnue)

82

intervalles et donne le résultat qui contient 0 (signe indéterminé). De manière similaire, on définit d’autres opérateurs arithmétiques tels que la soustraction, la multiplication, la division, les puissances, etc. L’ensemble des intervalles, contrairement aux nombres réels, n’admet pas de relation d’ordre total pour les opérateurs de comparaison. Cette méthode permet donc de propager ces intervalles par des calculs simples pour les opérations arithmétiques de base telles que et (sous réserve de prendre en compte des cas particuliers tels que la présence de 0 dans un intervalle dans le cas d’une division). Il est également possible d’approximer des calculs via une différentiation (développement en série de Taylor) à l’ordre 1, notamment dans le cas d’une fonction non linéaire s’appliquant à un intervalle. En pratique l’arithmétique d’intervalles permet de se focaliser sur les calculs des enveloppes basse et haute, ce qui réduit le nombre de calculs à effectuer. Dans ce cas, au lieu de n (n très grand) calculs avec une méthode de simulation de Monte Carlo, il n’y a besoin que de résoudre deux équations pour les enveloppes basse et haute, pour chaque inconnue [Guillard et al., 2011]. D’un point de vue « coût computationnel », cette méthode est donc bien plus efficace que les méthodes probabilistes.

Cependant, par définition, cette approche se prête mal aux événements répétitifs dans le temps pour lesquels une modélisation probabiliste rigoureuse est plus adaptée. De plus, elle est trop « prudente » et manque de précision. En effet, si l’on enchaine de nombreux calculs, on peut parfois obtenir des cas où « presque tout devient possible », en raison de son caractère peu spécifique. Enfin, l’arithmétique d’intervalles est un cas particulier de l'approche floue en considérant un noyau identique au support.

3.2.4.4 La théorie des possibilités

La théorie des possibilités [Dubois et Prade, 1988] [Zadeh, 1978] est un cadre formel pour la prise en compte de l'imprécision (degré de vérité des sous-ensembles flous) et de l'incertitude (vérité ou fausseté d’une proposition) dans des connaissances, ainsi que du raisonnement sur de telles connaissances. En effet, cette théorie permet d’exprimer dans quelle mesure la réalisation d’un événement est possible et dans quelle mesure on en est certain, sans toutefois avoir à disposition la probabilité de cette réalisation. Une distribution de possibilité est un ensemble flou normalisé de valeurs mutuellement exclusives. La théorie des possibilités supprime la contrainte forte d’additivité probabiliste et associe aux évènements du référentiel une mesure de possibilité (degré de croyance) notée , et une mesure de nécessité (degré de certitude) notée , vérifiant les relations suivantes : et

83

. La relation reliant la possibilité d’un événement et son contraire est alors donnée par et l’ignorance totale se traduit alors par l’équation , ce qui implique: . La théorie des possibilités est une représentation unificatrice d’informations incertaines, incomplètes, imprécises et linguistiques.

Dans la théorie des possibilités, l’ignorance n’est alors pas modélisée par l’équiprobabilité mais par une possibilité égale à 1 sur tous les événements possibles. Par exemple, pour , par le principe d’extension de Zadeh, l’ignorance sur conduit bien à l’ignorance sur (alors que le carré d’une variable aléatoire uniforme conduit à une variable aléatoire triangulaire). En effet, la possibilité est reliée à la distribution et non pas à la densité. La distribution maximale spécifique existe toujours et devient de plus en plus spécifique quand on ajoute de l’information (par exemple unimodalité). Ainsi, le modèle probabiliste est adapté au traitement d’informations précises mais dispersées. La théorie des possibilités permet en revanche de modéliser des connaissances imprécises mais cohérentes [Dubois et Prade, 1988].

3.2.5 Modélisation de connaissances à la fois aléatoires et floues : les « fuzzy

random variables »

Les interactions entre les variables floues et les variables aléatoires, et plus particulièrement leur complémentarité, ont été largement explorées dans la littérature, notamment sous le nom de « fuzzy random variables » (FRVs, traduit littéralement par les variables aléatoires floues). Trois principales définitions de FRVs ont été étudiées : [Kwakernaak, 1978] et [Kwakernaak, 1979] qui ont inventé le concept de FRV et [Kruse et Meyer, 1987] qui les ont définies comme étant des variables aléatoires, dont les valeurs ne sont pas réelles, mais des nombres flous. (2) [Puri et Ralescu, 1986] et [Klement et al., 1986] ont défini les FRVs comme des sous-ensembles flous aléatoires, c’est-à-dire la fuzzification d’un ensemble aléatoire. Leur approche a permis de palier deux limites du modèle de Kwakernaak : son mapping sur les nombres réels plutôt que sur un espace euclidien de dimension n et sa notion de mesurabilité qui est limitée aux nombres flous réels. Enfin, (3) [Liu et Liu, 2003] ont basé la notion de FRV sur un concept appelé mesure de crédibilité. Une synthèse ainsi que des exemples sur les différentes approches relatives aux FRVs sont présentes dans [Shapiro, 2012]. En résumé, les trois approches peuvent être différenciées de par la forme (i.e. variable floue ou scalaire) de l’espérance et de la variance, comme l’illustre le tableau suivant :

84

Tableau 7 : types d’incertitudes de l’espérance et de la variance pour les différentes FRVs [Shapiro, 2012]

Auteur(s) Espérance Variance

Kwakernaak Floue Floue

Puri et Ralescu Floue Scalaire

Liu et Liu Scalaire Scalaire

D’un point de vue pratique, l’idée générale est la caractérisation d’une suite d’observations floues dont la réalité est précise et est une variable aléatoire. Par exemple, supposons que l’on attribue de manière approximative la productivité de chaque parcelle lorsque l’on parcourt une exploitation. La productivité réelle est une variable aléatoire réelle. Toutefois, la précision de notre perception ne nous permet que d’avoir accès à une variable aléatoire discrète dont les valeurs sont par exemple « catastrophique, faible, moyen, élevé, exceptionnel ». Nous percevons donc des observations floues tandis que la variable aléatoire réelle n’est pas observable.

3.2.6 Combinaison d’informations incertaines, incomplètes, imprécises,