• Aucun résultat trouvé

Au-delà des probabilités bayésiennes : retours d’expérience sur la ville

Questions ouvertes

4. Méthodologies de la connaissance incertaine sur la ville

4.6 Au-delà des probabilités bayésiennes : retours d’expérience sur la ville

Des ontologies incertaines pour la ville

Dans Caglioni et Fusco (2014) j’ai d’abord exploré la manière de relier la réflexion sur les formalismes de la connaissance incertaine avec une approche méthodologique dont l’importance est grandissante dans la modélisation spatiale pour la ville : celle des ontologies formelles (Studer 1998, Gomez-Perez 1999).

Les ontologies formelles ont traditionnellement été une méta-modélisation des concepts utilisés dans les modèles, permettant de réduire les incertitudes liées aux définitions ambiguës des objets urbains. L’objectif des ontologies était classiquement celui de permettre l’opérabilité entre opérateurs humains et artificiels dans l’utilisation d’informations et connaissances opportunément formalisées, sur un domaine particulier (en ce qui concerne le domaine de la ville, voir par exemple Keita 2007, Teller et al. 2007). Dans la mesure où l’on reconnait le caractère irréductible des incertitudes dans la connaissance urbaine l’intérêt du géographe devrait se porter vers l’approche des ontologies incertaines. Ces dernières peuvent employer différentes modélisations de l’incertitude (probabilités bayésiennes, possibilités, évidences). Leur objectif n’est pas l’interopérabilité d’informations et

191

connaissances que l’on postule devoir être toujours certaines, mais l’interopérabilité et la possibilité d’effectuer des raisonnements corrects sur des informations et connaissances dont on aura modélisé et évalué l’incertitude. Les applications montrées dans Caglioni et Fusco (2014) sont seulement des exemples particulièrement simples montrant les principes et le potentiel d’une telle démarche. Les connaissances de domaine formalisées par les ontologies incertaines peuvent être vues comme des fragments qui pourraient être successivement récupérés dans le Web sémantique et être combinés par des modélisateurs (humains ou logiciels) comme blocs de base pour développer des modèles plus complexes : des réseaux bayésiens, des réseaux possibilistes, des réseaux bayésiens flous, etc. . Da Costa et al. (2008) ont ainsi proposé les ontologies en langage PROWL (Probabilistic Web Ontology

Language) pour développer des réseaux bayésiens multi-entités. L’intérêt de faire converger les

formalismes de la connaissance incertaine avec les ontologies formelles n’est pas exclusif au domaine de la ville, comme le témoigne Barton et al. (2017) en ce qui concerne le domaine médical.

La conclusion de l’article était que le problème du Web Sémantique sera finalement celui de combiner des ontologies utilisant différents formalismes de l’incertain. Wang et al. (2007) utilisent les théories des évidences et des possibilités pour combiner différentes ontologies déterministes par le biais de procédures d’appariement. L’indication semble donc être celle d’utiliser des théories plus générales pour combiner des ontologies incertaines entre elles, la théorie des probabilités imprécises pouvant alors permettre la combinaison d’ontologies déterministes, probabilistes, possibilistes et en théorie des évidences.

Au-delà de ces perspectives méthodologiques, je pense que le potentiel d’application des ontologies incertaines sera considérable dans le domaine de la connaissance urbaine. Les ontologies « nettes et déterministes » (crisp) de la connaissance certaine ont déjà permis l’interopérabilité dans le domaine des SIG et des Web-SIG pour la ville. Les ontologies incertaines peuvent être la phase préalable de modèles plus complexes à base d’incertitude. Les avantages semblent évidents : si l’on accepte le principe que les villes sont des systèmes complexes pour lesquels nous avons souvent des connaissances incertaines sur les mécanismes qui les régissent, dans la recherche scientifique comme dans l’aide à la décision, raisonner sur l’espace urbain est presque toujours raisonner avec de la connaissance géographique incertaine.

Modélisations probabiliste et possibiliste de la polarisation résidentielle provençale

Des premières modélisations pour la connaissance urbaine incertaine ont montré l’intérêt à sortir du cadre probabiliste bayésien. Le projet Géo-Incertitude, que j’ai piloté entre 2014 et 2015, a abouti à un premier modèle possibiliste pour la polarisation sociale des communes d’une aire métropolitaine qui a fait l’objet de plusieurs publications (notamment Fusco, Cao et al. 2015, Dubois et al. 2016). Dans ces publications, le modèle possibiliste a pu être comparé à son équivalent probabiliste, qui avait été développé dans la forme d’un réseau bayésien par F. Scarella dans le cadre de sa thèse (Scarella 2014). Le modèle a été développé pour rendre compte des dynamiques de polarisation résidentielle observées dans l’aire métropolitaine marseillaise au cours des trente dernières années, une aire de plus de trois millions d’habitant au tour de Marseille, Aix-en-Provence, Toulon et Avignon. Le modèle se focalise sur la répartition spatiale des chômeurs et des cadres en tant que facteurs structurants de la morphologie sociale de l’aire métropolitaine (Centi 1996, Fusco and Scarella 2011). La surreprésentation d’une de ces deux populations cibles est ainsi assimilée, respectivement, à un état de dévalorisation et de valorisation de l’espace résidentiel. La connaissance des facteurs qui induisent la polarisation sociale des communes de l’aire d’étude est néanmoins incertaine. Plusieurs facteurs

192

contribuent à la valorisation ou à la dévalorisation résidentielle, mais ces facteurs n’agissent pas de façon strictement déterministe. Cela avait justifié le développement du réseau bayésien de F. Scarella. Le modèle probabiliste (le réseau bayésien de Scarella 2014) et son correspondant possibiliste (le réseau possibiliste de Tettamanzi et Fusco 2016) partagent la même structure de dépendances causales entre les 26 variables couvrant différents aspects tels que la position de la commune dans l’aire métropolitaine, les flux de migrations résidentielles, la présence/absence d’aménités environnementales, la nature du parc de logements, les politiques d’urbanisme et la dépendance de trajectoire (path dependency) des spécialisations sociales. D’autres caractéristiques communes sont :

- Il s’agit de modèles à base de connaissance experte. En réalité seuls les paramètres du réseau bayésien avaient été élicités et corroborés par l’analyse des données rétrospectives ; une transformation probabilités-possibilités faisant le moins d’hypothèses sur les probabilités sous-jacentes (Dubois et al. 1993) a été employée pour obtenir les paramètres du réseau possibiliste. - Ils incluent des variables observables et non observables.

- Les relations probabiliste et possibilistes sont modélisées par des connecteurs logiques bruités et incertains, respectivement, réduisant considérablement le nombre de paramètres à éliciter. Le développement de la théorie des connecteurs incertains a été une contribution originale du projet Géo-Incertitude au développement de modèles graphiques possibilistes.

- Ils modélisent des relations incertaines, incluent des paramètres de fuite (modélisant l’influence de variables omises dans le modèle) et produisent des résultats incertains.

Mais les modèles implémentent deux formalismes différents de la connaissance incertaine : les probabilités, dont les compositions par somme et produit sont bien adaptées à une connaissance « exacte » de leurs valeurs, et les possibilités dont les compositions par max/min sont mieux adaptées à une connaissance qualitative (voir Section 4.5). Une autre différence est la capacité des compositions par max/min à garder trace du paramètre élicité ayant conduit à une prédiction particulière, rendant plus simple l’analyse de sensitivité des résultats aux paramètres de causalité incertaine.

Les deux modèles ont été comparés dans leur manière d’inférer un scénario tendanciel à 10 ans de la polarisation résidentielle dans l’aire d’étude. Les résultats des simulations ont également été comparée à l’aide de géovisualisation interactives à base d’incertitude (Cao et Fusco 2016b). La représentation de la connaissance d’un phénomène complexe comme la polarisation sociale dans une aire métropolitaine est obtenue par un système de tableaux de bords avec des liens dynamiques entre carte, diagrammes et texte. Les niveaux d’incertitude, probabiliste et possibiliste, sont explorables interactivement.

Figure 4.14 – Utilisation naïve du modèle probabiliste.

Present Most probable 10y Trend Scenario

193

Figure 4.15 – Filtrage des niveaux d’incertitude des résultats probabilistes.

La Figure 4.14 montre, par exemple, une utilisation un peu simpliste du modèle probabiliste. L’état présent de la polarisation sociale y est comparé avec les prédictions les plus probables d’un scénario tendanciel de développement à 10 ans. L’état futur de chaque commune peut être valorisé, dévalorisé ou autre. Les prédictions les plus probables montrent une augmentation de la valorisation autour d’Aix-en-Provence et une certaine stabilité dans le reste de l’aire métropolitaine. Mais cette carte des résultats les plus probables fournit une fausse impression de certitude. Le contenu d’incertitude des probabilités n’y est pas exploité. La Figure 4.15a montre ainsi la seconde prédiction la plus probable du modèle. La Figure 4.15b/c filtre ces résultats par des seuils de probabilité de 0,5 et 0,7, respectivement. La couleur grise est utilisée pour représenter les communes pour lesquelles nous avons une connaissance incertaine, car les prédictions probabilistes ne dépassent pas le seuil. Clairement, en demandant davantage de certitude, les prédictions les plus incertaines sont mises en évidence. En réalité, nous éliminons la fausse perception de certitude donnée par la simple représentation des prédictions les plus probables.

Il est particulièrement instructif de comparer les résultats des deux modèles en termes de prédiction les plus plausibles. Lorsque différentes prédictions sont également plausibles (en termes de probabilité et de possibilité, respectivement) le scénario tendanciel pour une commune donnée devient plus incertain. Le maximum d’incertitude caractérise les communes pour lesquelles les trois prédictions (valorisé, dévalorisé, autre) sont également probables / possibles. Les résultats du modèle possibiliste semblent plus incertains que celui du réseau bayésien. Pour chaque commune, une prédiction plus probable est toujours obtenue, tandis que plusieurs prédictions peuvent être également possibles (Figure 4.16a). Cependant, les différences de probabilités obtenues par conditionnement de valeurs élicitées, pourraient ne pas être retenues significatives. Lorsque des seuils sont imposés à ces différences, plusieurs prédictions peuvent être considérées comme étant équiprobables (Figure 4.16b/c/d). Les prédictions du réseau bayésien deviennent alors de plus en plus incertaines en comparaison à celles du réseau possibiliste. Le meilleur accord entre les modèles est obtenu lorsque l’on impose un seuil de différence de probabilité de 0.25. Dans ce cas, 77,2% des prédictions des deux modèles coïncident, le modèle possibiliste fournissant des prédictions plus

a

194

incertaines dans 17,1% des cas et celui probabiliste dans 5,7%. Les deux modèles montrent que le scénario tendanciel de la plupart des communes n’est pas totalement incertain, mais peut souvent montrer une incertitude résiduelle entre deux prédictions alternatives.

Figure 4.16 – Comparaison des résultats probabilistes et possibilistes.

Une analyse de sensitivité a été conduite pour les prédictions des modèles par rapport aux paramètres, élicités auprès des experts, des connecteurs Max bruité et Max incertain. Ces connecteurs régissent la variable clé du modèle (l’évolution de la valorisation/dévalorisation au cours de la décennie) et jouent un rôle essentiel dans les prédictions. Les résultats de cette analyse sont à première vue contre-intuitifs. Les prédictions du modèle probabiliste semblent moins impactées par

c

d b a

195

une perturbation des valeurs des paramètres du connecteur que celles du modèle possibiliste. En regardant plus de près, les prédictions du réseau bayésien, si elles se limitent aux valeurs les plus probables, sont plus instables que les prédictions possibilistes : les premières peuvent devenir incompatibles par des petites perturbations des paramètres du modèle, tandis que les secondes, en accommodant davantage d’incertitude, sont toujours des ensembles de valeurs généralisant ou réduisant les résultats obtenus en variant les paramètres.

L’étude a également révélé des différences entre les connecteurs Max bruité et Max incertain lorsqu’il s’agit d’évaluer la plausibilité d’un évènement rare produit par l’accumulation de causes qui peuvent le déclencher de façon indépendante. En général, le connecteur possibiliste se montre plus prudent et la plausibilité maximale pour l’évènement rare doit être forcée par un paramètre de seuil spécifiquement conçu. L’absence de l’évènement rare y sera toujours considérée plausible au degré maximal.

En conclusion, la connaissance de la polarisation sociale nécessite des modèles à base d’incertitude. D’un point de vue méthodologique, le modèle probabiliste ne doit pas être utilisé pour obtenir seulement les prédictions les plus probables, en donnant une fausse impression de certitude. La théorie des possibilités est une alternative intéressante pour l’inférence de connaissances incertaines dans des modèles graphiques. Elle produit des résultats plus incertains qui sont cohérents avec les incertitudes épistémiques des connaissances élicitées. Les résultats des deux modèles convergent lorsque les valeurs des probabilités sont dégradées, mais il s’agit d’un bricolage effectué a posteriori et l’incertitude épistémique est modélisée de façon plus cohérente dans le modèle possibiliste. Par les développements de connecteurs incertains au sein des réseaux possibilistes et l’évaluation de leur comportement vis-à-vis de leurs correspondants probabilistes, les résultats de cette recherche contribuent à ouvrir la voie à l’application des réseaux possibilistes dans la modélisation appliquée. La recherche méthodologique en cette direction est en tout cas loin d’être achevée, et appelle à une plus étroite collaboration entre les sciences géographiques et les sciences informatiques.

D’un point de vue géographique, l’intégration de l’incertitude donne des résultats différents par rapport à la seule utilisation des prédictions les plus probables. Qu’il soit par les valeurs dégradés des probabilités ou par celles des possibilités, l’issue la plus plausible d’un scénario tendanciel à 10 ans de l’espace métropolitain provençal est le maintien de la valorisation des communes déjà valorisées autour d’Aix-en-Provence, le maintien de la dévalorisation des communes le plus périphériques de l’aire métropolitaine, l’hésitation entre deux issues possibles pour quelques communes et des situations complètement incertaines dans l’espace intermédiaire (semi-périphérique) par rapport aux principaux centres métropolitains. Il ne s’agit pas seulement d’une image différente par rapport aux prédictions les plus probables, mais d’une image plus sincère, soulignant les limites de notre connaissance.

Le modèle possibiliste de la polarisation résidentielle dans l’aire métropolitaine provençale, montre en tout cas l’intérêt à sortir du cadre probabiliste bayésien pour mieux appréhender les situations d’incertitude épistémique dans la création de scénarios de prospective urbaine.

196