• Aucun résultat trouvé

3.3 Les fonctions perceptives

3.3.4 Spécications du module de perception

Comme nous l'avons souligné en début de chapitre, le développement d'un module de per-ception est essentiel pour permettre au modèleCOSMODRIVEde percevoir et de se représenter  mentalement  l'espace routier, an de pouvoir prendre des décisions et interagir adéquatement avec l'environnement situationnel et les autres usagers de la route. C'est à ce titre un composant crucial pour permettre la simulation dynamique de la cognition. Le développement de ce module était même le principal objectif de cette thèse : créer les points d'entrée des informations visuelles provenant de l'environnement en direction des représentations mentales visuo-spatiales.

Mais comme nous l'avons discuté précédemment, les fonctions de perception ne peuvent pas se concevoir indépendamment des fonctions cognitives, au premier rang desquelles se trouve la représentation mentale tactique (modèle mental visuo-spatial de l'environnement correspondant à la conscience de la situation du conducteur). Il convient donc impérativement d'inscrire la

10[Marr et al., 1982] décrit la perception et l'interprétation d'une scène tridimensionnelle comme étant le résultat de trois niveaux d'analyse : (i) Traitement des intensités dans la scène, ce qui donne un ensemble de primitives en deux dimensions (primal sketch : première ébauche), (ii) Traitement des distances à l'observateur, ce qui donne une carte de profondeur (2.5 dimensionnal sketch : ébauche 2.5D), (iii) Correspondance entre l'ébauche 2.5D et les connaissances sur la scène pour donner l'ébauche 3D. Cette approche appréhende ainsi la perception comme une succession de trois étapes primordiales : (i) segmentation, (ii) reconstruction, (iii) reconnaissance. Cela an de construire une représentation tridimensionnelle de la scène observée. Cette approche, niant l'utilité de toute connaissance a priori, a été beaucoup utilisée en vision articielle.

perception du conducteur dans un cycle global de l'activité de conduite  Perception-Cognition-Action , où les représentations mentales alimentent la perception tout autant que la perception alimente les représentations mentales. Ces deux processus ÷uvrent le plus souvent de concert, pour permettre le pilotage du véhicule dans un environnement dynamique en perpétuelle évolu-tion.

Ces caractéristiques générales de la perception du conducteur permettent de spécier les principales fonctionnalités dont devra disposer le module de perception à implémenter. Pour cela nous allons commencer par expliciter l'architecture fonctionnelle de ce module, pour ensuite décrire les champs visuels simulés, puis spécier les techniques nécessaires pour la création d'un  ÷il virtuel  intégrant notamment une  fovéa  simulée, composante privilégiée de ce récepteur sensoriel pour la perception et l'intégration des informations visuelles.

3.3.4.1 Spécications fonctionnelles des processus et de l'architecture du module Le module de perception est chargé d'assurer l'interface entre l'environnement et le modèle du conducteur. Pour cela, il doit extraire les informations visuelles dans la scène routière et les traiter pour pouvoir construire des représentations du monde extérieur, internes au modèle.

Au regard de la nécessité d'inscrire la prise d'information du conducteur dans un  cycle perceptif , ce module devra comporter au moins deux processus principaux de collecte et de traitement de l'information visuelle :

ˆ Un processus bottom-up  d'Intégration Cognitive , qui sera dirigé par les données per-çues dans l'environnement et qui sera en charge de traiter ces informations pour les faire remonter aux niveaux cognitifs

ˆ Un processus top-down  d'Exploration Perceptive , qui sera dirigé par les connaissances (au premier rang desquelles les schémas de conduite deCOSMODRIVE), et qui permettra d'orienter activement la perception du monde en pilotant  physiquement  l'÷il du modèle. Par ailleurs, ce module de perception doit pouvoir gérer les diérentes demandes d'attention visuelle provenant de nombreuses sources diérentes. Pour permettre cela, il est nécessaire d'in-tégrer au module une fonction de gestion lui permettant de manipuler des objets informatiques représentant ces demandes. Ainsi, le module de perception doit s'articuler autour d'une fonction de gestion qui dirige un ÷il dans l'environnement an d'en extraire l'information puis la faire remonter en direction de la zone stockant l'information ainsi récupérable par le demandeur.

Enn, le module de perception intègre un ÷il simulant l'appareil sensoriel visuel humain, il est donc nécessaire de faire un ÷il virtuel possédant des champs visuels diérents intégrant une fovéa.

Pour diriger les processus internes au module de perception, il est nécessaire d'utiliser un système de communication permettant de lui transmettre des requêtes incorporant les besoins de positionnement de l'attention visuelle.

L'ensemble de ces considérations nous oriente vers le développement d'un processus de  Ges-tion des Stratégies Visuelles . Ce processus recevrait, d'un côté (correspondant aux entrées du processus), des  demandes d'information  (en provenance des processus cognitifs tactiques ou stratégiques, par exemple, ou du module d'action en charge de piloter du véhicule ) ainsi que des

 sollicitations perceptives  plus ou moins fortes, en provenance de l'environnement (fonction de la saillance ou de la prégnance des stimulations visuelles, par exemple). Le terme générique et neutre de  Requêtes Perceptives  pourrait être utilisé ici pour qualier à la fois ces demandes et ces sollicitations. De l'autre côté (correspondant aux sorties de ce processus), ce gestionnaire aecterait les ressources (du point de vue de l'attention visuelle comme du point de vue du po-sitionnement eectif du récepteur sensoriel) en fonction de règles de priorités et/ou de principes de gestion.

3.3.4.2 Modélisation du récepteur sensoriel :  l'÷il virtuel 

La modélisation et la simulation de l'÷il humain a fait l'objet de multiples travaux et constitue un domaine de recherche à part entière, ayant débouché sur de multiples propositions de solutions techniques. Dans le cadre de cette thèse, il s'agissait de limiter nos ambitions et nos objectifs, en ne simulant que certaines fonctions de cet organe complexe qu'est l'÷il.

La première diculté que nous avons préféré contourner est la simulation de la vision bino-culaire. En eet, simuler le système binoculaire permettrait d'utiliser la diérence entre les deux yeux pour, comme l'humain, estimer la distance des objets et leur vitesse, améliorer la vision en faible luminosité, etc. Mais la fusion de données nécessaires à cette simulation est trop lourde pour les gains apportés. Nous avons donc préféré nous baser sur un système monoculaire, qui permet par des moyens détournés de calculer la distance d'un objet ou sa vitesse et, par un traitement de l'image, améliorer la vision en faible condition lumineuse.

L'÷il virtuel doit avoir un champ de vision total proche de celui de l'humain. Avec deux yeux, l'humain atteint un champ visuel total horizontal de 180° (150° par ÷il : 90° côté temporal, 60° côté nasal). L'÷il virtuel devra donc simuler un champ total proche de 180° sans pour autant utiliser deux capteurs.

De plus, notre ÷il virtuel doit pouvoir simuler les mouvements les plus utiles à l'÷il humain. Il est nécessaire de pouvoir créer des saccades, des xations et des suivis de cibles (dérives). Nous pouvons nous dédouaner des micro mouvements (micro-saccades, micro-dérives et microtremble-ments) permettant à l'humain de faire varier la stimulation d'une cellule photoréceptrice pour lui éviter d'atteindre le niveau de saturation où celle-ci ne répond plus aux stimuli par une réponse neurale susante. De plus, notre simulation de l'oeil sans la tête et ses mouvements nous permet de supprimer les mouvements oculo-vestibulaires (compensation des mouvements de la tête) et notre système monoculaire ne peut simuler les mouvements de vergence des deux yeux.

3.3.4.3 Modélisation des champs visuels

Pour un module de perception permettant de gérer les deux processus principaux de percep-tion, il est nécessaire de séparer la vision fovéale du reste du champ de vision. En eet, l'attention visuelle est relative à la zone où se porte le regard de l'humain, il est donc nécessaire de dénir un point central représentant le champ visuel fovéal de l'humain. Grâce à cela, nous pourrons diriger le regard du module de perception en direction d'un objet, d'un point ou d'une zone de l'environnement.

De plus, pour simuler le processus bottom-up, il est nécessaire de simuler la vision périphérique de l'homme. Pour cela, l'objet informatique représentant les organes visuels humains devra avoir un angle d'ouverture total proche du champ de vision total de l'homme (' 180°). Une fois cette

ouverture atteinte, il sera nécessaire d'intégrer la saillance visuelle sur ce champ visuel an de dénir quelle zone de ce champ attire l'attention visuelle.

Enn, il est possible d'intégrer d'autres champs visuels pour une meilleure simulation de la vision humaine, comme la dénition du champ visuel utile qui permet l'intégration d'une partie de l'information présente dans celui-ci avec ou sans attirance du regard, ou comme les champs de vision  veille  et  impression induite  qui eux aussi permettraient une remontée d'information sans passer par la zone fovéale.

3.3.4.4 Modélisation de la fovéa

La fovéa est la zone centrale de la macula, une zone de la rétine où la concentration en cônes est la plus haute. Elle est située dans le prolongement de l'axe optique. C'est dans cette partie de la rétine que l'acuité visuelle est la plus haute. Cette zone particulière du champ visuel global permet une bonne discrimination visuelle en pleine lumière, permettant ainsi l'extraction d'informations précises. Pour bien observer un objet, l'humain doit le conserver dans cette zone, an d'intégrer les diérentes informations visuelles. Pour simuler la fovéa, il nous est donc nécessaire de dénir une partie du champ visuel de l'÷il virtuel comme étant plus réceptif à l'information visuelle. Ainsi, les objets visibles dans cette zone pourront être observés nement pour en extraire les informations nécessaires. La simulation de la fovéa demande donc une capacité d'extraction d'information ainsi qu'une capacité de discrimination spatiale proche de celle de l'humain (une seconde d'arc). De plus, la fovéa ne doit pas dépasser cinq degrés d'angle d'ouverture au sein du champ visuel total.