• Aucun résultat trouvé

Analogie biologique

Afin de débuter l’étude des systèmes de vision artificielle, observons un disposi- tif de vision que nous utilisons en permanence : l’oeil (fig. 1.1). L’oeil est le premier maillon de la chaîne de traitement d’image, il a un rôle de dispositif optique, d’ac- quisition et de pré-traitement de l’image.

Les maillons suivants de la chaîne de traitement de l’image sont constitués par

Fig. 1.1 – Schéma en coupe d’un oeil humain

le nerf optique et les zones du cerveau utilisées principalement pour l’analyse des informations transmises par l’oeil. Nous n’étudierons ici que la structure d’acquisi- tion et de traitement de l’information dans l’oeil. Les informations transmises par l’oeil au cortex ne sont pas les images brutes acquises par les récepteurs sensoriels

(récepteurs sensoriels de l’oeil) dans des voisinages de taille spatiale limitée (fig. 1.2 et 1.3). Concrètement, la rétine est une fine pellicule de tissu nerveux ayant la

Fig. 1.2 – Image microscopique de l’organisation d’une rétine humaine

Fig. 1.3 – Schéma organisationnel d’une rétine humaine

consistance et l’épaisseur de quelques dixièmes de millimètres. Les neurones de la rétine sont organisés en trois couches principales séparées par deux couches inter- médiaires où se font surtout des connexions entre les différents neurones (fig. 1.4). La première couche principale est constituée des cônes et des bâtonnets permettant l’acquisition du signal. Nous ne détaillerons pas cette partie.

Le seconde couche principale est constituée de cellules bipolaires. Entre la couche d’acquisition et la couche bipolaire, se situe une couche intermédiaire constituée par les cellules horizontales. Les cellules horizontales sont connectées latéralement à plusieurs cônes, bâtonnets et neurones bipolaires. Leur rôle est d’inhiber l’activité des cellules avoisinantes. Cette suppression sélective de certains signaux nerveux s’appelle l’inhibition latérale et son rôle général est d’augmenter l’acuité d’un signal sensoriel. Dans le cas de la vision, quand une source lumineuse atteint la rétine, elle peut illuminer fortement certains photorécepteurs et d’autres beaucoup moins. En supprimant le signal de ces photorécepteurs moins illuminés, les cellules hori- zontales assurent que seul le signal des photorécepteurs bien illuminés est transmis aux cellules ganglionnaires, améliorant ainsi le contraste et la définition du stimulus visuel.

1.1. Analogie biologique

Fig. 1.4 – Schéma fonctionnel d’une rétine humaine

La troisième couche est constituée de cellules ganglionnaires. Elle possède deux types principaux de cellules nerveuses, les cellules P et les cellules M . Chacun de ces types de cellules possède une localisation et une connectivité particulières. Les petites cellules ganglionnaires de type P (pour parvus (fig. 1.5), petit en la- tin) représentent environ 90% de la population totale de cellules ganglionnaires. Les grandes cellules de type M (pour magnus (fig. 1.6), grand en latin) consti- tuent environ 5% de la population ; il existe également des cellules ganglionnaires non M-non P qui ne sont pas encore bien caractérisées et qui forment le 5% restant. Les cellules de type P (fig. 1.5) sont placées près des récepteurs de type bâtonnets et cônes, elles ont un voisinage limité et une réponse maintenue aussi longtemps que leur stimulus d’entrée agit. Les cellules de type M (fig. 1.6) présentent de plus grands champs récepteurs, et propagent les potentiels d’action plus rapidement dans le nerf optique, et sont plus sensibles aux stimuli à faible contraste. La ré- ponse d’une cellule M à une stimulation est limitée dans le temps.

L’idée la plus couramment admise est que les cellules P , avec leur petit champ récepteur, sont sensibles à la forme et aux détails de l’image, et que les cellules M sont particulièrement impliquées dans la détection du mouvement du stimulus. Entre la couche bipolaire et la couche ganglionnaire, se situent les cellules ama- crines. Leur morphologie est très diversifiée, elles utilisent un nombre impression-

Fig. 1.5 – Cellules rétiniennes de type P

Fig. 1.6 – Cellules rétiniennes de type M

nant de neurotransmetteurs. En reliant les neurones bipolaires et ganglionnaires, elles forment une route alternative indirecte entre ceux-ci. Elles semblent avoir plu- sieurs fonctions mais leur rôle précis est pour l’instant encore mal compris.

Le fonctionnement de la rétine comme dispositif de traitement d’image est donc très fortement structuré. Les interactions entre cellules s’effectuent dans un voisinage de plus en plus large à mesure que l’on s’approche du nerf optique. Ces interac- tions permettent d’effectuer des calculs locaux multi-résolution. Au voisinage des récepteurs sensoriels, les cellules horizontales permettent de rehausser le contraste, opération de bas niveau basique de traitement d’image. Au voisinage du nerf op- tique, les cellules ganglionnaires de type M permettent d’effectuer des opérations de détection de mouvement sur des voisinages larges. Cette dernière opération de bas niveau relativement complexe permet ensuite au cortex visuel primaire (qui est une prolongation du nerf optique et qui à ce titre peut être considéré comme étant rattaché à l’oeil) d’interpréter les images comme un ensemble d’objets et non pas comme un ensemble de pixels. Cette dernière fonction est à la base des traitements d’image de moyen niveau reposant sur la régionalisation. Ainsi, l’ensemble cortex primaire et rétine permet d’effectuer des opérations de bas et moyen niveau mas- sivement parallèles proches de l’endroit où s’effectue l’acquisition de l’image. L’image prétraitée et régionalisée par la rétine et le cortex est ensuite transmise au cerveau. L’interprétation de l’image n’est pas effectuée à l’intérieur de la rétine (dont la complexité est relativement faible), mais à l’intérieur du cerveau (dont la complexité est très forte). Toutefois les informations transmises au cerveau ont fait l’objet de traitement ayant une échelle spatiale croissante à mesure que l’on se rapproche de celui-ci.