Int´ erˆ et du concept de r´ etine artificielle

Syst` eme de vision r´ etinien

1.2 La r´ etine programmable

1.2.1 Int´ erˆ et du concept de r´ etine artificielle

Dans un système de traitement d’image conventionnel, l’image est acquise par un capteur bidimensionnel (caméraCCD⁴ en général) puis transmise séquentiellement à un convertisseur analogique / numérique⁵ et enfin à un ou plusieurs calculateurs (processeur FPGA, DSP⁶, . . . ). Le flux d’informations en sortie du capteur représente un gros volume de données qu’il est nécessaire de traiter en temps réel⁷.

Un capteur matriciel est composé d’éléments photosensibles appelés pixels, le plus souvent de forme carrée ou rectangulaire, répartis orthogonalement les uns par rapport aux autres de fa¸con à réaliser L lignes et N colonnes. Chaque pixel constitue un point

élémentaire d’échantillonnage de l’image. C’est au niveau de cet élément que se produit la conversion photons / électrons. L’information obtenue est soit un courant, soit une tension. Cette grandeur peut être exploitée de deux fa¸cons :

– une lecture analogique,

– une num´erisation du signal en utilisant un convertisseur analogique / num´erique.

Dans ce cas, on obtient en sortie du système une information codée qui peut être vi-sualisée ou mémorisée pour des traitements, au moyen d’un ordinateur, par exemple.

Le traitement à effectuer après la numérisation afin de prendre une décision ou d’ef-fectuer une action se découpe en plusieurs étapes :

3pour exemple, la taille moyenne des motifs minimaux des microprocesseurs esr passée de 1 micron au début des années 1990 à moins de 0.05 micron aujourd’hui alors que pendant le même temps la fréquence d’horloge est passée de 66 Mhz à plus de 3 Ghz [Anc02].

4Charge-Coupled Device, dispositif à transfert de charges : désigne un capteur qui convertit la lumière en signaux électriques qui peuvent être ensuite numérisés

5CAN

6Digital Signal Processor soit processeur de signal numérique, un composant électronique optimisé pour les calculs de traitement du signal.

7Un système temps réel est contraint par le temps de calcul, la cadence vidéo est de 25 images par seconde soit 25Hz

...00111010...

Fig. 1.1 – Approche classique d’un syst`eme de vision artificielle.

– des op´erations de bas niveau qui traitent l’image localement, en chaque pixel.

Cette étape se prête bien à une parallélisation massive (par exemple, le lissage pour enlever le bruit moyen, le médian gaussien).

– des opérations deniveau intermédiairequi traitent des zones de l’image, des amas de pixels, des régions. Les données restent cependant structurées spatialement en distribution bidimensionnelle. Le volume d’informations à traiter se réduit en même temps que la possibilité d’effectuer des tâches en parallèle. Les données représentent des attributs tels que la surface par exemple.

– enfin des opérations de décision (haut niveau) qui agissent sur des données sym-boliques, de faible volume et dépourvues de structures spatiales (par exemple, on a reconnu ou non un élément de la scène).

La figure 1.1 présente le processus de traitement d’image sur une architecture classique en mettant en évidence leur faiblesse majeure. Les images qui sont sérialisées lors de l’extraction du capteur sont amenées à retrouver leur structure bidimensionnelle pour les traitements de bas niveau. Le flux d’information s’en trouve réduit et la dépense

énergétique est souvent supérieure à celle réellement nécessaire au traitement.

Ces architectures standard atteignent une limite technologique pour des questions de coût, d’encombrement, de débit de données inhérentes à la chaˆıne d’acquisition (goulot d’étranglement sur les entrées/sorties) et à la puissance de calcul nécessaire.

Par opposition, dans un système à base de rétine artificielle, l’aquisition de l’image, la conversion analogique numérique et les traitements de bas niveaux sont réalisés au sein même du circuit de la rétine (Figure 1.2). Les données sont traitées en exploitant au maxi-mum le parallélisme massif disponible au niveau de la matrice de capteurs. Les transferts entre circuits sont limités afin de réduire la consommation d’énergie. Les informations transmises en dehors du circuit rétinien sont des descripteurs d’image représentant un faible volume de données et facilement manipulables dans des algorithmes de plus haut niveau par desprocesseurs scalaires⁸ hôtes associés qui complètent le système. De plus,

8Un processeur est dit scalaire s’il ne traite qu’une seule donn´ee `a la fois

le processeur hôte, déchargé des traitements bas niveau, ne nécessite pas une grande puis-sance de calcul, ce qui permet d’exploiter des circuits compacts à faible consommation.

Circuit Rétine Artificielle

Un circuit de conversion Analogique / Numérique

Fig. 1.2 – Illustration de l’architecture distribuée d’une rétine artificielle numérique pro-grammable. Chaque pixel comporte un photocapteur, un élément de traitement analo-gique, un CAN et un processeur élémentaire numérique.

Ainsi, un système de vision rétinien répond à des exigences de performances en terme de :

– vitesse d’exécution, critique pour l’utilisation dans les systèmes temps réel.

Les rétines artificielles ont été inspirées par l’observation des rétines biologiques du système de vision humain. En effet, le système de vision humain, par exemple, est capable de percevoir et d’interpréter une multitude d’informations provenant d’une scène complexe en un temps très bref. Le travail de la rétine est donc de condenser l’information afin de fournir à son système externe (cortex) des images pré-traitées.

Ces traitements de bas (ou moyen) niveau sont réalisés localement et en temps réel.

De plus, ces traitements de données au sein du pixel évitent le goulet d’étranglement au niveau des entrées / sorties du capteur comme sur les systèmes de traitement d’images classiques.

Cependant, les rétines artificielles ne sont pas les seuls systèmes de traitement d’images capables de traiter l’information en temps réel. Une simple caméra as-sociée à un processeur DSP, ou même à un ordinateur puissant permet d’effectuer ces mêmes opérations de traitements d’image en temps réel. La vitesse de traitement n’est donc pas le seul enjeu majeur des rétines artificielles.

Bien sr, le temps de calcul d´epend aussi du type de traitement effectu´e et des

résolutions utilisées pour l’image à traiter. Certains types de calculs se prêtent mieux, comme nous le verrons, au parrallélisme massif que d’autres. En ce qui concerne la taille des images, un circuit massivement parralèle n’a normalement pas de temps de calcul dépendant de la résolution hormis pour certains calcul (les calculs régionnaux en règle général, que nous n’aborderons pas ici).

– compacité, requise pour les applications dans les systèmes embarqués.

Bien que la solution d’intégrer des éléments de calcul et de mémorisation au sein de chaque pixel paraisse idéale, les techniques d’intégration CMOS ne la rendent possible que depuis quelques années.

– consommation d’´energie, primordiale pour les syst`emes autonomes.

Elle permet d’éviter des transferts massifs de données sur des longues distances, transferts qui se montrent très pénalisants en vitesse de traitement mais surtout en consommation d’énergie en raison des capacités des bus de transmission.

Si l’on considère maintenant la conjonction entre la vitesse de traitement élevée, la compacité du circuit et la faible consommation d’énergie, alors les systèmes concur-rentiels aux rétines artificielles comme ceux évoqués ci-dessus sont beaucoup moins compétitifs.

Les capteurs numériques atteignent aujourd’hui une certaine fiabilité et sont utilisés dans le secteur grand public (caméscopes, photographies numérique, webcam, cellule pho-tographique de téléphones portables, . . . ), le secteur automobile (anti-collision, guidage, détecteur d’obstacles, . . . ) et des applications demandant des vitesses de lecture parti-culièrement élevées (test de crashs, analyse d’explosion) ainsi que la vidéosurveillance, la défense, ou encore pour des applications en imagerie médicale.

Afin d’améliorer l’élaboration de systèmes de vision à base de rétines numériques et de proposer des solutions optimales pour ces applications, il nous faut adapter les méthodes existantes et repenser une partie de l’algorithmie ( voir Adéquation Algorithme Architec-ture [Sor94]). Telle est la principale caractéristique de notre travail. Nous commen¸cons par nous situer dans les recherches existantes en effectuant un tour d’horizon historique des capteurs intelligents.

Dans le document Détectionetanalysedumouvementsursystèmedevisionàbasederétinenumérique M.Julien Richefeu (Page 30-33)