1.2 Vision pour la d´ etection et la reconnaissance des
1.2.2 Etat de l’art sur les m´ ethodes de d´ etection d’obstacles routiers 35
elev´e que celui de capteurs actifs comme le Radar ou le Lidar.
1.2.2 Etat de l’art sur les m´ethodes de d´etection d’obstacles
rou-tiers
Cette section n’a pas pour but de constituer un ´etat de l’art exhaustif sur les
diff´erentes techniques permettant de d´etecter les obstacles routiers dans les images.
Toutefois, nous cherchons `a faire un tour d’horizon des principales m´ethodes
utili-s´ees pour les syst`emes monovision, notamment en infrarouge. La figure 1.3 donne
un exemple d’une sc`ene routi`ere film´ee en IR o`u les obstacles sont correctement
d´etect´es.
La majorit´e des syst`emes d´evelopp´es jusqu’`a pr´esent reposent sur trois ´etapes :
la g´en´eration d’hypoth`eses, leur validation et leur suivi. La premi`ere ´etape consiste
`
a localiser les endroits qui contiennent ´eventuellement des obstacles. Nous les
ap-pellerons dor´enavant des r´egions d’int´erˆet (ROI : Regions Of Interest). Dans cette
´
etape, l’algorithme bien qu’il analyse tous les pixels de l’image, doit rester efficace
en terme de temps de calcul. Ceci est probl´ematique car les obstacles, notamment
les pi´etons, peuvent se retrouver dans n’importe quel endroit dans l’image. G´
e-n´eralement, les m´ethodes employ´ees proc`edent `a segmenter l’image totale selon
un crit`ere d´efini a apriori. En effet, la segmentation est une ´etape essentielle en
traitement d’images dans la mesure o`u elle conditionne l’interpr´etation de r´egions
sp´ecifiques dans ces images.
Figure 1.3.Exemple d’une sc`ene routi`ere en IR (bande LWIR) o`u les obstacles sont correctement d´etect´es. Les pi´etons et les voitures sont respectivement encadr´es par des rectangles (fenˆetres englo-bantes) en rouge et en bleu.
Le probl`eme principal qui d´ecoule de l’utilisation d’un seul capteur de vision est
qu’aucune information de profondeur n’est fournie. Les syst`emes bas´es sur
l’utilisa-tion de capteurs actifs (Lidar ou Radar) `a balayage ou de la st´er´eovision permettent
de g´en´erer une carte de profondeur en 3D. Ainsi, le crit`ere de d´efinition des r´egions
d’int´erˆet correspond `a la position des pixels dans le monde r´eel. Les obstacles sont
d´etach´es du fond de l’image en utilisant l’approche r´egion. L’avantage de cette
solution r´eside dans l’extraction des informations pertinentes tout en ´eliminant
les caract´eristiques appartenant `a la sc`ene elle-mˆeme. Cette approche comporte
toutefois des limites associ´ees plus particuli`erement avec les objets complexes qui
se recouvrent.
G´en´eralement, la d´efinition de ROI avec un syst`eme monovision est bas´ee sur la
segmentation mouvement ou la recherche de primitives ou d’indices sp´ecifiques du
type d’obstacle `a d´etecter.
Les techniques de segmentation du mouvement [ELW03, DPKA04] sont g´en´
era-lement employ´ees pour des cam´eras fixes o`u deux images successives sont prises
dans les mˆemes conditions d’acquisition. De plus, seuls les objets en mouvement
peuvent ˆetre d´etect´es et un pi´eton ou un v´ehicule immobile dans une zone de
col-lision ne seront pas d´etect´es. Cette limitation li´ee `a la position de la cam´era ne
nous permet donc pas d’envisager une application embarqu´ee.
1.2 Vision pour la d´etection et la reconnaissance des
obstacles routiers 37
`
a rechercher des formes, des apparences ou des indices particuliers. Comme par
exemple, faire apparaitre les objets sym´etriques, identifier les structures
rectan-gulaires afin de d´etecter les v´ehicules, ou mettre en ´evidence les r´egions de fortes
intensit´es, dont le but de localiser des r´egions de pi´etons dans les images
infra-rouges.
Le d´eveloppement dans le domaine d’apprentissage assist´e par l’ordinateur a
per-mis d’aborder d’autres techniques de d´etection de cat´egories d’objets dans les
images. Nous en citons d’une fa¸con particuli`ere les nouvelles m´ethodes bas´ees sur
l’apprentissage d’un mod`ele implicite de formes ou ceux bas´es sur l’utilisation de
classifieurs. Ces techniques font recours `a un apprentissage hors ligne permettant
d’identifier les primitives caract´eristiques des objets en question.
G´en´eralement, les m´ethodes de d´etection qui n’utilisent pas de classifieurs ne sont
pas suffisantes pour ´eliminer les fausses alertes. Ainsi, l’usage d’autres processus
est souvent n´ecessaire : la validation par des techniques de v´erification (v´
erifica-tion de certaines propri´et´es, corr´elation avec des mod`eles, . . .) ou par des m´ethodes
de classification, ou suivi des hypoth`eses de d´etection permettent de confirmer la
pr´esence d’obstacles et de rejeter les fausses d´etections. Dans la suite nous d´
e-taillons les diff´erentes m´ethodes de d´efinition des r´egions d’int´erˆet, de validation
d’hypoth`eses et de suivi.
1.2.2.1 G´en´eration de ROI
Il existe plusieurs m´ethodes de g´en´eration de ROI, la plus simple est de s´
elec-tionner toutes les ROI de l’image. Cela n´ecessite de balayer la totalit´e de l’image
dans toutes les directions et `a plusieurs valeurs d’´echelles. Ceci rend le
traite-ment par la suite, tr`es coˆuteux en termes de nombre d’op´erations de calcul. Dans
cette section, nous pr´esentons les m´ethodes les plus fr´equemment cit´ees dans la
litt´erature.
Les primitives et les indices caract´eristiques d’obstacles `a d´etecter
Il existe diff´erentes m´ethodes permettant d’extraire des ´el´ements caract´
eris-tiques des obstacles routiers dans les images. Sans ˆetre exhaustif, nous pouvons
citer diff´erents travaux qui peuvent s’inscrire dans ce th`eme.
Les images de v´ehicules et pi´etons sont en g´en´eral sym´etriques horizontalement
et verticalement. Cette observation a ´et´e utilis´ee comme indice dans de nombreux
travaux pour la d´etection de pi´eton et de v´ehicule [BBFL02, BBFV06, TBM
+06].
Dans [BBFN00], les r´egions d’int´erˆet sont d´efinies en analysant une carte de
sy-m´etrie construite en examinant les crit`eres de sym´etrie des niveaux de gris et des
contours de l’image. Ces techniques sont g´en´eralement utilis´ees pour d´efinir des
ROI correspondantes `a des v´ehicules. Du fait des tailles r´eduites de pi´etons dans
les images, l’analyse de sym´etrie est utilis´ee surtout pour la v´erification de leurs
pr´esences [BBF
+04].
En plus du crit`ere de sym´etrie, autres travaux ont cherch´e `a identifier des formes
rectangulaires pour la d´etection de v´ehicules. Dans ce sens, Bertke et al [BHD00]
proposent un algorithme qui permet de d´etecter les v´ehicules lointains.
L’algo-rithme propos´e cherche `a identifier une structure rectangulaire en se basant sur le
nombre de points de contours horizontaux et verticaux. D’autres travaux se sont
focalis´es sur la recherche des indices port´ees d’ombres (extraction par seuillage des
niveaux de gris) [TS98] ou de feux arri`eres (extraction `a partir de la composante
rouge de l’image couleur) [CTB05] pour d´etecter les v´ehicules. N´eanmoins, ces
derniers indices sont particuli`erement utiles pour le traitement des sc`enes
d’auto-route en VIS. Dans la section suivante, nous pr´esentons les techniques appropri´ees
au traitement des images en IR.
D´etection d’obstacles par fenˆetre glissante
La technique la plus g´en´erique est la d´etection par fenˆetre glissante. Cela
consiste `a parcourir exhaustivement l’image en appliquant un d´etecteur `a de tr`es
nombreuses positions et ´echelles. Cette technique est appliqu´ee surtout en l’absence
de toutes informations permettant de localiser des endroits contenant des
obs-tacles. La m´ethode propose donc de balayer l’image et de comparer le contenu de
chaque fenˆetre avec un mod`ele sp´ecifique d’un obstacle routier. Parmi les travaux
les plus marquants, nous pouvons citer les travaux de Gavrilla [Gav00, GGM04]
qui reposent sur l’extraction de contours et la corr´elation avec des mod`eles de
pi´etons. D’une fa¸con g´en´erale, les m´ethodes bas´ees sur la mise en correspondance
avec un mod`ele explicite utilisent des seuils empiriques qui peuvent ˆetre sources de
plusieurs probl`emes. Le r´eglage empirique d’un tel param`etre n’est pas pr´ecis et
n´ecessite un certain temps, en fonction du nombre de mod`eles utilis´es et du taux
d’acceptation d’erreur.
Contrairement aux techniques pr´ec´edemment cit´ees, les m´ethodes bas´ees sur la
classification constituent eux-mˆemes, par apprentissage, les mod`eles qu’ils utilisent
dans leur recherche. Ces mod`eles se basent sur l’extraction d’un jeu de caract´
e-ristiques pour repr´esenter un tel objet. Les caract´eristiques les plus connues `a cet
´egard permettent de caract´eriser la forme et la texture des objets [OPS
+97, DT05].
1.2 Vision pour la d´etection et la reconnaissance des
obstacles routiers 39
Les algorithmes de classification sont bas´es avant tout sur des m´ethodes
d’ana-lyse statistique et sont restreints `a d´eterminer l’appartenance ou non d’une image
`
a une classe. Ainsi, utilis´e de mani`ere isol´ee, un tel algorithme de classification
d’une ROI est incapable de localiser les obstacles. Toutefois, le parcours exhaustif
de l’image `a l’ensemble des dimensions et des positions (fenˆetres) possibles avec
des classifieurs le permet. G´en´eralement, les m´ethodes utilisant des classifieurs sont
tr`es robustes mais l’exploration de l’image enti`ere induit des temps de calcul tr`es
importants. Dans la pratique, le recours `a des m´ethodes de classification rapide
comme l’utilisation de SVM lin´eaire [Vap95] et les techniques `a plusieurs cascades
de classifieurs boost´es [JVJS03, NCHP08] permettent d’acc´el´erer le processus de
d´etection. En outre, la limitation de la r´egion de recherche en pr´esence
d’informa-tions sur les voies de circulation [BLS09] ou sur la perspective de l’image permet
d’envisager des applications rapides, voire en temps r´eel.
Apprentissage d’un mod`ele implicite de formes
Les techniques que nous avons pr´esent´ees dans les sections pr´ec´edentes se
basent soit sur la recherche de primitives caract´eristiques, soit sur la
comparai-son avec des mod`eles d’analyse et de repr´esentation de forme ou de texture. Pour
certains objets, comme le pi´eton, il est impossible de d´efinir un mod`ele explicite
qui permet de g´erer `a la fois les grandes variations intra-classe et les probl`emes
d’occultations prononc´ees. Afin de r´epondre `a ces probl´ematiques, Leibe et al
[LLS04, Lei08] proposent une approche bas´ee sur l’apprentissage d’un mod`ele de
forme implicite. Ce mod`ele est ´etabli par apprentissage et peut ˆetre d´efini comme
un mod`ele de distribution non-param´etrique d’un ensemble de motifs qui
carac-t´erisent l’apparence locale de pi´etons (voir figure 1.4). Ces motifs peuvent ˆetre
repr´esent´es par des voisinages locaux (des patches) [LLS04] ou des descripteurs
extraits autour des points d’int´erˆet [MLS06].
Lors de la phase de d´etection, la mise en correspondance des motifs d´etect´es
dans une image avec le mod`ele implicite de forme construit par apprentissage,
permet d’une part de d´eterminer des probabilit´es pour chaque motif appartenant
ou pas `a un pi´eton ; d’autre part, de voter pour la position des centres des objets.
Ces votes sont ensuite interpr´et´es dans un cadre probabiliste en utilisant la
trans-form´ee de Hough g´en´eralis´ee et l’algorithme de Mean Shift [Com03].
Cette approche est tr`es int´eressante dans le sens o`u la m´ethode de d´etection est
positionn´ee de fa¸con `a r´esoudre le probl`eme d’occultation. De plus, cette approche
se distingue clairement des m´ethodes classiques car elle ne requiert ni une ´etape
Figure 1.4.Un exemple de mod`ele d’apparences regroupant un ensemble de motifs qui caract´erisent les apparences locales de pi´etons