• Aucun résultat trouvé

La probl´ematique de la base ouverte n’est apparue que tr`es r´ecemment et la plu- part des approches de r´e-identification de personnes ont donc ´et´e d´evelopp´ees pour r´epondre aux exigences de la r´e-identification en base ferm´ee. Ainsi la litt´erature concernant la r´e-identification en base ouverte est assez r´eduite avec `a notre connais- sance, moins de dix papiers traitant de cette probl´ematique [1, 2, 3, 13, 46, 48, 9, 47]. Quant `a la r´e-identification de personnes en base ferm´ee, la litt´erature est tr`es vaste. On peut diviser les approches de r´e-identification en trois grands groupes: les m´ethodes visant `a d´evelopper des descripteurs discriminatifs [118, 17, 9], les

m´ethodes d’apprentissage de m´etrique [75, 20, 23], et les m´ethodes se basant sur l’apprentissage de r´eseaux de neurones [12, 39, 93].

Historiquement, les premi`eres m´ethodes propos´ees pour la r´e-identification de personnes sont des m´ethodes qui cherchent surtout `a d´efinir des descripteurs qui sont capables de diff´erencier les personnes. Dans le premi`eres m´ethodes, telles que SDALF [118] et Pictorial Structures [17], ces descripteurs sont d´efinis de mani`ere ad hoc et sont bas´es sur des id´ees intuitives. Les m´ethodes SDALF [118] et PS [17] proposent de d´etecter des parties du corps (tˆete, torse, jambes, etc.) afin d’extraire des informations couleurs et textures de ces parties. La comparaison de deux images consiste alors `a comparer pour les diff´erentes parties, les descrip- teurs de chacune des deux images. Puis des m´ethodes supervis´ees int´egrant une phase d’apprentissage sont apparues. Au lieu d’utiliser des descripteurs ad hoc, certaines approches sugg`erent d’utiliser tout un ensemble de descripteurs de base et d’apprendre lors de la phase d’apprentissage une mani`ere de les combiner de mani`ere optimale avec des m´ethodes de boosting [18] ou encore des forˆets de classi- fication [19]. Enfin, avec le d´eveloppement des bases d’identit´es o`u chaque personne est repr´esent´ee non plus par une seule image mais par une trajectoire, quelques m´ethodes r´ecentes [9, 47] int´egrent des informations temporelles en plus de la sim- ple apparence.

D´ecrire une image est une ´etape indispensable pour la r´e-identification, mais l’´etape de comparaison de deux images ou de deux ensembles d’images est tout aussi importante. Les m´ethodes d’apprentissage de m´etrique ont pour but justement de d´evelopper de nouvelles m´etriques qui permettent de mieux discriminer les person- nes qu’une simple distance euclidienne. Cet apprentissage de m´etrique s’effectue la plupart du temps en optimisant une fonction objective avec un terme de p´enalisation des paires positives (mˆeme identit´e) et un terme de p´enalisation des paires n´egatives (identit´es distinctes) [75, 20]. D’autres approches cherchent des solutions `a des probl`emes aux valeurs propres g´en´eralis´es [21, 23]. Si ces m´ethodes d’apprentissage de m´etriques n´ecessitent des donn´ees d’apprentissage, elles sont ´egalement `a l’origine d’un fort progr`es en terme de performances.

L’arriv´ee en 2014 [12] de m´ethodes utilisant des r´eseaux de neurones a permis un nouveau bond des performances et depuis lors, de plus en plus de nouvelles ap- proches sont bas´ees sur les r´eseau de neurones. Des r´eseaux de neurones sont ainsi propos´es en tant qu’outil pour extraire de nouveaux descripteurs [44, 45] ou encore comme m´ethode globale effectuant `a la fois l’extraction de descripteurs et la com- paraison de deux images [12, 39, 93]. L’inconv´enient de telles approches est que la phase d’apprentissage n´ecessite un important volume de donn´ees sans lesquelles il est impossible d’apprendre les param`etres du r´eseau sans compl`etement sur-apprendre. C’est d’ailleurs la raison pour laquelle ce n’est que ces derni`eres ann´ees que de nouveaux datasets assez larges comprenant de nombreuses images ont fait leur ap- parition (CUHK [12], Market [10], DUKE [49]).

types de sc´enarios. Dans [1], non seulement l’hypoth`ese selon laquelle on connait toutes les personnes de la galerie est relˆach´ee, mais cela est pouss´e encore plus loin. Il n’y a plus de galerie ni de regroupement des images d’une mˆeme personne appa- raissant sur la mˆeme cam´era. Le but est d’associer une identit´e `a chaque image. Cela ressemble `a un probl`eme de clustering non supervis´e o`u les diff´erentes classes sont inconnues et leur nombre aussi. Dans [2, 3] un petit nombre d’identit´es est sup- pos´e connus et forme l’ensemble cible. Lorsqu’une personne requˆete est pr´esent´ee, il faut d´eterminer si cette personne fait parti de l’ensemble cible ou non. Trouver l’identit´e pr´ecise de la personne requˆete n’est pas n´ecessaire. Dans [13, 46, 9, 47], la r´e-identification de personnes en base d’identit´e ouverte est d´efinie comme un probl`eme avec deux sous-probl`emes. Comme dans le cadre de la base ferm´ee, nous disposons d’une galerie qui contient les identit´es connues. La d´etection permet de d´eterminer si une personne requˆete fait possiblement parti de la galerie ou non. Le classement permet de ranger par ordre de similarit´e les personnes de la galerie qui sont consid´er´ees comme de potentiels bons appariements. Enfin le papier [48] propose des sc´enarios encore plus g´en´eraux dans le cadre non plus de cam´eras fixes mais de cam´eras se d´epla¸cant sur des drones. Il s’agit donc non plus seulement de reconnaˆıtre des personnes lorsqu’elles apparaissent sur des cam´eras distinctes mais ´egalement d’ˆetre capable de reconnaˆıtre une mˆeme personne lorsqu’elle est `a nou- veau d´etect´ee par la mˆeme cam´era situ´ee sur un drone qui a chang´e de position, d’orientation, etc...

Les probl`emes de r´e-identification de personnes en base d’identit´es ferm´ee et en base d’identit´es ouverte diff`erent en terme de sc´enario et donc en terme d’´evaluation ´egalement. En base ferm´ee, seul le rang auquel la bonne personne galerie est retrouv´ee est pris en compte dans l’´evaluation CMC (Cumulative Match Curve). Pour diff´erentes valeur de rang r, la CMC donne la proportion de personnes requˆete r´e-identifi´ees dans les r premiers rangs, et ce peu importe la valeur du score de dis- similarit´e ou de similarit´e. En base d’identit´e ouverte, chaque sc´enario est associ´e `a une mesure d’´evaluation diff´erente. Le sc´enario que nous ´etudions ici est la tˆache de r´e-identification en base ouverte d´ecomposable en deux sous-tˆaches, la d´etection et le classement. L’´evaluation associ´ee consiste `a fournir les valeurs de DIR (Detection and Identification Rate) pour diff´erentes valeurs de FAR (False Acceptance Rate). Pour diff´erents taux FAR de personnes requˆete n’apparaissant pas dans la galerie mais ayant ´et´e accept´ees par erreur comme en en faisant partie, DIR fournit le taux de personnes requˆete faisant effectivement partie de la galerie et pour lesquelles le bon appariement est au premier rang.

Documents relatifs