• Aucun résultat trouvé

GNG-T : Quantification vectorielle de donn´ ees non stationnaires

Dans le document Un calcul cortical pour les systèmes situés (Page 153-159)

Partie I Probl´ ematique de recherche 25

6.2 GNG-T : Quantification vectorielle de donn´ ees non stationnaires

Afin d’analyser une sc`ene vid´eo dans le cadre d’un contrat industriel, nous avons test´e, avec des ´etudiants de Sup´elec de troisi`eme ann´ee, l’opportunit´e d’utiliser l’algorithme Growing Neural Gas (GNG) de Fritzke [Fritzke, 1995] dans la proc´edure suivante. Le principe est r´esum´e sur la figure 6.2. Tout d’abord, on effectue un filtrage pour diff´erencier les objets pr´esents du fond de la sc`ene. Ensuite, on extrait les contours des objets, ce qui donne une collection de points. En appliquant GNG, on peut alors r´esumer la distribution des points des contours par un graphe. On r´ealise ainsi le lien entre une structure num´erique, la distribution des points, et une structre symbolique, le graphe, dont on peut compter les cycles, les composantes connexes, etc.

Au cours de ce projet, nous avons constat´e que GNG ´etait tr`es sensible au bruit, et supportait mal l’extension `a des distributions non-stationnaires, comme le sont celles trait´ees sur notre flux vid´eo. L’extension propos´ee par Fritzke pour la non-stationarit´e [Fritzke, 1997a;Fritzke, 1997b] repose sur un crit`ere d’arrˆet li´e au nombre de prototypes, ce qui n’est pas satisfaisant non plus. De plus, de nombreux param`etres, tels que des traces d´ecroissantes, n’ont pas de sens statistique pr´ecis.

Nous avons par cons´equent cherch´e `a approfondir la question de la quantification vectorielle d’une distribution non stationnaire, gardant le principe de construction d’un graphe qui approche la triangulation de Delaunay des prototypes formul´ee dans [Martinez and Schulten, 1994], que GNG exploite. Ce fut l’objet du stage de fin d’´etude de Georges Adrian Drumea [Drumea, 2006], qui a conduit `a une publication [Drumea and Frezza-Buet, 2007]. Suite `a ces travaux, nous avons port´e `a maturit´e un algorithme, GNG-T, pr´esent´e et analys´e dans [Frezza-Buet, 2008], dont nous d´ecrivons ici quelques principes. Cet algorithme est disponible sous forme d’un package `a base de patrons de classe C++, il s’agit de la biblioth`eque gngtlib que nous fournissons sur notre site (cf. paragraphe9.8.2).

Le principe est de consid´erer qu’`a l’´equilibre, lors d’un processus de quantification vecto-rielle, l’esp´erance d’erreur est la mˆeme sur toutes les cellules de Vorono¨ı des prototypes, nous la noterons E. C’est pourquoi ces algorithmes sont sensibles `a la densit´e de la distribution qu’on leur soumet. Ainsi, si la distribution est dense, la cellule de Vorono¨ı accumule fr´equemment de petites erreurs70, alors que si la distribution est peu dense, la cellule de Vorono¨ı accumule ra-rement de grande erreurs. Comme E est constant pour les deux types de cellule, on comprend que la premi`ere soit beaucoup plus petite que la seconde.

Si maintenant on mesure la moyenne des ´ecarts au prototype au sein de chaque cellule, ind´ e-pendemment de la fr´equence des prototypes (c’est ce que calculent les variables d’accumulation de GNG), on constate que les cellules des r´egions peu denses ont une forte variance, i.e. elles sont ´etal´ees, alors que les cellules o`u la distribution est dense ont de petites variances, i.e. les nombreux exemples sont serr´es. Le principe de notre algorithme est d’´echantillonner la valeur E du graphe courant, et d’ajouter ou retirer des prototypes pour que cette valeur s’asservisse `a un

6.2. GNG-T : Quantification vectorielle de donn´ees non stationnaires

Figure 6.2 – La s´equence vid´eo est analys´ee comme suit. On extrait d’abord les pixels qui n’appartiennent pas au fond, et l’on nettoie l’image obtenue par des filtres bool´eens simples. Ensuite, on peut appliquer des op´erateurs morpho-math´ematiques, puis extraire les contours des r´egions obtenues. Le graphe qui r´esume ces points, obtenu ici par l’algorithme GNG-T, refl`ete la composition de la sc`ene. D’apr`es [Frezza-Buet, 2008].

param`etre T , fix´e par l’utilisateur. Plus T est faible, plus la quantification vectorielle sera fine, i.e. plus le nombre de prototypes sera grand.

La figure 6.3montre l’utilisation de l’algoritme sur une distribution changeante, la valeur T restant fix´ee. C’est donc au nombre de prototypes de s’adapter pour garder la mˆeme qualit´e de quantification.

Figure 6.3 – Le graphe construit par GNG-T s’ajuste aux variations de la distribution, assurant une qualit´e de quantification vectorielle constante. Dans le sens de lecture sur les figures, on pr´esente d’abord une couronne dense au r´eseau, puis on ajoute un carr´e un peu moins dense, puis du bruit. La derni`ere modification de la distribution consiste `a retirer la couronne.

Il est plus int´eressant de s’int´eresser aux histogrammes de la variance des prototypes. On retrouve sur un histogramme de variance les diff´erentes densit´es de probabilit´e (cf. figure 6.4). L’algorithme peut alors ˆetre autoris´e `a quantifier du bruit, il suffit de retirer a posteriori les prototypes de forte variance, ce qui a ´et´e fait sur la derni`ere ligne de la figure6.2.

On peut constater, sur des vid´eos, qu’en cas de modification progressive de la distribution, d’une image `a l’autre, ce sont les mˆemes prototypes qui sont associ´es aux r´egions au cours de leur mouvement. C’est l’effet de suivi, qu’assure notre algorithme. En revanche, si quelque chose apparaˆıt, de nouveaux prototypes sont allou´es, pour restaurer une quantification de qualit´e T .

6.2. GNG-T : Quantification vectorielle de donn´ees non stationnaires 0 10 20 30 40 50 more than 1000 from 950 to 1000 from 900 to 950 from 850 to 900 from 800 to 850 from 750 to 800 from 700 to 750 from 650 to 700 from 600 to 650 from 550 to 600 from 500 to 550 from 450 to 500 from 400 to 450 from 350 to 400 from 300 to 350 from 250 to 300 from 200 to 250 from 150 to 200 from 100 to 150 from 50 to 100 from 0 to 50 less than 0

Figure 6.4 – Histogramme des variances. Le pic de gauche correspond aux prototypes qui sont plac´es sur le cercle, qui est dense. Le pic du milieu correspond aux prototypes du carr´e, et le pic plus ´etal´e de droite correspond au bruit. On constate que l’histogramme permet de d´eterminer un seuil, ici autour de 600 pixel2, au-del`a duquel on peut consid´erer qu’un prototype repr´esente du bruit.

La stabilit´e de l’algorithme est donc assur´ee par la mobilit´e des prototypes exis-tants, qui suivent les changements continus de la distribution, mais la plasticit´e est ´egalement assur´ee en cas de changements brusques. Cette derni`ere est le fruit d’une stabilit´e d’un autre ordre de l’algorithme, qui en est la principale nouveaut´e, `

a savoir l’assercvissement de la qualit´e de quantification.

L’algorithme est relativement simple, et robuste, comme le montre l’´etude faite dans [ Frezza-Buet, 2008]. Nous avons montr´e ´egalement, avec Olivier Pietquin et Jean-Louis Gutzwiller, que cet algorithme peut s’appliquer `a une proc´edure en ligne d’identification non supervis´ee de locuteurs dans un signal de parole [Gutzwiller et al., 2010].

Chapitre 7

Activit´es d’enseignement

Nous avons, depuis que nous avons entrepris, en 1996, de travailler dans la recherche, concili´e une activit´e de recherche scientifique avec des activit´es d’enseignement sup´erieur.

On entend parfois parler de la mission d’enseignement des enseignants-chercheurs comme d’une charge, qui handicape l’activit´e de recherche. Il y a, `a notre sens, quelques raisons `a cela. La premi`ere est que l’on ´evalue plus quantitativement la recherche, depuis l’apparition d’indicateurs bibliom´etriques, et qu’effectivement, au regard de l’optimisation de ces indicateurs-l`a, enseigner c’est perdre du temps que l’on aurait pu investir dans la production scientifique. Une autre raison est que, pour les maˆıtres de conf´erences, 192 heures ´equivalent TD par an repr´esentent un volume substantiel, auquel il faut ajouter les temps de pr´eparation, de surveillance d’examen, de participation `a des jurys, des r´eunions p´edagogiques, etc. Ces contraintes fragmentent l’activit´e de recherche, effectivement.

Dans notre cas, `a Sup´elec, nous avons eu une charge d’enseignement qui s’est alourdie pro-gressivement, et qui, d’un point de vue purement comptable, occupe du temps que l’on aurait pu investir dans la recherche. Toutefois, nous souhaitons souligner dans ces quelques lignes les apports des activit´es d’enseignement pour notre projet de recherche. En effet, outre l’apport personnel li´e `a la situation d’enseignement, du fait des interactions avec les ´etudiants, la for-mation que nous dispensons, bien que technologique, a des retomb´ees sur nos recherches plus fondamentales. Tout d’abord, et nous le mentionnons en introduction au chapitre 8, le temps d’enseignement, `a Sup´elec, est l’occasion de s’ouvrir `a des r´ealisations plus pratiques, lors de contrats industriels qui impliquent les ´etudiants. Cette exp´erience est un atout pour connaˆıtre le milieu industriel, et mesurer l’effort n´ecessaire, lors d’une valorisation de la recherche, pour passer d’un prototype `a une solution exploitable par une entreprise. La d´emarche qui nous a conduit `a concevoir l’algorithme GNG-T (cf. paragraphe6.2) est issue d’une activit´e industrielle. De plus, nous sommes `a Sup´elec en capacit´e d’affecter des ´el`eves sur nos projets de recherche, auxquels ils apportent de la « main d’œuvre » pr´ecieuse. Il faut pour cela faire l’effort d’isoler dans nos besoins de d´eveloppement des modules abordables par les ´etudiants, puis en assurer l’int´egration effective apr`es r´ealisation. Bien que cette d´emarche ne soit pas syst´ematiquement couronn´ee de succ`es, nous avons, dans nos r´ealisations, pu profiter des capacit´es des ´el`eves de Sup´elec (voir chapitre 9). Enfin, l’enseignement a cet avantage de nous « forcer `a approfondir » des notions collat´erales `a nos domaines de recherches, cela a ´et´e le cas pour nous pour les m´ e-thodes `a noyaux et la th´eorie de la g´en´eralisation, mais aussi dans la programmation C++ avanc´ee (patrons de classes et m´eta-programmation) que nous enseignons et exploitons dans la mise en œuvre de nos mod`eles, de mˆeme que la visualisation 3D avec openGL, etc.

7.1 Notre formation au m´etier d’enseignant

Notre premier contact avec l’enseignement sup´erieur a ´et´e une exp´erience d’enseignement de la physique au niveau BAC+2 `a la maison d’Arrˆet de Metz-Queuleu, en 1993. Plus classiquement ensuite, nous avons durant notre th`ese b´en´efici´e du statut de Moniteur, ce qui nous a permis de prendre part `a l’enseignement de l’Informatique en DEUG et Licence, sous forme de TD et TP d’introduction `a la programmation. `A cette occasion, nous avons pu nous int´egrer dans les ´

equipes p´edagogiques concern´ees, et prendre part `a la cr´eation des sujets. `A cette formation « sur le tas » s’est ajout´ee la structuration apport´ee par le CIES, c’est-`a-dire le suivi de formations `a l’enseignement, et l’aide pr´ecieuse d’un « tuteur » , Jean-Pierre Jacquot en ce qui nous concerne.

Dans le document Un calcul cortical pour les systèmes situés (Page 153-159)