GNG-T : Quantification vectorielle de donn´ ees non stationnaires

Partie I Probl´ ematique de recherche 25

6.2 GNG-T : Quantification vectorielle de donn´ ees non stationnaires

Afin d’analyser une scène vidéo dans le cadre d’un contrat industriel, nous avons testé, avec des étudiants de Supélec de troisième année, l’opportunité d’utiliser l’algorithme Growing Neural Gas (GNG) de Fritzke [Fritzke, 1995] dans la procédure suivante. Le principe est résumé sur la figure 6.2. Tout d’abord, on effectue un filtrage pour différencier les objets présents du fond de la scène. Ensuite, on extrait les contours des objets, ce qui donne une collection de points. En appliquant GNG, on peut alors résumer la distribution des points des contours par un graphe. On réalise ainsi le lien entre une structure numérique, la distribution des points, et une structre symbolique, le graphe, dont on peut compter les cycles, les composantes connexes, etc.

Au cours de ce projet, nous avons constaté que GNG était très sensible au bruit, et supportait mal l’extension à des distributions non-stationnaires, comme le sont celles traitées sur notre flux vidéo. L’extension proposée par Fritzke pour la non-stationarité [Fritzke, 1997a;Fritzke, 1997b] repose sur un critère d’arrêt lié au nombre de prototypes, ce qui n’est pas satisfaisant non plus. De plus, de nombreux paramètres, tels que des traces décroissantes, n’ont pas de sens statistique précis.

Nous avons par conséquent cherché à approfondir la question de la quantification vectorielle d’une distribution non stationnaire, gardant le principe de construction d’un graphe qui approche la triangulation de Delaunay des prototypes formulée dans [Martinez and Schulten, 1994], que GNG exploite. Ce fut l’objet du stage de fin d’étude de Georges Adrian Drumea [Drumea, 2006], qui a conduit à une publication [Drumea and Frezza-Buet, 2007]. Suite à ces travaux, nous avons porté à maturité un algorithme, GNG-T, présenté et analysé dans [Frezza-Buet, 2008], dont nous décrivons ici quelques principes. Cet algorithme est disponible sous forme d’un package à base de patrons de classe C++, il s’agit de la bibliothèque gngtlib que nous fournissons sur notre site (cf. paragraphe9.8.2).

Le principe est de considérer qu’à l’équilibre, lors d’un processus de quantification vecto-rielle, l’espérance d’erreur est la même sur toutes les cellules de Vorono¨ı des prototypes, nous la noterons E. C’est pourquoi ces algorithmes sont sensibles à la densité de la distribution qu’on leur soumet. Ainsi, si la distribution est dense, la cellule de Vorono¨ı accumule fréquemment de petites erreurs⁷⁰, alors que si la distribution est peu dense, la cellule de Vorono¨ı accumule ra-rement de grande erreurs. Comme E est constant pour les deux types de cellule, on comprend que la première soit beaucoup plus petite que la seconde.

Si maintenant on mesure la moyenne des écarts au prototype au sein de chaque cellule, ind´ e-pendemment de la fréquence des prototypes (c’est ce que calculent les variables d’accumulation de GNG), on constate que les cellules des régions peu denses ont une forte variance, i.e. elles sont étalées, alors que les cellules où la distribution est dense ont de petites variances, i.e. les nombreux exemples sont serrés. Le principe de notre algorithme est d’échantillonner la valeur E du graphe courant, et d’ajouter ou retirer des prototypes pour que cette valeur s’asservisse à un

6.2. GNG-T : Quantification vectorielle de donn´ees non stationnaires

Figure 6.2 – La séquence vidéo est analysée comme suit. On extrait d’abord les pixels qui n’appartiennent pas au fond, et l’on nettoie l’image obtenue par des filtres booléens simples. Ensuite, on peut appliquer des opérateurs morpho-mathématiques, puis extraire les contours des régions obtenues. Le graphe qui résume ces points, obtenu ici par l’algorithme GNG-T, reflète la composition de la scène. D’après [Frezza-Buet, 2008].

param`etre T , fix´e par l’utilisateur. Plus T est faible, plus la quantification vectorielle sera fine, i.e. plus le nombre de prototypes sera grand.

La figure 6.3montre l’utilisation de l’algoritme sur une distribution changeante, la valeur T restant fixée. C’est donc au nombre de prototypes de s’adapter pour garder la même qualité de quantification.

Figure 6.3 – Le graphe construit par GNG-T s’ajuste aux variations de la distribution, assurant une qualité de quantification vectorielle constante. Dans le sens de lecture sur les figures, on présente d’abord une couronne dense au réseau, puis on ajoute un carré un peu moins dense, puis du bruit. La dernière modification de la distribution consiste à retirer la couronne.

Il est plus intéressant de s’intéresser aux histogrammes de la variance des prototypes. On retrouve sur un histogramme de variance les différentes densités de probabilité (cf. figure 6.4). L’algorithme peut alors être autorisé à quantifier du bruit, il suffit de retirer a posteriori les prototypes de forte variance, ce qui a été fait sur la dernière ligne de la figure6.2.

On peut constater, sur des vidéos, qu’en cas de modification progressive de la distribution, d’une image à l’autre, ce sont les mêmes prototypes qui sont associés aux régions au cours de leur mouvement. C’est l’effet de suivi, qu’assure notre algorithme. En revanche, si quelque chose apparaˆıt, de nouveaux prototypes sont alloués, pour restaurer une quantification de qualité T .

6.2. GNG-T : Quantification vectorielle de donn´ees non stationnaires 0 10 20 30 40 50 more than 1000 from 950 to 1000 from 900 to 950 from 850 to 900 from 800 to 850 from 750 to 800 from 700 to 750 from 650 to 700 from 600 to 650 from 550 to 600 from 500 to 550 from 450 to 500 from 400 to 450 from 350 to 400 from 300 to 350 from 250 to 300 from 200 to 250 from 150 to 200 from 100 to 150 from 50 to 100 from 0 to 50 less than 0

Figure 6.4 – Histogramme des variances. Le pic de gauche correspond aux prototypes qui sont placés sur le cercle, qui est dense. Le pic du milieu correspond aux prototypes du carré, et le pic plus étalé de droite correspond au bruit. On constate que l’histogramme permet de déterminer un seuil, ici autour de 600 pixel², au-delà duquel on peut considérer qu’un prototype représente du bruit.

La stabilité de l’algorithme est donc assurée par la mobilité des prototypes exis-tants, qui suivent les changements continus de la distribution, mais la plasticité est également assurée en cas de changements brusques. Cette dernière est le fruit d’une stabilité d’un autre ordre de l’algorithme, qui en est la principale nouveauté, `

a savoir l’assercvissement de la qualit´e de quantification.

L’algorithme est relativement simple, et robuste, comme le montre l’étude faite dans [ Frezza-Buet, 2008]. Nous avons montré également, avec Olivier Pietquin et Jean-Louis Gutzwiller, que cet algorithme peut s’appliquer à une procédure en ligne d’identification non supervisée de locuteurs dans un signal de parole [Gutzwiller et al., 2010].

Chapitre 7

Activit´es d’enseignement

Nous avons, depuis que nous avons entrepris, en 1996, de travailler dans la recherche, concilié une activité de recherche scientifique avec des activités d’enseignement supérieur.

On entend parfois parler de la mission d’enseignement des enseignants-chercheurs comme d’une charge, qui handicape l’activité de recherche. Il y a, à notre sens, quelques raisons à cela. La première est que l’on évalue plus quantitativement la recherche, depuis l’apparition d’indicateurs bibliométriques, et qu’effectivement, au regard de l’optimisation de ces indicateurs-là, enseigner c’est perdre du temps que l’on aurait pu investir dans la production scientifique. Une autre raison est que, pour les maˆıtres de conférences, 192 heures équivalent TD par an représentent un volume substantiel, auquel il faut ajouter les temps de préparation, de surveillance d’examen, de participation à des jurys, des réunions pédagogiques, etc. Ces contraintes fragmentent l’activité de recherche, effectivement.

Dans notre cas, à Supélec, nous avons eu une charge d’enseignement qui s’est alourdie pro-gressivement, et qui, d’un point de vue purement comptable, occupe du temps que l’on aurait pu investir dans la recherche. Toutefois, nous souhaitons souligner dans ces quelques lignes les apports des activités d’enseignement pour notre projet de recherche. En effet, outre l’apport personnel lié à la situation d’enseignement, du fait des interactions avec les étudiants, la for-mation que nous dispensons, bien que technologique, a des retombées sur nos recherches plus fondamentales. Tout d’abord, et nous le mentionnons en introduction au chapitre 8, le temps d’enseignement, à Supélec, est l’occasion de s’ouvrir à des réalisations plus pratiques, lors de contrats industriels qui impliquent les étudiants. Cette expérience est un atout pour connaˆıtre le milieu industriel, et mesurer l’effort nécessaire, lors d’une valorisation de la recherche, pour passer d’un prototype à une solution exploitable par une entreprise. La démarche qui nous a conduit à concevoir l’algorithme GNG-T (cf. paragraphe6.2) est issue d’une activité industrielle. De plus, nous sommes à Supélec en capacité d’affecter des élèves sur nos projets de recherche, auxquels ils apportent de la « main d’œuvre » précieuse. Il faut pour cela faire l’effort d’isoler dans nos besoins de développement des modules abordables par les étudiants, puis en assurer l’intégration effective après réalisation. Bien que cette démarche ne soit pas systématiquement couronnée de succès, nous avons, dans nos réalisations, pu profiter des capacités des élèves de Supélec (voir chapitre 9). Enfin, l’enseignement a cet avantage de nous « forcer à approfondir » des notions collatérales à nos domaines de recherches, cela a été le cas pour nous pour les m´ e-thodes à noyaux et la théorie de la généralisation, mais aussi dans la programmation C++ avancée (patrons de classes et méta-programmation) que nous enseignons et exploitons dans la mise en œuvre de nos modèles, de même que la visualisation 3D avec openGL, etc.

7.1 Notre formation au m´etier d’enseignant

Notre premier contact avec l’enseignement supérieur a été une expérience d’enseignement de la physique au niveau BAC+2 à la maison d’Arrêt de Metz-Queuleu, en 1993. Plus classiquement ensuite, nous avons durant notre thèse bénéficié du statut de Moniteur, ce qui nous a permis de prendre part à l’enseignement de l’Informatique en DEUG et Licence, sous forme de TD et TP d’introduction à la programmation. À cette occasion, nous avons pu nous intégrer dans les ´

equipes pédagogiques concernées, et prendre part à la création des sujets. À cette formation « sur le tas » s’est ajoutée la structuration apportée par le CIES, c’est-à-dire le suivi de formations à l’enseignement, et l’aide précieuse d’un « tuteur » , Jean-Pierre Jacquot en ce qui nous concerne.

Dans le document Un calcul cortical pour les systèmes situés (Page 153-159)