• Aucun résultat trouvé

Classification des vidéos

Chapitre 4 : Reconnaissance des scènes vidéo pour adultes

4.2 Classification des vidéos

Dans le cas de la classification de vidéos, on fournit à la machine des exemples sous la forme (Vidéo, Classe). Cette méthode de raisonnement est appelée inductive car on induit de la connaissance (le modèle) à partir des données d'entrée (les Vidéos) et des sorties (leurs Catégories). Grâce à ce modèle, on peut alors déduire les classes de nouvelles données. Un analyste qui veut classer des vidéos, utilise les éléments de l'interprétation visuelle pour identifier des groupes homogènes qui représentent des classes intéressantes. La classification numérique des vidéos utilise l'information spectrale contenue dans les valeurs d'une ou de plusieurs bandes spectrales pour classifier chaque image de la vidéo à analyser individuellement. Ce type de classification est appelé reconnaissance de regroupements spectraux.

Les deux façons de procéder (manuelle ou automatique) ont pour but d'assigner une classe particulière à chacune des images de la vidéo. Lorsqu'on parle de classes, il faut faire la distinction entre des classes d'information et des classes spectrales :

Classes d’information

Les classes d'information sont des catégories d'intérêt que l'analyste tente d'identifier dans les images.

Classes spectrales

Les classes spectrales sont des groupes de pixels qui ont les mêmes caractéristiques dans les différentes bandes spectrales des données.

L'objectif de la classification est de faire la correspondance entre les classes spectrales et les classes d'information. Il est rare qu'une correspondance directe soit possible entre ces deux types de classes. Des classes spectrales bien définies peuvent apparaître parfois sans qu'elles correspondent nécessairement à des classes d'information intéressantes pour l'analyse.

Les méthodes de classification les plus communes peuvent être séparées en deux grandes catégories : les méthodes de classification supervisée et les méthodes de classification non supervisée.

Lors de l'utilisation d'une méthode de classification supervisée, l'analyste identifie des échantillons assez homogènes de l'image qui sont représentatifs de différents types de surfaces (classes d'information). Ces échantillons forment un ensemble de données-tests. La sélection de ces données-tests est basée sur les connaissances de l'analyste et les types de

surfaces présents dans l'image. L'analyste supervise donc la classification d'un ensemble spécifique de classes. Les informations numériques pour chacune des bandes et pour chaque pixel de ces ensembles sont utilisées pour que l'ordinateur puisse définir les classes et ensuite reconnaître des régions aux propriétés similaires à chaque classe. L'ordinateur utilise un programme spécial ou algorithme afin de déterminer la "signature" numérique de chacune des classes. Une fois que l'ordinateur a établi la signature spectrale de chaque classe à la classe avec laquelle il a le plus d'affinités, une classification supervisée commence donc par l'identification des classes d'information qui sont ensuite utilisées pour définir les classes spectrales qui les représentent.

La classification non supervisée procède de la façon contraire. Les classes spectrales sont formées en premier, basées sur l'information numérique des données seulement. Ces classes sont ensuite associées, par un analyste, à des classes d'information utile. Des programmes appelés algorithmes de classification sont utilisés pour déterminer les groupes statistiques naturels ou les structures des données. Habituellement, l'analyste spécifie le nombre de groupes ou classes qui seront formés avec les données. De plus, l'analyste peut spécifier certains paramètres relatifs à la distance entre les classes et la variance à l'intérieur même d'une classe. Le résultat final de ce processus de classification itératif peut créer des classes que l'analyste voudra combiner, ou des classes qui devraient être séparées de nouveau. Chacune de ces étapes nécessite une nouvelle application de l'algorithme. L'intervention humaine n'est donc pas totalement exempte de la classification non supervisée. Cependant, cette méthode ne commence pas avec un ensemble prédéterminé de classes comme pour la classification supervisée.

L'approche de base dans le domaine de l'identification des modèles pour dépister des images pour adultes est d'utiliser une procédure de formation qui classifie des modèles en deux classes : classe des images adultes et classe des images non adultes. En fait, dans cette approche, on applique des techniques d'apprentissage pour élaborer la fonction qui décrit la distribution des images. En général, ces méthodes se basent sur des techniques telles que l'analyse statistique et l'apprentissage automatique pour trouver les caractéristiques appropriées des images adultes et des images non adultes.

Une image ou un vecteur des caractéristiques dérivé de l'image est vu comme variable aléatoire X, et cette variable aléatoire est caractérisée pour des images adultes et des images non adultes. La classification Bayésienne peut être employée pour classifier un endroit d'image candidate comme nu ou non nu. Malheureusement, une implémentation directe de

classification Bayésienne est infaisable en raison de la dimension élevée de X et de la multi modalité des fonctions de densité de probabilité P(x | adulte), P(x | non adulte). Donc, plusieurs approches dans cette catégorie se sont concentrées à valider les approximations paramétriques et non paramétriques pour P(x | adulte) et P(x | non adulte).

Une autre approche pour les méthodes basées sur des images est de trouver une fonction discriminante (surface de décision, l'hyperplan de séparation, la fonction de seuil...) qui classifie les images adultes et les images non adultes. Par convention, des modèles d'images sont projetés dans un espace dimensionnel inférieur et alors une fonction discriminante est formée (habituellement basé sur la métrique de distance) pour la classification, ou une surface non linéaire de décision peut être formée en utilisant les réseaux neurologiques multicouches.

Documents relatifs