• Aucun résultat trouvé

Dans ce dernier paragraphe, nous allons présenter brièvement les perspectives de recherche qui s’offrent à nous dans les cadres théoriques et applicatifs.

7.3.1 Perspectives théoriques

Nos perspectives de recherche dans le cadre théorique s’organisent autour de l’amélioration de notre approche et de son extension aux données qualitatives de grande dimension, de la classification faiblement supervisée et du couplage Statistique–Optimisation pour la régularisation des matrices de covariance.

1

Estimation des dimensions intrinsèques des classes

Nous avons proposé dans ce mémoire d’estimer les dimensions intrinsèques des classes grâce à la méthode du scree-test de Cattell qui a donné des résultats satisfaisants mais qui reste une méthode simple et empirique. Nous pensons que l’estimation des dimensions intrinsèques des classes mérite d’être améliorée tant du point de vue théorique que pratique. On pourrait par exemple considérer le choix des dimensions intrinsèques comme un problème de choix de modèles et utiliser alors le critère BIC pour cette tâche. En outre, une étude approfondie de la sensibilité de la méthode HDDC vis-à-vis du choix des dimensions intrinsèques serait très intéressante.

Extension de notre approche aux données qualitatives de grande dimension

Nous envisageons également d’étendre aux données qualitatives l’approche qui nous a amené à proposer la re-paramétrisation du modèle de mélange gaussien et qui a été présentée dans ce mémoire dans le cadre des données quantitatives. Pour cela, il faudra ne pas se placer dans le cadre habituel de la classification des données qualitatives où l’hypothèse d’indépendance conditionnelle des variables est faite.

Classification faiblement supervisée

Un autre thème principal de recherche que nous aimerions développer dans le futur est celui de la classification faiblement supervisée que nous avons abordé au cours du chapitre6. Nous pensons en effet que les approches supervisées seront de plus en plus coûteuse en temps d’annotation dans le futur étant donné que la taille des base de données croît chaque jour. Il paraît alors raisonnable d’en-visager d’autres types de supervision dont l’approche faiblement supervisée fait partie. L’approche probabiliste que nous avons introduite au cours du chapitre6 propose déjà un cadre théorique sain pour la discrimination de deux classes dans un cadre faiblement supervisé. Cependant, cette approche ne permet pas nativement de discriminer plusieurs classes d’objets et nous envisageons de porter nos efforts sur cette limitation de notre approche.

Régularisation des matrices de covariance

Enfin, nous aimerions faire le lien entre la statistique et l’optimisation autour des problèmes posés par le mauvais conditionnement des matrices de covariance. Dans [57], Malick a exprimé le problème de la régularisation des matrices de covariance sous la forme d’un problème d’optimisation appelé « moindres carrés semi-définis ». Nous pensons que l’association des deux disciplines serait un moyen élégant d’aborder ce problème que l’on retrouve dans un grand nombre d’applications.

7.3.2 Perspectives applicatives

Du point de vue applicatif, nous envisageons de porter nos efforts sur l’approche faiblement super-visée en reconnaissance d’objets et l’utilisation des relations spatiales pour améliorer la localisation des objets dans les images.

Approche faiblement supervisée en reconnaissance d’objets

L’extension de l’approche probabiliste de la classification faiblement supervisée au cas de sieurs classes permettra, dans le cadre de l’application à la reconnaissance d’objets, de localiser plu-sieurs objets dans une même image de façon automatique. C’est en effet la principale limitation de méthodes actuelles de reconnaissance d’objets. Il est en effet essentiel de pouvoir localiser dans une même image des instances d’objets différents car les images réelles comportent un nombre très grand de catégories d’objets.

Utilisation des relations spatiales pour la localisation d’objets

Nous envisageons également de combiner l’approche probabiliste que nous avons proposé pour la reconnaissance d’objets avec une modélisation des relations spatiales des parties des objets. Cette modélisation pourra être faite par en modélisant la densité de chacune des parties dans l’espace ou par l’utilisation d’un champ de Markov caché (comme dans l’application de reconnaissance de textures).

Annexe

A

Evaluation des performances d’un

classifieur

Nous avons vu au cours de ce mémoire que l’évaluation de la performance d’un classifieur est un problème récurrent et qui dépend du type de supervision. Nous allons considérer, dans cette annexe, l’évaluation de la performance d’un classifieur dans le cas supervisé. Nous présenterons tout d’abord les techniques de ré-échantillonage permettant en particulier de régler les paramètres des méthodes de classification. Nous nous intéresserons ensuite aux mesures qu’il est possible d’utiliser pour comparer deux classifieurs.

A.1 Techniques de ré-échantillonage

De nombreuses méthodes d’analyse discriminante possèdent un ou plusieurs paramètres qu’il n’est pas possible d’estimer par maximum de vraisemblance à partir du jeu d’apprentissage. On peut alors déterminer empiriquement, sur ce même jeu d’apprentissage, quelle valeur est la plus proche de la valeur réelle de ce paramètre. Pour cela, il suffit de parcourir l’espace des valeurs possibles de ce paramètre et de calculer le taux d’erreur obtenu par le classifieur associé sur le jeu d’apprentissage. Cependant, une telle approche conduit à une estimation très optimiste du taux d’erreur réel du classi-fieur et le choix du paramètre est donc biaisé. Il est donc nécessaire de mettre en place une technique de ré-échantillonage pour réduire ce biais.