• Aucun résultat trouvé

Sélection de modèle pour la classification non supervisée

N/A
N/A
Protected

Academic year: 2021

Partager "Sélection de modèle pour la classification non supervisée"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: inria-00510149

https://hal.inria.fr/inria-00510149

Submitted on 17 Aug 2010

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Sélection de modèle pour la classification non supervisée

Jean-Patrick Baudry

To cite this version:

Jean-Patrick Baudry. Sélection de modèle pour la classification non supervisée. Journées MAS et Journée en l’honneur de Jacques Neveu, Aug 2010, Talence, France. �inria-00510149�

(2)

Journées MAS 2010, Bordeaux

Session : Apprentissage statistique

Sélection de modèle pour la classication non supervisée

par Jean-Patrick Baudry

Nous rappelons les bases de l'approche de la classication non supervisée par les modèles de mélange. La méthode usuelle repose sur le maximum de vrai-semblance et le choix du nombre de classes à former se fait par des critères pénalisés. Nous nous intéressons particulièrement au critère ICL (Biernacki, Celeux et Govaert, 2000), mis au point pour tenir compte de l'objectif de classication et pertinent en pratique. L'étude que nous proposons de ce cri-tère et de la notion de classe sous-jacente repose sur l'introduction d'un cadre de minimisation d'un contraste adapté à ce contexte. Ce faisant nous dénis-sons un nouvel estimateur et une nouvelle famille de critères de sélection de modèles dont nous étudions les propriétés  notamment la consistance. La calibration de ces critères peut se faire par l'heuristique de pente (Birgé et Massart, 2006). Divers aspects pratiques de leur mise en ÷uvre sont discutés et leur compo ! rtement pratique illustré par des simulations.

Adresse :

Jean-Patrick Baudry

Laboratoire de Mathématiques, Université Paris Sud Bâtiment 430, bureau 25

91405 Orsay Cedex, France

E-mail : jean-patrick.baudry@math.u-psud.fr <www.math.u-psud.fr/~baudry>

Références

Documents relatifs

Nous proposons une approche fondée sur le modèle de mélange de lois qui permet de sélectionner un modèle de classication et un nombre de classes de sorte à produire une

L’int´ erˆ et de cette strat´ egie de s´ election de mod` ele est illustr´ e pour des mod` eles de m´ elange gaussien et de lois de Poisson sur des donn´ ees simul´ ees et sur

d’expérimentation : sélection sur un critère &#34;global&#34;, prenant en compte à la fois la fertilité et la prolificité, sélection sur les composantes de

Journées MAS et Journée en l’honneur de Jacques Neveu, Aug 2010,

Nous avons alors proposé dans ce cadre deux extensions d’AIC cond peu coûteuses, la première reposant sur le comptage du nombre de paramètres du modèle génératif impliqués dans

Dans ce papier, nous avons pr´esenter deux m´ethodes, bas´ees sur l’´etude de la fonction φ, afin d’avoir des crit`eres de s´election de mod`ele de risques concurrents. En

10.2 Séletion de variables et estimation dans les modèles mixtes fontionnels178 A Vitesse de onvergene de l'estimateur de seuillage hétérosédas- tique 181 B Propriétés oraulaires

Exemple : si deux mots ont la même étiquette, ils sont en rapport avec une même