• Aucun résultat trouvé

Classification de données labellisées de manière imprécise et incertaine

N/A
N/A
Protected

Academic year: 2021

Partager "Classification de données labellisées de manière imprécise et incertaine"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: inria-00496015

https://hal.inria.fr/inria-00496015

Submitted on 29 Jun 2010

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Classification de données labellisées de manière

imprécise et incertaine

Etienne Côme

To cite this version:

Etienne Côme. Classification de données labellisées de manière imprécise et incertaine. Journées MAS et Journée en l’honneur de Jacques Neveu, Aug 2010, Talence, France. �inria-00496015�

(2)

Journées MAS 2010, Bordeaux

Session : Apprentissage statistique

Classication de données labellisées de manière imprécise

et incertaine

par Etienne Côme

Cette intervention présente une solution aux problèmes de classication fai-sant intervenir des données d'apprentissage labellisées de manière imprécise et incertaine. Tous les exemples utilisés pour l'apprentissage sont donc décrits classiquement par un vecteur de descripteurs xi , mais aussi par une étiquette

imprécise et/ou incertaine mi, spéciant de manière douce l'appartenance de

l'individu aux diérentes classes d'intérêts. Nous proposons d'utiliser comme étiquette une fonction de masse de croyance. Le problème d'apprentissage est donc traité dans le cadre de la théorie des fonctions de croyance, ce qui permet une grande souplesse dans la dénition des étiquettes. Cette approche généralise ainsi diérents problèmes d'apprentissage couramment rencontrés dans la littérature : supervisé, non-supervisé, semi-supervisé, partiellement supervisé, que nous présenterons successivement. Pour résoudre le problème de classication, la solution décrite fait l'hypothèse que les données sont gé-nérées suivant un modèle de mélange. Nous montrerons que dans ce cadre il est possible de dériver grâce au théorème de Bayes généralisé un critère qui étend les critères de maximum de vraisemblance associés aux diérents problèmes d'apprentissages sus-mentionnés. Nous présenterons également un algorithme de type EM dédié à l'optimisation de ce critère et permettant d'obtenir une estimation des diérents paramètres du modèle. Finalement, nous donnerons des résultats de simulations mettant en évidence l'intérêt d'une telle approche, en particulier pour traiter élégamment les problèmes résultant d'erreurs d'étiquetages.

Adresse : Etienne Côme

SAMM, Université Paris 1 90 Rue de Tolbiac

75013 Paris, France

E-mail : Etienne.Come@univ-paris1.fr

<http://samm.univ-paris1.fr/COME-Etienne>

Références

Documents relatifs

Dans cet article, nous mettons en œuvre quelques éléments de la théorie de Dempster-Shafer dans un outil de réseaux bayésiens pour former ce que nous appelons un réseau de

En utilisant la méthode des chaînes de Markov floues proposée dans cet article, celle des α-coupes et les opérations arithmétiques définies précédemment, on détermine

Supposant un impact modéré de la crise financière sur la sphère réelle, nous anticipons une remontée du cours à 100 dollars dès 2009 qui reflète la stabilisation du taux de

Ainsi, c’est précisément une interprétation des « problèmes » qui tend à évacuer l’idée de violence des « populations à problèmes » qui caractérise tout

En hypothèse, cette incertitude propre à la nuit est comme potentialisée en milieux urbains alors que la grande ville est par essence « un site d’imprévisibilité

• Pour permettre à une variable d’être source de données dans une liaison, sa déclaration doit être précédée de l’étiquette [Bindable]..

2 Donner les bases géométriques nécessaires à la construction des modèles et à la compréhension de certaines notions en statistiques. 3 Aborder quelques méthodes de

La labellisation Station Verte valorise le positionnement de la commune dans son souci de garantir un tourisme à la fois authentique et respectueux des caractéristiques locales,