HDclassif : un package R pour la classification non-supervisée de données en grande dimension
Texte intégral
Documents relatifs
Après avoir rappelé quelques notions élémentaires de classification non supervisée, nous pro- posons dans la suite de cette thèse d’étudier la classification au travers des
Mots-clés : statistique bayésienne, données fonctionnelles, processus de Dirichlet, classification de courbes, MCMC Keywords: bayesian statistics, functional data, Dirichlet
Se fondant ainsi sur des données et une mesure de proximité quantifiant la ressemblance ou la dissemblance entre les individus, nous pouvons désormais définir de manière informelle
Exemple : si deux mots ont la même étiquette, ils sont en rapport avec une même
We use the k−means algorithm (that we initialize many times, retaining the minimum within cluster distance solution) where the input data are the selected scales of the (AR) and
Dans la suite des expériences, HDDA et HDDC seront comparées à différents modèles classiques de mélange gaussien : modèle gaussien avec une matrice de covariance pleine pour
Une famille de modèles gaussiens pour la grande dimension : qui prend en compte le fait que les données de grande dimension vivent dans sous-espaces de dimensions faibles, dont
`a un petit nombre de variables latentes (Friguet et al. La strat´egie propos´ee consiste `a appliquer les proc´edures sur les donn´ees conditionnellement `a cette struc- ture