HDclassif : un package R pour la classification non-supervisée de données en grande dimension
Texte intégral
Documents relatifs
Exemple : si deux mots ont la même étiquette, ils sont en rapport avec une même
Après avoir rappelé quelques notions élémentaires de classification non supervisée, nous pro- posons dans la suite de cette thèse d’étudier la classification au travers des
`a un petit nombre de variables latentes (Friguet et al. La strat´egie propos´ee consiste `a appliquer les proc´edures sur les donn´ees conditionnellement `a cette struc- ture
Se fondant ainsi sur des données et une mesure de proximité quantifiant la ressemblance ou la dissemblance entre les individus, nous pouvons désormais définir de manière informelle
Mots-clés : statistique bayésienne, données fonctionnelles, processus de Dirichlet, classification de courbes, MCMC Keywords: bayesian statistics, functional data, Dirichlet
We use the k−means algorithm (that we initialize many times, retaining the minimum within cluster distance solution) where the input data are the selected scales of the (AR) and
Dans la suite des expériences, HDDA et HDDC seront comparées à différents modèles classiques de mélange gaussien : modèle gaussien avec une matrice de covariance pleine pour
Une famille de modèles gaussiens pour la grande dimension : qui prend en compte le fait que les données de grande dimension vivent dans sous-espaces de dimensions faibles, dont