• Aucun résultat trouvé

PyMixmod, le composant pour Python de MIXMOD Classification des données par modèles de mélanges Classification des données

N/A
N/A
Protected

Academic year: 2021

Partager "PyMixmod, le composant pour Python de MIXMOD Classification des données par modèles de mélanges Classification des données"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: hal-01355421

https://hal.archives-ouvertes.fr/hal-01355421

Submitted on 23 Aug 2016

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

PyMixmod, le composant pour Python de MIXMOD Classification des données par modèles de mélanges

Classification des données

Florent Langrognet, Christian Poli

To cite this version:

Florent Langrognet, Christian Poli. PyMixmod, le composant pour Python de MIXMOD Classifica-tion des données par modèles de mélanges ClassificaClassifica-tion des données. JDEV (Journées du DEVel-oppement logiciel) 2015, 2015, Bordeaux, France. 2015. �hal-01355421�

(2)

PyMixmod, le composant pour Python de MIXMOD

Classification des donn´

ees par mod`

eles de m´

elanges

www.mixmod.org

Florent Langrognet

a

, Christian Poli

b

a

Laboratoire de Math´ematiques de Besan¸con (Universit´e de Franche-Comt´e - CNRS)

b

Inria Saclay - ˆIle-de-France (Service Exp´erimentation et d´eveloppement)

Classification des donn´

ees

Regrouper des individus dans des classes homog`enes Classification non supervis´ee

Trouver le ’bon’ nombre de classes Classer les individus

Caract´eriser les classes

Classification supervis´ee : apprentissage puis classement

MIXMOD et les mod`

eles de m´

elanges

Approche probabiliste souple

Donn´ees quantitatives, qualitatives, ou mixtes

Big data (nombre d’invidus et/ou nombre de caract´eristiques) Principales fonctionnalit´es

3 Algorithmes : EM, CEM, SEM 6 M´ethodes d’initialisation

4 Crit`eres de s´election : BIC, ICL, NEC, CV

14 mod`eles gaussiens pour les donn´ees quantitatives

5 mod`eles multinomiaux pour les donn´ees qualitatives

8 mod`eles pour les donn´ees quantitatives en Grande Dimension 20 mod`eles pour les donn´ees mixtes (quantitatives/qualitatives)

Partager en ligne avec PyMixmod

PyMixmod en interaction avec Plotly PyMixmod et IPython Notebook

Diffusion, valorisation, utilisations

de MIXMOD

Domaines tr`es vari´es : Banque, marketing, environnement, sociologie, ´epid´emiologie, g´enomique, biochimie, ...

5 composants logiciels sous Licence GNU GPL : www.mixmod.org Utilisateurs : environ 200 t´el´echargements par mois

Enrichissement et redistribution - Ex : SelVarClust, RMixmodCombi Int´egration de la biblioth`eque mixmodLib dans d’autres logiciels

Collaborations sur des probl`ematiques complexes Conf´erences, articles

Article de recherche Classification des climats en France

PyMixmod

Destin´e `a rendre la biblioth`eque mixmodLib accessible `a la communaut´e scientifique utilisant Python, en particulier dans les domaines de la manipu-lation, analyse et visualisation des donn´ees

Int´egr´e avec l’´ecosyst`eme Python d´edi´e au calcul scientifique et au Big data : NumPy, SciPy, Pandas et Matplotlib

D´evelopp´e en Cython pour de meilleures performances grˆace `a un code 100% natif

Interop´erable avec des outils de visualisation de donn´ees en ligne (Plotly, IPython Notebook)

Compatible avec Python 2.7.x et Python 3.4.x

Visualiser avec PyMixmod

Références

Documents relatifs

Pour deux jeux de donn´ees RNA-seq, nous effectuons la classification des g`enes `a l’aide du mod`ele de m´elange de Poisson sur les donn´ees de comptage brutes, et `a l’aide

Cette m´ ethode combine l’utilisation de mesures de similarit´ es avec une m´ ethode de classification r´ ecente bas´ ee sur l’introduction d’un noyau dans le mod` ele de

Method : overview Method : overview Web Page Web site Classification Web Page HTML Page Type Cleaning Web Page XHTML Page Type Semantic Enrichment META File Page Type XML Page Type

Chapitre 3 : Variable selection for clustering with Gaussian mixture models Dans ce chapitre, nous autorisons les variables non significatives ` a ne d´ ependre que d’un sous-groupe

Given a constituent [X] and the marker x that is to appear to the right of IX], this function figures out the category C of [X] and calls (SEG-C [X] x). When the recurslon Is

In this chapter, we successfully tested the two-level method using the DtN coarse space for two- dimensional homogeneous and heterogeneous Helmholtz problems.. Furthermore, we

Zhang [136] a compar´e les deux m´ethodes et reporte que les param`etres sont mieux estim´es par application du principe du champ moyen (dans le cadre d’une mod´elisation par champ

Pour cela nous considérons un modèle hiérarchique, dans lequel la couche cachée est issue d’un mélange de lois gaussiennes bivariées et la couche d’observation est obtenue par