• Aucun résultat trouvé

Equipe VERTIGO

N/A
N/A
Protected

Academic year: 2022

Partager "Equipe VERTIGO"

Copied!
35
0
0

Texte intégral

(1)

Equipe VERTIGO

Permanents:

Philippe Rigaux, PU, responsable (en disponibilité 2011-2014)

Michel Crucianu, PU (directeur du CEDRIC 2010-2014)

Marin Ferecatu, McF

Nicolas Travers, McF

Raphaël Fournier-S’niehotta, McF (recrutement 2014)

Doctorants

Quatre thèses soutenues : A. Stoian 2012-2015, H. Randrianarivo 2012 -2016, Q. N. Tran 2013-2017, L. Yang 2013-2017

Trois en cours : A. Besedin (bourse CEA) depuis 9/16, Y. Le Cacheux (bourse CEA) depuis 10/17, F. Foscarin (ANR MuNIR) début 11/17

(2)

Domaine(s) de recherche, collaborations internes

Bases de

données Recherche

d’informati on

Fouille de données / apprentissage

Descripteurs,

recherche/classement Modèles, langages,

index et algorithmes

Analyse d'images :

segmentation, extraction d'objets, passage à

l’échelle

(3)

Domaine(s) de recherche, collaborations internes

Bases de

données Recherche

d’informati on

Fouille de données / apprentissage ISID

Axe B (S. Cherfi, F. Hamdi)

Réseaux sociaux

Organisation ICDE18

(C. du Mouza)

(4)

Domaine(s) de recherche, collaborations internes

Bases de

données Recherche

d’informati on

Fouille de données / apprentissage ISID

Axe B (S. Cherfi, F. Hamdi)

Réseaux sociaux

Organisation ICDE18

(C. du Mouza)

MSDMA En

discussion

(5)

Etant donnée une (grande) collection de « documents », développer des méthodes et outils (efficaces) basés sur le contenu pour : l’interrogation (structurée, non structurée), la classification, l’extraction d’information et de connaissance.

Point commun: gestion par le contenu de grandes collections multimédia

23/10/2017 CEDRIC EA4629 5

(6)

Etant donnée une (grande) collection de « documents », développer des méthodes et outils (efficaces) basés sur le contenu pour : l’interrogation (structurée, non structurée), la classification, l’extraction d’information et de connaissance.

Contenu = image (Axe A)

Segmentation automatique, Annotation sémantique

Point commun: gestion par le contenu de grandes collections multimédia

23/10/2017 CEDRIC EA4629 6

(7)

Etant donnée une (grande) collection de « documents », développer des méthodes et outils (efficaces) basés sur le contenu pour : l’interrogation (structurée, non structurée), la classification, l’extraction d’information et de connaissance.

Contenu = document Web

On extrait des « token » (mots-clés normalisés)

Mieux: On exploite ce qui existe (les liens) Encore mieux: on analyse sémantiquement pour chercher

des entités, des événements => on annote

Point commun: gestion par le contenu de grandes collections multimédia

23/10/2017 CEDRIC EA4629 7

(8)

Etant donnée une (grande) collection de « documents », développer des méthodes et outils (efficaces) basés sur le contenu pour : l’interrogation (structurée, non structurée), la classification, l’extraction d’information et de connaissance.

Contenu = musique notée (Axe B)

Point commun: gestion par le contenu de grandes collections multimédia

23/10/2017 CEDRIC EA4629 8

Modélisation (séries temporelles), similarité, analyse du langage musical

(9)

Evolution pendant la période

23/10/2017 CEDRIC EA4629 9

2012 9/2014 2017

(10)

Evolution pendant la période

23/10/2017 CEDRIC EA4629 10

Axe « Image et apprentissage »

2012 9/2014 2017

Thèmes : segmentation d'images, classification multi-modale Financements: FUI Polymatic, ANR Mex-Culture, ANR Poeme Collaborations : CEA, ONERA

(11)

Evolution pendant la période

23/10/2017 CEDRIC EA4629 11

Axe « Image et apprentissage »

2012 9/2014 2017

Axe «Données du Web »

Thèmes : systèmes de notification, bases documentaires Financements: FUI Polymathic

Collaborations : ISID

(12)

Evolution pendant la période

23/10/2017 CEDRIC EA4629 12

Axe « Image et apprentissage »

2012 9/2014 2017

Axe «Données du Web »

Startup Internet Memory Research

Fondation en septembre 2011 (Julien Masanès, CEO)

Philippe Rigaux co-fondateur, directeur scientifique de 2011 à 2014

Activité: valorisation de données extraites du Web (collecte, extraction, classification):

7 employés temps-plein

2 projets européens en cours

Développement focalisé sur l'analyse du commerce en ligne

Problématiques R&D communes à Vertigo

(13)

Septembre 2014, arrivée de R. Fournier- S’niehotta, retour de disponibilité de Philippe Rigaux.

Evolution pendant la période

23/10/2017 CEDRIC EA4629 13

Axe « Image et apprentissage »

2012 9/2014 2017

Axe «Données du Web » Axe «Informatique musicale » Startup Internet Memory Research

Thèmes : gestion de partitions numérisées, analyse musicale automatique, transcription audio / notation

Financements: ANR MuNIR, projet Mastodons GioQoSo

Collaborations : IreMus/Sorbonne, McGill/Montréal, communauté MEI

(14)

Evolution pendant la période

23/10/2017 CEDRIC EA4629 14

Axe « Image et apprentissage »

2012 9/2014 2017

Axe «Données du Web » Axe «Informatique musicale » Startup Internet Memory Research

Projet à 5 ans. Deux axes.

Axe A : images et apprentissage

Permanents : M. Crucianu et M. Ferecatu

Deux doctorants : A. Besedin, Y. Le Cacheux

Recherche de financement en cours

Axe B : informatique musicale

Permanents : P. Rigaux, N. Travers, R. Fournier

Un doctorant : F. Foscarin

Financement : ANR MuNIR, projet GioQoSo

(15)

Axe A: images et apprentissage

23/10/2017 CEDRIC EA4629 15

(16)

Détection avec segmentation de composants visuels

Interaction entre segmentation, contexte et détection

Segmentation fine spatiale (image) et temporelle (vidéo)

« Traduction » entre modalité visuelle et modalité textuelle

Passage d’une modalité à une autre, représentation latente commune, utilisation conjointe des deux modalités

Passage à l’échelle de la détection

Base de N données, identifier avec une complexité <

O(N) les occurrences d’éléments d’une classe

Données en flux, ne permettant pas de réapprendre avec toutes les données à l’apparition de nouvelles classes

Description robuste de contenus visuels

Description fiable malgré segmentation approximative

Problématique

23/10/2017 CEDRIC EA4629 16

(17)

Résultats obtenus

23/10/2017 CEDRIC EA4629 17

Détection efficace avec segmentation temporelle d’actions dans les vidéos, query by detector, thèse A. Stoian (2012-2015), Mex-Culture (ANR), publications TCSVT, ICIP

Descripteur de formes dont la qualité est améliorée par la présence de bruit, post-doc C. Raftopoulos (2013-2014), Polymathic (FUI),

publication CVPR

Prédiction structurée pour détection d’objets tenant compte du contexte local, thèse H. Randrianarivo (2012-2016), bourse ONERA, publications JSTARS, IGARSS

(18)

Résultats obtenus

23/10/2017 CEDRIC EA4629 18

Segmentation sémantique avec réseaux profonds et affinage, thèse L.

Yang (2014-2017), CIFRE Shopedia, publications PCM, MMM

Représentations conjointes complétées pour la recherche et la détection trans-modale, thèse Q. N. Tran (2013-2017), bourse CEA, publications CVPR, workshop ACM MM

Apprentissage incrémental pour flux de données, thèse A. Besedin, depuis 2016, bourse CEA

(19)

Publications, collaborations, financements

23/10/2017 CEDRIC EA4629 19

Stratégie de publication

Choix du média (journal ou conférence internationale) suivant la cible visée par le résultat des travaux

Valorisation

Notamment à travers les partenaires industriels

Collaborations

Nationales : partenaires académiques (LABRI dans Mex-Culture, IGN dans POEME), partenaires industriels (CEA et ONERA dans les thèses qu’ils financent à 100 %, Shopedia dans CIFRE,

Nicéphore Cité dans POEME)

Internationales : académiques (IPN Mexique dans Mex-Culture, UFMG Brésil dans COFECUB)

Financements

Nationaux : industriels (bourses CEA et ONERA, CIFRE Shopedia), ANR POEME 2013-2016

International : ANR Blanc (Mexique) Mex-Culture 2012-2015

(20)

Projet et défis scientifiques

23/10/2017 CEDRIC EA4629 20

Détection avec extraction de composants visuels

Apprentissage profond avec peu d’exemples (Small Data vs Big Data)

Compréhension de scène visuelle

→ recherche de financements (projet européen, CIFRE, FUI)

Traduction modalité visuelle

modalité textuelle

Compositionnalité des représentations linguistiques apprises

Identification complémentarités / redondances

→ démarrage thèse Y. Le Cacheux (bourse CEA depuis 10/2017), recherche autres financements

Accueil dans l’équipe de Mihai Datcu (DLR) sur une chaire Blaise Pascal (financée par la Fondation de l’ENS, 2018-2020). Son projet concerne l’apprentissage pour la caractérisation sémantique d’images satellite

(21)

23/10/2017 CEDRIC EA4629 21

(22)

Axe B: informatique musicale

23/10/2017 CEDRIC EA4629 22

(23)

Bases de données de partitions musicales

23/10/2017 CEDRIC EA4629 23

Partition numérisée = codage de la musique dans le langage de la notation musicale

(24)

Bases de données de partitions musicales

23/10/2017 CEDRIC EA4629 24

Partition numérisée = codage de la musique dans le langage de la notation musicale

Un langage conçu à la Renaissance...

(25)

Bases de données de partitions musicales

23/10/2017 CEDRIC EA4629 25

Partition numérisée = codage de la musique dans le langage de la notation musicale

Et toujours utilisé pour des musiques très différentes.

(26)

Bases de données de partitions musicales

23/10/2017 CEDRIC EA4629 26

Partition numérisée = codage de la musique dans le langage de la notation musicale

Basé sur un système de symboles et de signes graphiques

(27)

Bases de données de partitions musicales

23/10/2017 CEDRIC EA4629 27

Partition numérisée = codage de la musique dans le langage de la notation musicale

Basé sur un système de symboles et de signes graphiques

.. dont le contenu est aussi disponible sous la forme d'un

encodage très précis

(28)

Interrogation structurée

Etant donné un corpus de partitions, quel modèle, quel langage pour les sélectionner, en extraire des fragments, le transformer, les combiner

TENOR'16, ISMIR'16, TIME'16, soumission à Information Systems en cours

Recherche par similarité

Appariement de fragments mélodiques, recherche, classement, indexation

MEC'16, soumission à Computer Music Journal en cours

Analyse musicale automatisée

Identification automatique des structures du langage musical via la notation

Publication à TENOR’2017 (courte démo?)

Qualité de l’encodage

Modélisation du contenu musical, expression de règles (avec ISID)

Publication à ISMIR 2016

P h l i ti /dé t ti d l l t f NEUMA

Problématiques explorées

23/10/2017 CEDRIC EA4629 28

(29)

Interrogation structurée

Etant donné un corpus de partitions, quel modèle, quel langage pour les sélectionner, en extraire des fragments, le transformer, les combiner

TENOR'16, ISMIR'16, TIME'16, soumission à Information Systems en cours

Recherche par similarité

Appariement de fragments mélodiques, recherche, classement, indexation

MEC'16, soumission à Computer Music Journal en cours

Analyse musicale automatisée

Identification automatique des structures du langage musical via la notation

Publication à TENOR’2017 (courte démo?)

Qualité de l’encodage

Modélisation du contenu musical, expression de règles (avec ISID)

Publication à ISMIR 2016

P h l i ti /dé t ti d l l t f NEUMA

Problématiques explorées

23/10/2017 CEDRIC EA4629 29

(30)

Stratégie de publication

Présence systématique dans les conférences du domaine: ISMIR, TENOR, MEC, JIM.

Valorisation

Développement de la plate-forme en ligne NEUMA, démonstration des outils développés sur des corpus

Collaborations

Nationales: laboratoires de musicologie (IReMUS, Sorbonne; CESR, Tours) et d’informatique musicale (AlgoMus, Lille / INRIA Paris)

Internationales: communauté MEI (organisation MEC 2017), McGil/Montréal

Financements

National: GioQoSo, CNRS/Mastodons, depuis 05/2016

International: ANR MuNIR avec McGill/Montréal, depuis 11/2017

Développement du nouvel axe, 2014-2017

23/10/2017 CEDRIC EA4629 30

(31)

Axe B : projet et défis scientifiques

23/10/2017 CEDRIC EA4629 31

2. Transcription

1. Formalisation calculatoire de l'analyse musicale : comment identifier les séquences tension/détente, l'organisation du discours

Quel est le bon langage pour décrire un contenu musical (audio ou temps réel) ?

(32)

Axe B : projet et défis scientifiques

23/10/2017 CEDRIC EA4629 32

2. Transcription

1. Formalisation calculatoire de l'analyse musicale : comment identifier les séquences tension/détente, l'organisation du discours

Quel est le bon langage pour décrire un contenu musical (audio ou temps réel) ?

(33)

Axe B : projet et défis scientifiques

23/10/2017 CEDRIC EA4629 33

2. Transcription

Défis associés à la transcription :

Le langage de la notation rend-il vraiment compte des phénomènes décrits

Si oui peut-on produire automatiquement une notation à partir d'un document audio ?

Si non peut-on déterminer les phénomènes les plus

caractéristiques et leur associer un système de signes ?

Thèse de Francesco Foscarin

1. Formalisation calculatoire de l'analyse musicale : comment identifier les séquences tension/détente, l'organisation du discours

(34)

Vie de l'équipe

23/10/2017 CEDRIC EA4629 34

Séminaires

Séminaire régulier « MuNIR », trimestriel, 15 personnes (Cnam, IreMus, AlgoMus, CESR, invités), cf. http://munir.cnam.fr

Séminaire ponctuel Vertigo (doctorants, post-doc, invités, 3 en 16-17)

Recherche de financements

Appels ANR, appels FUI (FUI25 avec Internet Memory + CEA), CIFRE

Collaborations internes et externes

ISID recherche (Axe B, 2 publis en 2017) et organisation ICDE'2018

MSDMA : comités de suivi de thèses, échanges en cours

Enseignement

Certificat Données Massives (2 cours, fort succès)

(35)

Diapositive « SWOT »

23/10/2017 CEDRIC EA4629 35

Forces.

Domaines porteurs (Big Data, apprentissage, humanités numériques...)

Bons partenariats, activité reconnue Faiblesses.

Domaines porteurs ! Donc très concurrentiels (doctorants, moyens)

Ouverture, collaborations, visibilité

Opportunités.

Multiplication des applications et des sollicitations

Libération des données en cours Menaces.

Masse critique de l'équipe

Références

Documents relatifs

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Schéma du montage du couplage d’un montage LIBS avec la cellule plasma radiofréquence (RF).. L es nanotechnologies sont présentées comme l’indus- trie du XXI e

Le modèle de pile utilisé dans les exercices est le modèle Full Descending (conformément à l’ARM Procedure Call Standard).. b) en passant les paramètres par la pile, sans

Les contributions présentées dans ce papier sont multiples : (i) nous donnons des garanties de reconstruction d’un signal x à support S fixé, quand l’acquisition est structurée

Dans cette unité, vous découvrirez la syntaxe des différentes instructions de contrôle existant en C ainsi que la notion de fonctions et de structure d’un programme en C

The non-existence is proved using a mixture of Poisson deformation theory, algebraic geometry and representation of symplectic reflection algebras. The existence part is

At the same time, they show a great interest in studying the interaction between the three levels which are generally viewed as the main resources for managing the flow of

We estimate the number of inflationary e-folds before the back-reaction of the radiation energy density overcomes the non-commutative effects and terminates inflation