• Aucun résultat trouvé

9.3 Traitement automatique du langage et interdisciplinarité

9.3.1 Participation au projet ANR GaFes (2015-2018)

9.3.3 Responsable scientifique Informatique du projet RePoGa (2020) . . . 149

9.4 Collaborations industrielles . . . 150 9.5 Conclusion . . . 150

Ce chapitre est dédié à mon implication dans différents projets de recherche. Les premières parties seront consacrées à la synthèse de ces projets de recherche et leur intégration dans mes problématiques et thématiques de recherche. La dernière partie s’intéressera à un résumé de mon implication dans des collaborations industrielles.

9.1 Reconnaissance automatique de la parole et extraction

d’in-formation

Mes travaux de recherche ont débuté en reconnaissance automatique de la parole (RAP), en particulier sur le traitement de la parole spontanée. Cette thématique se retrouve dans le projet ANR EPAC (sous-partie 9.1.1), où mes travaux m’ont amené à m’intéresser à l’adaptation des modèles de RAP. J’ai également pu travailler sur l’extraction d’information à travers les systèmes de RAP, que l’on retrouve à la fois dans le projet ANR EPAC, pour la détection de la parole

spontanée, mais également le projet ANR PERCOL (sous-partie 9.1.2), pour la reconnaissance et correction de noms propres.

9.1.1 Participation au projet ANR EPAC (2007-2010)

Le projet ANR EPAC est le premier projet financé auquel j’ai eu l’occasion de participer. Bien que je n’étais pas financé par ce projet, il intervient dans la cadre de ma thèse sur le traitement de la parole spontanée. Le projet visait l’exploration de masses de documents audio pour l’extraction et le traitement de la parole conversationnelle, et impliquait 4 partenaires académiques : Le LIUM (Le Mans Université - coordinateur du projet), le LI (Université de Tours), le LIA (Avignon Université) et l’IRIT (Université de Toulouse).

L’objectif principal de mon travail de thèse, prenant part dans le projet, a été de proposer des solutions pour améliorer les performances des systèmes de RAP sur la parole spontanée, caractérisée par de nombreuses spécificités (disfluences, agrammaticalité, baisse de la fluidité de la parole...). Ainsi, dans un premier temps, un outil de détection automatique de la parole spontanée a été proposé [Dufour et al., 2009]. Cet outil est très important puisqu’il a permis, dans un deuxième temps, de définir une approche non-supervisée d’adaptation des modèles acoustiques et des modèles de langage du système de RAP à la parole spontanée, en sélectionnant automatiquement les segments contenant ce type de parole [Dufour et al.,2010].

9.1.2 Participation au projet ANR PERCOL (2012-2014)

Dès mon arrivée au LIA en tant que maître de conférences en septembre 2012, j’ai pu m’inté-grer dans le projet ANR PERCOL [Favre et al.,2013], supervisé au LIA par Corinne Fredouille, regroupant alors 2 autres laboratoires de recherche académique (LIF Aix Marseille Université -coordinateur scientifique, et LIFL - Université de Lille) ainsi qu’un partenaire industriel (Orange Labs). Débuté en septembre 2010, l’objectif du projet PERCOL était d’avoir un consortium pour la participation au défi REPERE. De manière générale, le but était de proposer un système de détection et de reconnaissance de personnes dans des documents audiovisuels.

Ce projet m’a permis de continuer sur des thématiques initiées pendant ma thèse, mon année d’ATER et mon post-doctorat, en me familiarisant à l’outil de RAP du LIA, nommé Speeral [Linares et al.,2007], me permettant par la suite de m’intégrer dans des collaborations industrielles (voir partie 9.4). Cela m’a également permis d’obtenir des premières collaborations au LIA sur la problématique de recherche de noms de personnes dans le flux parlé, que ce soit avec des approches acoustiques et par espaces de thèmes [Senay et al.,2013], ou bien avec des approches hybrides avec des modèles de contextes continus [Bigot et al.,2013b,a].

9.2. Robustesse des représentations de documents

9.2 Robustesse des représentations de documents

Le spectre de mes thématiques de recherche s’est ensuite élargi pour travailler à la fois sur des documents écrits et parlés, avec comme point central la problématique de la représentation des mots contenus dans les documents en vue de leur utilisation pour d’autres tâches. Mes travaux m’ont alors amené à travailler sur des représentations de documents de plus haut niveau que le simple niveau mot, que l’on retrouve en particulier dans le projet ANR SuMACC (sous-partie 9.2.1). La prise en compte de l’aspect temporel des mots et des documents a également fait partie de mes orientations scientifiques, que l’on retrouve dans le projet ANR ContNomina (sous-partie 9.2.2).

9.2.1 Participation au projet ANR SuMACC (2013-2014)

Tout comme le projet PERCOL, j’ai pu rapidement m’intégrer dans le projet SuMACC [ Mor-chid et al.,2014i], débuté en 2010, porté par le LIA, et coordonné par Georges Linarès. Ce projet avait pour partenaires le laboratoire EURECOM, ainsi que les entreprises Wikio et Syllabs. La problématique développée concernait la recherche d’entités sur Internet, prenant alors en consi-dération l’hétérogénéité des documents traités sur ce média, ainsi que l’explosion constante du nombre de documents nouveaux mis en ligne. L’intérêt ici était de porter l’étude sur le côté multimédia, avec des travaux sur la vidéo, le texte et l’audio.

Ce projet a été ma première expérience de co-encadrement, avec G. Linarès, d’un étudiant en thèse (Mohamed Morchid). Mes travaux ont évolué vers le traitement de documents issus du web, alors que l’ensemble de mes travaux se concentrait sur des émissions télévisuelles ou radiophoniques. La structure des documents ainsi que les problématiques différentes développées m’ont, en particulier, permis d’évoluer sur ma manière d’appréhender le contenu textuel et audio, beaucoup plus bruité dans ce contexte d’étude, et de travailler sur des approches nouvelles, comme par exemple les travaux pour la représentation de documents par espaces de thèmes latents [Morchid et al.,2013b] ou l’application de l’approche i-vecteur, issue de la reconnaissance du locuteur, pour les documents textuels [Morchid et al.,2014a,b].

9.2.2 Participation au projet ANR ContNomina (2013-2017)

Le projet ANR ContNomina est le premier projet auquel j’ai pu participer dès son lancement en septembre 2013. Le sujet concernait la reconnaissance des noms propres dans les documents diachroniques audio. Le caractère diachronique de ces noms propres, qui évoluent donc dans le temps, constituent l’originalité du projet, puisque des nouveaux noms apparaissent continuelle-ment dans les médias, ce qui oblige les systèmes de RAP, qui ont un vocabulaire fermé, à gérer dynamiquement les dictionnaires de mots ainsi que les modèles de langage associés. Il s’agissait d’exploiter au mieux le contexte d’apparition des mots pour fournir des stratégies de recherche,

de détection, et de modélisation de nouveaux mots pour permettre une meilleure transcription automatique. En plus du LIA, dont le responsable scientifique était G. Linarès, le projet était coordonné par le LORIA (Université de Lorraine).

Les travaux auxquels j’ai pu participer se sont concentrés sur la représentation du contexte des mots en sortie des systèmes de transcription, et plus particulièrement sur la modélisation du contexte au moyen de représentations par des modèles contextuels continus [Bigot et al., 2013b] ou encore par plongement lexical (word embeddings), que l’on retrouve dans les travaux de thèse de Killian Janod [Janod et al.,2015,2016a]. J’ai également supervisé la mise en place de l’outil de visualisation des noms propres dans les transcriptions automatiques, réalisé par Mathias Quillot.

9.3 Traitement automatique du langage et interdisciplinarité

Les problématiques en traitement du langage, intégrant une forte interdisciplinarité, ont pris une place de plus en plus importante dans les travaux de recherche que je mène depuis plusieurs années. Ceux-ci se concrétisent, notamment, dans trois projets de recherche ANR, à savoir les projets GaFes (sous-partie 9.3.1), TheVoice (sous-partie 9.3.2) et RePoGa (sous-partie 9.3.3). En particulier, ceux-ci ont fait émerger des problématiques d’évaluation originales, nécessitant la mise en place de cadres expérimentaux souvent inexistants. Nous avons donc oeuvré à la proposition de nouveaux cadres de travail dont la dimension sciences humaines a été un enjeu important, nous permettant également de proposer des approches originales comme par exemple pour l’exploration des réseaux sociaux numériques (projets GaFes et RePoGa) ou l’étude de la voix jouée (projet TheVoice).

9.3.1 Participation au projet ANR GaFes (2015-2018)

Le projet ANR GaFes a eu pour but d’analyser l’activité significative sur le web pour mieux comprendre les pratiques festivalières et développer des approches permettant la visualisation et l’accès aux contenus générés sur Internet dans et autour des festivals. Les problèmes scientifiques soulevés relèvent à la fois de l’informatique, mais également des sciences humaines et sociales, en particulier de la sociologie des publics. Le projet a été coordonné par le LIA, par G. Linarès, en collaboration avec le laboratoire EURECOM, les entreprises Syllabs et GECE, ainsi que les sociologues du CNE (Centre Norbert Elias).

Le projet GaFes a constitué une évolution dans mes activités de recherche dont les problé-matiques sont encore, à l’heure actuelle, au coeur de mon projet scientifique. Il est le premier projet au volet pluridisciplinaire auquel j’ai pu participer. De par son aspect original, le projet a permis la réalisation de travaux scientifiques autour de l’exploration des données, notamment par rapport à leur temporalité [Quillot et al.,2017], ou encore sur la détection d’opinions dans

9.3. Traitement automatique du langage et interdisciplinarité

les tweets [Dufour et al., 2018]. Il a également servi de plateforme de démonstration, réalisée pendant l’alternance de M. Quillot, à destination du grand public (voir partie 11.4), et utilisée dans le cadre des travaux de recherche et enquêtes des sociologues.