Graphes d’entit´es nomm´ees - Approches supervisées et faiblement supervisées pour l’extraction

La structure de graphe, bien que définie depuis longtemps et largement ex- ploitée depuis lors dans des domaines comme celui des réseaux de communication, a connu depuis quelques dizaines d’années un grand succès en tant que modèle de représentation. Le traitement automatique des langues (TAL) n’a pas échappé à cette tendance comme le prouvent en particulier les ateliers TextGraph1

. Les graphes ont été ainsi été utilisés pour plusieurs tâches allant, sans être exhaustif, de la résolution de coréférence [Chen and Ji, 2009; Nicolae and Nicolae, 2006] à la désambiguation des sens de mots [Dorow and Widdows, 2003] en passant par le résumé automatique [Mihalcea, 2004] et la tâche de question-réponse [Aceves- Pérez et al., 2007; Mollá, 2006].

Nous appliquons ici les graphes au cadre de l’extraction d’événements et plus particulièrement à la représentation des templates. Ce choix est justifié par le fait que les événements que nous cherchons à caractériser au travers des templates sont constitués d’entités et de relations entre ces entités. Les templates peuvent ainsi être considérés comme des graphes où les nœuds représentent des entités (ce qui inclut ici des événements) et les arcs représentent les relations entre ces entités. Cette structure offre en outre une grande souplesse de représentation puisqu’elle permet à la fois de représenter la structure finale désirée, un événement lié à un ensemble d’entités, et ses versions préliminaires au cours du processus d’extraction dans lesquelles plusieurs mentions d’événements ou plusieurs occurrences d’une même entité peuvent apparaˆıtre. De fa¸con simplificatrice, nous nommerons dans ce qui suit ces graphes «graphes d’entités nommées» ou «graphes d’entités».

Ces graphes d’entités sont plus précisément des graphes pondérés, non orientés, dont les arcs symbolisent l’existence ou l’absence d’une relation entre deux entités. Le poids associé à chaque arc correspond quant à lui à un score de confiance (wi)

et a pour objet de refléter le niveau de confiance quant à l’existence d’une relation entre deux entités. Il est à noter qu’un graphe d’entités n’est pas nécessairement connexe.

La figure4.2 montre deux exemples de graphes d’entités, en l’occurrence ceux produits pour chacune des phrases de la même figure. Il s’agit de graphes d’entités

Extrait de document

Un violent séisme a frappé samedi le nord du Japon, avec un premier bilan de trois morts, 65 blessés, et au moins 12 disparus, {…} faisant tanguer les immeubles.

La secousse, d'abord annoncée de magnitude 7 sur l'échelle ouverte de Richter, a été révisée à la hausse à 7,2. Graphes d'entités séisme w₁₁ w₁₃ w₁₂ nord du Japon samedi

w₂₁

w₂₃ w₂₂

7 7,2

secousse

Fig. 4.2 – Exemple de graphes d’entit´es nomm´ees au niveau des phrases

associés à des templates intermédiaires qu’il faudra fusionner pour produire le template final. On peut noter que dans le premier cas toutes les entités sont effectivement liées alors que dans le second graphe, les scores de confiance w21

et w23 devraient être proche de zéro puisque la meilleure valeur pour le rôle

MAGNITUDE est 7,2.

L’intérêt d’adopter une structure de représentation abstraite telle que la structure de graphe est de pouvoir réutiliser les méthodes de manipulation associées. Ainsi, une manière générique d’envisager le remplissage de templates est de le considérer comme un problème de partitionnement d’un graphe d’entités tel que nous l’avons décrit ci-dessus. Le partitionnement de graphe (ou clustering de graphe) [Chen and Ji, 2010; Schaeffer, 2007] est en effet un problème connu, défini comme une tâche visant à regrouper les nœuds d’un graphe sous forme de clusters en tenant compte de la structure du graphe de telle fa¸con que le nombre d’arcs à l’intérieur des clusters soit plus important que celui entre les clusters. Le partitionnement de graphe produit donc des clusters assimilables à des sous- graphes fortement connectés. Dans notre cas, ces sous-graphes correspondraient à des instances de templates.

On peut noter que la problématique du clustering de graphe d’entités est proche de celle du partitionnement présentée à la section2.4.2.3mais que compte tenu de l’absence de structure a priori dans ce dernier cas, le clustering s’effectue

plutôt au niveau des relations que des entités. L’application du clustering de graphe au remplissage de templates est en revanche présentée dans [Wick et al., 2006] comme nous avons pu le voir à la section 4.1.1. Cette application s’effectue plus précisément pour l’extraction d’enregistrements de base de données à partir de textes : un graphe est d’abord construit à partir de toutes les entités trouvées dans un document, puis un clustering de ce graphe est réalisé afin de reconstituer les enregistrements.

Les méthodes génériques de partitionnement de graphe ne sont toutefois pas très adaptées à notre problématique de remplissage de templates. Lors d’un tel clustering, les entités sont en effet regroupées sans tenir compte de la structure du template. En particulier, il est difficile pour ces méthodes d’intégrer des contraintes visant à exclure d’un cluster la présence de plusieurs entités ayant le même rôle vis-à-vis de l’événement, alors que dans notre contexte, le processus de remplissage des templates doit ne retenir qu’une seule entité pour chaque rôle. Dans [Wick et al., 2006], le clustering de graphe est en revanche plus adapté dans la mesure où les champs des templates peuvent être multi-valués (pluralité possible des adresses postales ou des numéros de téléphone pour une personne dans le cas présent). Nous détaillons donc dans la section suivante la méthode spécifique que nous avons définie pour la sélection de la valeur d’un champ parmi plusieurs entités de même type pour le remplissage d’un template. Au préalable, la méthode de construction du graphe d’entités servant de point de départ à cette sélection est elle-même précisée.

4.3 Application du rattachement `a l’extraction

Dans le document Approches supervisées et faiblement supervisées pour l’extraction d’événements et le peuplement de bases de connaissances (Page 96-98)