• Aucun résultat trouvé

Syntactic Reference Corpus of Medieval French et logiciel d’annotation NotaBene

N/A
N/A
Protected

Academic year: 2021

Partager "Syntactic Reference Corpus of Medieval French et logiciel d’annotation NotaBene"

Copied!
115
0
0

Texte intégral

(1)

Syntactic Reference Corpus of Medieval French

et logiciel d’annotation NotaBene

Nicolas Mazziotta

Universität Stuttgart, ILR

(2)

Plan

Exposé en deux parties :

1. Présentation générale de SRCMF

2. Introduction aux fonctionnalités de NotaBene

SRCMF

Présentation du projet

Modèle syntaxique dépendanciel

Outils et procédures Ressources créées

NotaBene

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives : intégration TXM (CoSToMeF)

(3)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

1

re

partie : Syntactic Reference Corpus of Medieval French

Présentation du projet

Modèle syntaxique dépendanciel

Outils et procédures

(4)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Présentation du projet

Fiche descriptive du projet Champ d’études et objectif Équipe et répartition des tâches Modèle syntaxique dépendanciel

Fondements Annotation syntaxique Outils et procédures Outils de communication/centralisation Outil d’annotation Procédures Ressources créées

Formats de sortie et exploitation Documentation

(5)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fiche descriptive du projet

Dénomination

Syntactic Reference Corpus of Medieval French(SRCMF)

Direction scientifique

I Sophie Prévost (CNRS LaTTiCe, Paris) I Achim Stein (ILR, Stuttgart)

Sources de financement

I Subvention française : ANR I Subvention allemande : DFG

Durée

(6)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Champ d’études et objectif

Analyse syntaxique de textes en ancien français et besoin d’une

ressource

I Question de linguistique historique I Français écrit en France du 9eau 14esiècle I Comment les phrases sont-elles construites ?

Nombreuses ressources électroniques syntaxiques pour l’histoire de l’anglais, pas pour le français

⇒ Possibilité de renouvellement de l’approche de la langue

Corpus de travail

Deux corpus de ca 3 millions de mots issus de textes de genres divers : I Base de Français Médiéval(BFM, ENS Lyon)

(7)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Champ d’études et objectif

Analyse syntaxique de textes en ancien français et besoin d’une

ressource

I Question de linguistique historique I Français écrit en France du 9eau 14esiècle I Comment les phrases sont-elles construites ?

Nombreuses ressources électroniques syntaxiques pour l’histoire de l’anglais, pas pour le français

⇒ Possibilité de renouvellement de l’approche de la langue

Corpus de travail

Deux corpus de ca 3 millions de mots issus de textes de genres divers : I Base de Français Médiéval(BFM, ENS Lyon)

(8)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Champ d’études et objectif

Analyse syntaxique de textes en ancien français et besoin d’une

ressource

I Question de linguistique historique I Français écrit en France du 9eau 14esiècle I Comment les phrases sont-elles construites ?

Nombreuses ressources électroniques syntaxiques pour l’histoire de l’anglais, pas pour le français

⇒ Possibilité de renouvellement de l’approche de la langue

Corpus de travail

Deux corpus de ca 3 millions de mots issus de textes de genres divers : I Base de Français Médiéval(BFM, ENS Lyon)

(9)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Champ d’études et objectif

Annotation de corpus

I L’analyse décrit les ressources d’un point de vue syntaxique

I Elle estencodée par un humain(analyse automatique peu satisfaisante) I Elle prend la forme d’une ressource électronique liée au corpus

Objectif

I Constituer une ressource pour la communauté scientifique, en unissant les deux corpus selon un modèle identique

⇒ Résultat : SyntacticReferenceCorpus

I pour alimenter lesrecherchessyntaxiques (linguistique théorique)

I pour permettre de créer des outils detraitement automatiquede l’ancien français (linguistique computationnelle)

(10)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Champ d’études et objectif

Annotation de corpus

I L’analyse décrit les ressources d’un point de vue syntaxique

I Elle estencodée par un humain(analyse automatique peu satisfaisante) I Elle prend la forme d’une ressource électronique liée au corpus

Objectif

I Constituer une ressource pour la communauté scientifique, en unissant les deux corpus selon un modèle identique

⇒ Résultat : SyntacticReferenceCorpus

I pour alimenter lesrecherchessyntaxiques (linguistique théorique)

I pour permettre de créer des outils detraitement automatiquede l’ancien français (linguistique computationnelle)

(11)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Équipe et répartition des tâches

I Direction du projet

I Sophie Prévost (CNRS LaTTiCe, Paris) I Achim Stein (ILR, Stuttgart)

I Contractuels (y compris temps partiels) I Béatrice Bischof (ILR, Stuttgart) I Julie Glikman (CNRS LaTTiCe) I Alexei Lavrentiev (ENS, Lyon) I Nicolas Mazziotta (ILR, Stuttgart) I Tom Rainsford (University of Cambridge)

I Collaborateurs réguliers I Céline Guillot (ENS, Lyon) I Serge Heiden (ENS, Lyon)

I Christiane Marchello-Nizia (ENS, Lyon)

I Experts

I Fernande Dupuis (UQAM, Montréal) I Richard Ingham (University of Birmingham) I Bernard Victorri (ENS, Paris)

Rôles

I modélisation linguistique

I annotation

I développement d’outils

(12)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Équipe et répartition des tâches

I Direction du projet

I Sophie Prévost(CNRS LaTTiCe, Paris) I Achim Stein(ILR, Stuttgart)

I Contractuels (y compris temps partiels) I Béatrice Bischof(ILR, Stuttgart) I Julie Glikman(CNRS LaTTiCe) I Alexei Lavrentiev(ENS, Lyon) I Nicolas Mazziotta(ILR, Stuttgart) I Tom Rainsford(University of Cambridge)

I Collaborateurs réguliers I Céline Guillot(ENS, Lyon) I Serge Heiden (ENS, Lyon)

I Christiane Marchello-Nizia(ENS, Lyon)

I Experts

I Fernande Dupuis(UQAM, Montréal) I Richard Ingham(University of Birmingham) I Bernard Victorri(ENS, Paris)

Rôles

I modélisation linguistique

I annotation

I développement d’outils

(13)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Équipe et répartition des tâches

I Direction du projet

I Sophie Prévost (CNRS LaTTiCe, Paris) I Achim Stein (ILR, Stuttgart)

I Contractuels (y compris temps partiels) I Béatrice Bischof(ILR, Stuttgart) I Julie Glikman(CNRS LaTTiCe) I Alexei Lavrentiev(ENS, Lyon) I Nicolas Mazziotta(ILR, Stuttgart) I Tom Rainsford(University of Cambridge)

I Collaborateurs réguliers I Céline Guillot (ENS, Lyon) I Serge Heiden (ENS, Lyon)

I Christiane Marchello-Nizia (ENS, Lyon)

I Experts

I Fernande Dupuis (UQAM, Montréal) I Richard Ingham (University of Birmingham) I Bernard Victorri (ENS, Paris)

Rôles

I modélisation linguistique

I annotation

I développement d’outils

(14)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Équipe et répartition des tâches

I Direction du projet

I Sophie Prévost (CNRS LaTTiCe, Paris) I Achim Stein(ILR, Stuttgart)

I Contractuels (y compris temps partiels) I Béatrice Bischof (ILR, Stuttgart) I Julie Glikman (CNRS LaTTiCe) I Alexei Lavrentiev (ENS, Lyon) I Nicolas Mazziotta(ILR, Stuttgart) I Tom Rainsford (University of Cambridge)

I Collaborateurs réguliers I Céline Guillot (ENS, Lyon) I Serge Heiden(ENS, Lyon)

I Christiane Marchello-Nizia (ENS, Lyon)

I Experts

I Fernande Dupuis (UQAM, Montréal) I Richard Ingham (University of Birmingham) I Bernard Victorri (ENS, Paris)

Rôles

I modélisation linguistique

I annotation

I développement d’outils

(15)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Équipe et répartition des tâches

I Direction du projet

I Sophie Prévost(CNRS LaTTiCe, Paris) I Achim Stein(ILR, Stuttgart)

I Contractuels (y compris temps partiels) I Béatrice Bischof (ILR, Stuttgart) I Julie Glikman (CNRS LaTTiCe) I Alexei Lavrentiev (ENS, Lyon) I Nicolas Mazziotta (ILR, Stuttgart) I Tom Rainsford (University of Cambridge)

I Collaborateurs réguliers I Céline Guillot (ENS, Lyon) I Serge Heiden (ENS, Lyon)

I Christiane Marchello-Nizia (ENS, Lyon)

I Experts

I Fernande Dupuis (UQAM, Montréal) I Richard Ingham (University of Birmingham) I Bernard Victorri (ENS, Paris)

Rôles

I modélisation linguistique

I annotation

I développement d’outils

(16)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Présentation du projet Fiche descriptive du projet Champ d’études et objectif Équipe et répartition des tâches

Modèle syntaxique dépendanciel

Fondements Annotation syntaxique Outils et procédures Outils de communication/centralisation Outil d’annotation Procédures Ressources créées

Formats de sortie et exploitation Documentation

(17)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris [SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(18)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes

Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris [SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(19)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris [SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(20)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris

[SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(21)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris [SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(22)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Fondements

Modèle dépendanciel vs analyse en constituants

En deux mots :

Dépendance Constituants

Unités liées : liens spécifiques Unités groupées : hiérarchie de groupes Fonctions Natures et distribution

Le chat←suj– tue –obj→ la souris [SN Le chat][SV tue [SN la souris]]

Le verbe au-dessus de la hiérarchie

I Marques spécifiques de portée propositionnelle I Autonomie relative plus grande

(23)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Annotation syntaxique

Distinction entre les plans

I Morphosyntaxe/sémantique/énonciation I Interaction permanente

I Informations encodéespurement syntaxiques

I Critères prioritairement syntaxiques (relations) I Toutefois, variété éteinte ⇒ besoin des autres plans

Options théoriques

I Définition « mécanique » de la phrase

Basée sur 1 verbe ⇔ 1 proposition

I Place seconde pour les mots-outils (pas « translatifs ») I Traitement othogonal de la coordination (quasi symétrique)

(24)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Annotation syntaxique

Distinction entre les plans

I Morphosyntaxe/sémantique/énonciation I Interaction permanente

I Informations encodéespurement syntaxiques

I Critères prioritairement syntaxiques (relations) I Toutefois, variété éteinte ⇒ besoin des autres plans

Options théoriques

I Définition « mécanique » de la phrase

Basée sur 1 verbe ⇔ 1 proposition

I Place seconde pour les mots-outils (pas « translatifs ») I Traitement othogonal de la coordination (quasi symétrique)

(25)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Annotation syntaxique

Distinction entre les plans

I Morphosyntaxe/sémantique/énonciation I Interaction permanente

I Informations encodéespurement syntaxiques

I Critères prioritairement syntaxiques (relations) I Toutefois, variété éteinte ⇒ besoin des autres plans

Options théoriques

I Définition « mécanique » de la phrase

Basée sur 1 verbe ⇔ 1 proposition

I Place seconde pour les mots-outils (pas « translatifs ») I Traitement othogonal de la coordination (quasi symétrique)

(26)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Présentation du projet Fiche descriptive du projet Champ d’études et objectif Équipe et répartition des tâches Modèle syntaxique dépendanciel

Fondements Annotation syntaxique Outils et procédures Outils de communication/centralisation Outil d’annotation Procédures Ressources créées

Formats de sortie et exploitation Documentation

(27)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Outils de communication/centralisation

Équipe large etgéographiquement dispersée

Forum

I Discussions linguistiques I Aide à distance

Wiki

I Archivage des décisions

I Stockage raisonné de la documentation

Subversion (SVN)

I Centralisation des données I Suivi des versions

(28)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Outils de communication/centralisation

Équipe large etgéographiquement dispersée

Forum

I Discussions linguistiques I Aide à distance

Wiki

I Archivage des décisions

I Stockage raisonné de la documentation

Subversion (SVN)

I Centralisation des données I Suivi des versions

(29)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Outil d’annotation

NotaBene

I Encodage de l’annotation syntaxique sous une forme ergonomique I Personnalisation de l’environnement

I Comparaison entre deux annotations parallèles I Exportation des résultats dans différents formats

Voir deuxième partie de l’exposé

I Présentation du logiciel

(30)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Outil d’annotation

NotaBene

I Encodage de l’annotation syntaxique sous une forme ergonomique I Personnalisation de l’environnement

I Comparaison entre deux annotations parallèles I Exportation des résultats dans différents formats

Voir deuxième partie de l’exposé

I Présentation du logiciel

(31)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Outil d’annotation

NotaBene

I Encodage de l’annotation syntaxique sous une forme ergonomique I Personnalisation de l’environnement

I Comparaison entre deux annotations parallèles I Exportation des résultats dans différents formats

Voir deuxième partie de l’exposé

I Présentation du logiciel

(32)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Procédures

Besoin de procédures

Annotation manuelle I Erreurs aléatoires

I Prises de position inconscientes I Inconsistance

But :diminuerle nombre d’erreurs (0 erreurs impossible)

Étapes

1. Annotation parallèle aveugle (deux annotateurs humains)

2. Correction croisée aveugle (même équipe)

(33)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Procédures

Besoin de procédures

Annotation manuelle I Erreurs aléatoires

I Prises de position inconscientes I Inconsistance

But :diminuerle nombre d’erreurs (0 erreurs impossible)

Étapes

1. Annotation parallèle aveugle (deux annotateurs humains)

2. Correction croisée aveugle (même équipe)

(34)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Présentation du projet Fiche descriptive du projet Champ d’études et objectif Équipe et répartition des tâches Modèle syntaxique dépendanciel

Fondements Annotation syntaxique Outils et procédures Outils de communication/centralisation Outil d’annotation Procédures Ressources créées

Formats de sortie et exploitation Documentation

(35)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation

En interne

NotaBene utilise XML et RDF (voir deuxième partie)

Principaux formats pour le corpus SRCMF

I « Tel quel » (annotation) I Graphviz (visualisation) I TigerXML (exploration)

(36)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation

En interne

NotaBene utilise XML et RDF (voir deuxième partie)

Principaux formats pour le corpus SRCMF

I « Tel quel » (annotation) I Graphviz (visualisation) I TigerXML (exploration)

(37)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation

En interne

NotaBene utilise XML et RDF (voir deuxième partie)

Principaux formats pour le corpus SRCMF

I « Tel quel » (annotation) I Graphviz (visualisation) I TigerXML (exploration)

(38)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – « Tel quel »

Annotation telle que présentée en

interne

I Conventions de représentation à but

ergonomique

I Meilleur pour l’annotation que pour l’exploitation

(39)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – « Tel quel »

Annotation telle que présentée en

interne

I Conventions de représentation à but

ergonomique

I Meilleur pour l’annotation que pour l’exploitation

(40)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – Graphviz

Graphviz et lecture humaine

I Outil de dessin de graphes (orientés ou non) I Nombreuses options, rendu rapide

(41)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – Graphviz

Graphviz et lecture humaine

I Outil de dessin de graphes (orientés ou non) I Nombreuses options, rendu rapide

(42)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

Format développé pour l’extraction de structures

I Fichiers XML faciles à générer/manipuler

I Peut encoder des structures dépendancielles/constituants I Outil derequêteavec syntaxe spécifique

<graph root="_1263221221.22"> <terminals> <t id="w26_00103" word="Li" /> <t id="w26_00104" word="rois" /> <t id="w26_00105" word="pense" /> ... </terminals> <nonterminals> <nt id="_1263452434.16" cat="Obj">

<edge label="R" idref="_1263453372.87" /> <edge label="M" idref="_1263221225.03" /> </nt>

<nt id="_1263453372.87" cat="RelNC"> <edge label="L" idref="w26_00106" /> </nt>

<nt id="_1263453407.18" cat="Obj"> <edge label="L" idref="w26_00113" /> </nt>

...

</nonterminals> </graph>

(43)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

Format développé pour l’extraction de structures

I Fichiers XML faciles à générer/manipuler

I Peut encoder des structures dépendancielles/constituants I Outil derequêteavec syntaxe spécifique

<graph root="_1263221221.22"> <terminals> <t id="w26_00103" word="Li" /> <t id="w26_00104" word="rois" /> <t id="w26_00105" word="pense" /> ... </terminals> <nonterminals> <nt id="_1263452434.16" cat="Obj">

<edge label="R" idref="_1263453372.87" /> <edge label="M" idref="_1263221225.03" /> </nt>

<nt id="_1263453372.87" cat="RelNC"> <edge label="L" idref="w26_00106" /> </nt>

<nt id="_1263453407.18" cat="Obj"> <edge label="L" idref="w26_00113" /> </nt>

...

</nonterminals> </graph>

(44)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

(45)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

(46)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

Recherche

Syntaxe spécifique ; par exemple :

[cat="SjPer"] >M [cat="VFin"]

(47)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – TigerXML

Recherche

Syntaxe spécifique ; par exemple :

[cat="SjPer"] >M [cat="VFin"]

(48)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – CoNLL

Format optimisé pour le TAL

I Format tabulaire simple I Permet d’entraîner les parseurs

I Moins expressif que RDF/TigerXML (perte)

1 Li _ _ _ _ _ _ 2 _ Det _ _ _ _ _

2 rois _ _ _ _ morph=Nom _ 3 _ SjPer _ _ _ _ _

3 pense _ _ _ _ morph=VFin _ 0 _ ROOT _ _ _ _ _

4 que _ _ _ _ _ _ 10 _ RelNC _ _ _ _ _

5 par _ _ _ _ _ _ 6 _ RelNC _ _ _ _ _

6 folie _ _ _ _ morph=Nom _ 10 _ Circ _ _ _ _ _

7 Sire _ _ _ _ morph=Nom _ 10 _ Apst _ _ _ _ _

8 Tristran _ _ _ _ _ _ 7 _ ModA _ _ _ _ _

9 vos _ _ _ _ _ _ 10 _ Obj _ _ _ _ _

10 aie _ _ _ _ morph=VFin _ 3 _ Obj _ _ _ _ _

(49)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Formats de sortie et exploitation – CoNLL

Format optimisé pour le TAL

I Format tabulaire simple I Permet d’entraîner les parseurs

I Moins expressif que RDF/TigerXML (perte)

1 Li _ _ _ _ _ _ 2 _ Det _ _ _ _ _

2 rois _ _ _ _ morph=Nom _ 3 _ SjPer _ _ _ _ _

3 pense _ _ _ _ morph=VFin _ 0 _ ROOT _ _ _ _ _

4 que _ _ _ _ _ _ 10 _ RelNC _ _ _ _ _

5 par _ _ _ _ _ _ 6 _ RelNC _ _ _ _ _

6 folie _ _ _ _ morph=Nom _ 10 _ Circ _ _ _ _ _

7 Sire _ _ _ _ morph=Nom _ 10 _ Apst _ _ _ _ _

8 Tristran _ _ _ _ _ _ 7 _ ModA _ _ _ _ _

9 vos _ _ _ _ _ _ 10 _ Obj _ _ _ _ _

10 aie _ _ _ _ morph=VFin _ 3 _ Obj _ _ _ _ _

(50)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Documentation

(51)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Documentation

Plan de chaque fiche

(52)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Documentation

(53)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(54)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(55)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(56)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(57)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(58)

Présentation du projet Modèle syntaxique dépendanciel Outils et procédures Ressources créées

Prospectif : CoSToMeF

Computational Syntactic Tools for Medieval French

Projet soumis. . .

I Projet ANR/DFG soumis, appel 2011 (2012-2015) I Serge Heiden (ENS Lyon) et Achim Stein (ILR Stuttgart)

Application d’outils TAL aux corpus afr.

I Outils

I Parseurs, intégration à TXM, etc. I Interface web

I Utilisation

I « gold standard » ⇒ entraînement des parseurs I Analyses quantitatives et qualitatives

I Description linguistique/évaluation des modèles

I Enrichissement

I Par traitement manuel

(59)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

2

e

partie : Logiciel NotaBene dans SRCMF

Présentation rapide

Philosophie générale

Annotation syntaxique (SRCMF)

(60)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Présentation rapide

Origine et développement Coup d’œil sur l’interface

Philosophie générale

Annotations multiples – Vues multiples Unités et modèle de données

Annotation syntaxique (SRCMF) Vue arborescente

Annotations Comparaisons

(61)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Origine et développement

Recherche doctorale : 2001-2007

I Recherche sur les relations entre ponctuation médiévale et syntaxe en afr. (corpus de chartes originales liégeoises en français)

I Besoin d’uneannotation exhaustivedes relations syntaxiques I Logiciel Perl dédié

Postdoctorat ENS-Lyon (équipe BFM) : 2008

I Besoin d’ajouter/corriger des annotations I Création d’un prototype Python

I Développement des capacités d’annotation de la syntaxe (absent BFM)

⇒ Naissance de SRCMF

SRCMF : 2009-2012

(62)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Origine et développement

Recherche doctorale : 2001-2007

I Recherche sur les relations entre ponctuation médiévale et syntaxe en afr. (corpus de chartes originales liégeoises en français)

I Besoin d’uneannotation exhaustivedes relations syntaxiques I Logiciel Perl dédié

Postdoctorat ENS-Lyon (équipe BFM) : 2008

I Besoin d’ajouter/corriger des annotations I Création d’un prototype Python

I Développement des capacités d’annotation de la syntaxe (absent BFM)

⇒ Naissance de SRCMF

SRCMF : 2009-2012

(63)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Origine et développement

Recherche doctorale : 2001-2007

I Recherche sur les relations entre ponctuation médiévale et syntaxe en afr. (corpus de chartes originales liégeoises en français)

I Besoin d’uneannotation exhaustivedes relations syntaxiques I Logiciel Perl dédié

Postdoctorat ENS-Lyon (équipe BFM) : 2008

I Besoin d’ajouter/corriger des annotations I Création d’un prototype Python

I Développement des capacités d’annotation de la syntaxe (absent BFM)

⇒ Naissance de SRCMF

SRCMF : 2009-2012

(64)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Origine et développement

Recherche doctorale : 2001-2007

I Recherche sur les relations entre ponctuation médiévale et syntaxe en afr. (corpus de chartes originales liégeoises en français)

I Besoin d’uneannotation exhaustivedes relations syntaxiques I Logiciel Perl dédié

Postdoctorat ENS-Lyon (équipe BFM) : 2008

I Besoin d’ajouter/corriger des annotations I Création d’un prototype Python

I Développement des capacités d’annotation de la syntaxe (absent BFM)

⇒ Naissance de SRCMF

SRCMF : 2009-2012

(65)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Coup d’œil sur l’interface

Trois zones principales

(66)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Coup d’œil sur l’interface

Projets

(67)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Coup d’œil sur l’interface

Zone d’annotation

(68)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Coup d’œil sur l’interface

Zone de terminologie

(69)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Présentation rapide

Origine et développement Coup d’œil sur l’interface

Philosophie générale

Annotations multiples – Vues multiples Unités et modèle de données

Annotation syntaxique (SRCMF) Vue arborescente

Annotations Comparaisons

(70)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Principes généraux

I Multiplicité des schémas d’annotation I Multiplicité des intérêts

⇒ Concrètement

1. Annotations de tous types :

I morphologiques I syntaxiques I énonciatives 2. Théories différentes : I dépendance I constituants

Besoins

I Flexibilité I Réduction du bruit

(71)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Principes généraux

I Multiplicité des schémas d’annotation I Multiplicité des intérêts

⇒ Concrètement

1. Annotations de tous types :

I morphologiques I syntaxiques I énonciatives 2. Théories différentes : I dépendance I constituants

Besoins

I Flexibilité I Réduction du bruit

(72)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Principes généraux

I Multiplicité des schémas d’annotation I Multiplicité des intérêts

⇒ Concrètement

1. Annotations de tous types :

I morphologiques I syntaxiques I énonciatives 2. Théories différentes : I dépendance I constituants

Besoins

I Flexibilité I Réduction du bruit

(73)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Principes généraux

I Multiplicité des schémas d’annotation I Multiplicité des intérêts

⇒ Concrètement

1. Annotations de tous types :

I morphologiques I syntaxiques I énonciatives 2. Théories différentes : I dépendance I constituants

Besoins

I Flexibilité I Réduction du bruit

(74)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Principes généraux

I Multiplicité des schémas d’annotation I Multiplicité des intérêts

⇒ Concrètement

1. Annotations de tous types :

I morphologiques I syntaxiques I énonciatives 2. Théories différentes : I dépendance I constituants

Besoins

I Flexibilité I Réduction du bruit

(75)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Dans SRCMF : synchronisation de visualisations multiples du même extrait ; ici :

I Arbre I Concordance I Texte courant

(76)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Dans SRCMF : synchronisation de visualisations multiples du même extrait ; ici :

I Arbre I Concordance I Texte courant

(77)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations multiples – Vues multiples

Dans SRCMF : synchronisation de visualisations multiples du même extrait ; ici :

I Arbre I Concordance I Texte courant

(78)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter. I Resource Description Framework(RDF), annotations sous forme de

graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(79)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter.

I Resource Description Framework(RDF), annotations sous forme de graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(80)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter. I Resource Description Framework(RDF), annotations sous forme de

graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(81)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter. I Resource Description Framework(RDF), annotations sous forme de

graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(82)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter. I Resource Description Framework(RDF), annotations sous forme de

graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(83)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Utilisation de standards du web sémantique

I XML (web « syntaxique »), identification des individus à annoter. I Resource Description Framework(RDF), annotations sous forme de

graphes (ensembles de triplets) :

I OWL Ontology Web Language(OWL) : hiérarchie de classes basé sur RDF, permet le raisonnement logique.

(84)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(85)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(86)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(87)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(88)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(89)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(90)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Unités et modèle de données

Application

I Contrainte générale : si un seul constituant est présent dans un triplet, c’est l’origine qui pointe vers lui.

I Trois relations fondamentales :

1. Catégorisation

2. Groupement/délimitation

(B est « vide » et catégorisable)

(91)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Présentation rapide

Origine et développement Coup d’œil sur l’interface

Philosophie générale

Annotations multiples – Vues multiples Unités et modèle de données

Annotation syntaxique (SRCMF)

Vue arborescente Annotations Comparaisons

(92)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique) I Représentation des dépendances ; en

deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND I le ROND est le nœud principal (= tête)

(93)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique)

I Représentation des dépendances ; en deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND I le ROND est le nœud principal (= tête)

(94)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique) I Représentation des dépendances ; en

deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND I le ROND est le nœud principal (= tête)

(95)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique) I Représentation des dépendances ; en

deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND I le ROND est le nœud principal (= tête)

(96)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique) I Représentation des dépendances ; en

deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND

I le ROND est le nœud principal (= tête) de la structure (sous-arbre)

(97)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Vue arborescente

Objectif : ergonomie

I Nombreuses annotations à poser rapidement

I Présentation en vue hiérarchique arborescente

I Vue de travail(non théorique) I Représentation des dépendances ; en

deux mots :

I Les RONDS représentent des structures, les TRIANGLES spécifient leur dépendance

I À chaque niveau inférieur à la phrase, tous les nœuds dépendent du ROND I le ROND est le nœud principal (= tête)

(98)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(99)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(100)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(101)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(102)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(103)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

Démarche

1. Délimitation de la phrase

2. Identification du nœud verbal qui fonde la phrase

3. Identification, délimitation, caractérisation des dépendants du nœud verbal

4. Récursivement avec toutes les propositions

Il s’agit d’une démarche théorique

I On peut avancer par essai/erreur

(104)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

1. La phrase est délimitée

2. Le nœud verbal est identifié

3. Les dépendants du nœud verbal sont délimités et identifiés

(105)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

1. La phrase est délimitée

2. Le nœud verbal est identifié

3. Les dépendants du nœud verbal sont délimités et identifiés

(106)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

1. La phrase est délimitée

2. Le nœud verbal est identifié

3. Les dépendants du nœud verbal sont délimités et identifiés

(107)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Annotations

1. La phrase est délimitée

2. Le nœud verbal est identifié

3. Les dépendants du nœud verbal sont délimités et identifiés

(108)
(109)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Comparaisons

Cf. étapes de la procédure

I Comparaison d’analyses parallèles ⇒ divergences I Choix de la bonne analyse

(110)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Comparaisons

Cf. étapes de la procédure

I Comparaison d’analyses parallèles ⇒ divergences

(111)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Comparaisons

Cf. étapes de la procédure

I Comparaison d’analyses parallèles ⇒ divergences I Choix de la bonne analyse

(112)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Présentation rapide

Origine et développement Coup d’œil sur l’interface

Philosophie générale

Annotations multiples – Vues multiples Unités et modèle de données

Annotation syntaxique (SRCMF) Vue arborescente

Annotations Comparaisons

(113)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Perspectives : intégration TXM (CoSToMeF)

Dialectique annotation/recherche

I Même environnement intégrant annotation et recherche I Correction et enrichissement par de nouvelles questions

Techniquement

I Développement d’un modèle de données commun décrivant la relation texte/annotation

(114)

Présentation rapide Philosophie générale Annotation syntaxique (SRCMF) Perspectives

Perspectives : intégration TXM (CoSToMeF)

Dialectique annotation/recherche

I Même environnement intégrant annotation et recherche I Correction et enrichissement par de nouvelles questions

Techniquement

I Développement d’un modèle de données commun décrivant la relation texte/annotation

(115)

Merci

Références

Documents relatifs

SageMath est écrit en python (ce langage peut d'ailleurs être utilisé directement dans les feuilles de calcul SageMath).. SageMath appelle en interne des bibliothèques

The third main problem is building phrase structures for Hittite clauses, as there are certain theoretical issues connected to clause architecture questions; and

We report here the coreference annotation process of a corpus of news texts written in Brazilian Portuguese language - the CSTNews corpus [9].. The annota- tion, focused on

A pilot 15,000 words corpus has been annotated in Elan to run a preliminary study of the information structure of illocutionary components in Zaar, a Chadic language spoken

These sentences, as they do not present non-lexical nor ambiguous phenomena, can be easily parsed by a “core” grammar (see section 4.1) with very high precision and recall rates

This distinguishes the SRCMF project from the first major syntactic resource for medieval French: the corpus Modéliser le changement: les voies du français (MCVF) 4 contains,

Another strategy consists of not unpiling but rather perceiving an utterance including a pile as a Directed Acrylic Graph (DAG), that is to say a graph in which the

Tesson décoré d’impressions courtes réalisées à l’aide d’un fragment de coquille de Cardium imprimé per- pendiculairement à la pâte et formant des bandes ho-