Chapitre 8 : Architecture du système d’ALAO réalisé
3 Génération des activités basées sur l’analyse morphologique
3.1 Jeu d’étiquettes morphosyntaxiques
Avant de commencer la phase de la conception et la génération des activités, nous
devons préciser le jeu d’étiquette que l’on va utiliser dans notre plate-forme lors de la création
de l’activité. Ce travail présente une étape cruciale dans la conception de notre plate-forme,
car toutes les activités basées sur l’analyseur morphologique dépendent de ce choix. De plus,
ce jeu est très important (Sanchez et al, 1995) pour la diversité des activités proposées dans
notre système d’ALAO.
3.1.1 Définition de jeu d’étiquette
L’objectif de notre travail est de construire deux ensembles d’étiquettes, catégories
grammaticales principales et sous-catégories. Au début, nous avons défini 13 étiquettes
principales comme les montre le tableau suivant :
Catégories Correspondant Catégories Correspondant
adj Adjectif prep Préposition
adv Adverbe det Déterminant
pron Pronom pc pronom sujet
noun nom pro pronom indéfini
verb verbe neg Négation
int Interjection conj conjonction PUN Ponctuation
Tableau 26 : Étiquettes de la plate-forme.
En second lieu, nous avons attribué des sous-catégories aux catégories principales
suivantes : adjectif, déterminant, verbe, nom et pronom.
- Adjectif : contient deux sous-catégories, le genre (masculin, féminin ou non
déterminé) et le nombre (singulier, pluriel).
- Verbe : contient quatre sous-catégories, le temps (indicatif présent, indicatif imparfait,
futur simple et passé simple), le mode (indicatif, subjonctif, gérondif, conditionnel et
Chapitre 8 : Architecture du système d’ALAO réalisé
145
infinitif), groupe (1
ergroupe, 2
èmegroupe et 3
èmegroupe) et personne (1
èrepersonne
singulier, 2
èmepersonne singulier, 3
èmmepersonne singulier, 1
èrepersonne pluriel, 2
èmmepersonne pluriel et 3
èmmepersonne pluriel).
- Déterminant : contient trois sous-catégories, le genre (masculin, féminin ou non
déterminé), le nombre (singulier, pluriel) et le type (article défini, article indéfini,
adjectif possessif, adjectif démonstratif, adjectif interrogatif et adjectif numéral).
- Nom : contient deux sous-catégories, le genre (masculin, féminin ou non déterminé) et
le nombre (singulier, pluriel).
- Pronom : contient quatre sous-catégories, le genre (masculin, féminin ou non
déterminé), le nombre (singulier, pluriel), la personne (1
èrepersonne singulier, 2
èmmepersonne singulier, 3
èmmepersonne singulier, 1
èrepersonne pluriel, 2
èmmepersonne
pluriel et 3
èmmepersonne pluriel) et le type (pronom possessif, pronom démonstratif,
pronom interrogatif, pronom relatif, pronom personnel et pronom indéfini).
Nous avons intégré dans les bases de données de notre plate-forme les étiquettes les
plus utilisées dans les activités d’apprentissage des langues. Sachant que nous pouvons
toujours ajouter d’autres étiquettes à la base.
3.1.2 Adaptation des étiquettes de TreeTagger
Dans le cas du français, nous avons utilisé l’analyseur morphologique TreeTagger. Ce
dernier utilise un jeu de 33 étiquettes (voir le tableau ci-après).
Étiquettes Correspondant Étiquettes Correspondant
ABR Abréviation PRP Préposition
ADJ Adjectif PRP:det Préposition + Article
ADV Adverbe PUN Ponctuation
DET:ART Article PUN:cit Ponctuation de citation
DET:POS Pronom Possessif SENT Balise de phrase
INT Interjection SYM Symbole
146
NAM Nom Propre VER:futu Verbe au futur
NOM NOM VER:impe Verbe à l’impératif
NUM Numéral VER:impf Verbe à l’imparfait
PRO Pronom VER:infi Verbe à infinitif
PRO:DEM Pronom Démonstratif VER:pper Verbe au participe passé PRO:IND Pronom Indéfini VER:ppre Verbe au participe présent
PRO:PER Pronom Personnel VER:pres Verbe au présent
PRO:POS Pronom Possessif VER:simp Verbe au passé simple PRO:REL Pronom Relatif VER:subi Verbe à l’imparfait du subjunctif VER:subp Verbe au présent du subjonctif