• Aucun résultat trouvé

Vous avez les 3menus suivants: "Text&#34

N/A
N/A
Protected

Academic year: 2022

Partager "Vous avez les 3menus suivants: "Text&#34"

Copied!
2
0
0

Texte intégral

(1)

Ressoures linguistiques

Master 1

Unitex

Cette séane est onsarée à la prise en main du logiiel Unitex. Nous verrons les

diérentesétapesdetraitementdestextes.

xExerie 1.Logiiel Unitex

1. Téléharger la version 1.2 d'Unitex dans votre répertoire prinipal :

http://www-igm.univ-mlv.fr/~unitex.

Penserà téléharger également lemanuel d'Unitex (pourlaversionen français:

http://www-igm.univ-mlv.fr/~tolone/Linguistique/ManuelUnitex.pdf ).

2. Installer Unitexave les ommandessuivantes:

unzip Unitex_1.2.zip -d Unitex

d Unitex/Sr/C++

make install

3. Laner Unitexsurlalangue française:

d ../../App

java -jar Unitex.jar &

Vous avez les 3menus suivants:

"Text" pour lestextes auformat Uniode;

"DELA"pourlesditionnairesauformatDELA(DitionnairesÉletroniquesduLADL);

"FSGraph" pour les graphesau format .grfet.fst2 pour les graphes ompilés.

xExerie 2.Construtionde graphes

Ouvrir un nouveau grapheave "New" danslemenu "FSGraph".

L'édition de graphes estdétailléedanslehapitre 5.2 du manuel.

Voii lasigniationdes prinipaux symboles :

le<E> représente de mot videepsilon;

le+sépare les diérenteslignes desboîtes;

le: sert àintroduireun appel àun sous-graphe;

le/ indiquele débutdela sortiedansune boîte.

(2)

MERGE :permetd'insérer les séquenes produites par lessorties;

REPLACE :permetde remplaer lesséquenes reonnuespar lesséquenes produites;

letroisième mode ignoreles sorties.

1. Érire une grammaire de normalisation permettant de remplaer

toutes les ourrenes de l'on par on. Enregistrer le graphe dans

unitex/Frenh/Graphs/Preproessing/Replae/etleompiler.

xExerie 3.Chargement d'untexte

Voii lesdiérentesétapesduhargement dutexte Le tour du monde en 80jours :

prétraitement dutexte:normalisation etdéoupage en phrases;

déoupage enunités lexiales;

appliation de ditionnaires;

onstrution de l'automatedu texte.

1. Ouvrir les2graphes suivantsave "Open..."danslemenu"FSGraph" etexplorer leurs

sous-graphes:

unitex/Frenh/Graphs/Preproessing/Replae/Replae.grf qui permet de nor-

maliser letexte;

unitex/Frenh/Graphs/Preproessing/Sentene/Sentene.grfquipermetdedé-

ouperletexte enphrases.

2. Ouvrir le texte unitex/Frenh/Corpus/80jours.txt (de type Raw Uniode Texts)

ave "Open..." danslemenu "Text".

Laner le prétraitement du texte en appliquant Sentene.grf, la grammaire faite à

l'exerie préédent à laplae de Replae.grf (de type Uniode Graphs alors que les

.fst2 sont de type Uniode Compiled Graphs),ainsiqueles ditionnaires par défaut.

Vous obtenez la liste des unités lexiales (tokens) trouvées dans le texte ainsi que la

liste desmots simples,omposésetinonnus trouvés.

Le répertoire unitex/Frenh/Corpus/80jours_sntontient toutes esdonnées.

Vouspouvez ouvrirles hiers dlf, dl eterrave "Open" danslemenu"DELA".

L'ouverture et le prétraitement d'un texte sont détaillés dans le hapitre 2.4 et 2.5

danslemanuel.

3. Construirel'automatedutexte("ConstrutFST-Text..."danslemenu"Text"ourelan-

er leprétraitement ave "Preproessing Text..." dansle menu "Text" en onstruisant

l'automatedu texte). L'automate du texteestaylique.

La onstrution de l'automate du texte est détaillée dans le hapitre 7.1 et 7.2 du

manuel.

xExerie 4.Reherhe de motifsélémentaires

1. Reherher lemotif parlerenliquant sur"LoatePattern..." dansle menu "Text".

2. Même questionave lemotif <parler>.

3. Même questionave lemotif <V:P3p>.

4. À quoi orrespondent les motifspréédents?

Références

Documents relatifs

[r]

Q 2 Il écrit ensuite sur une même ligne la suite croissante S 2 des n entiers naturels consécutifs en partant de l'entier 1 auquel il affecte le signe &#34;+&#34; puis il

Pour le calcul de K(n,k), on passera par celui de P(n,k), nombre de mots de longueur n écrits avec au plus k lettres, tels que deux lettres adjacentes soient toujours différentes

.ةليوط ةينمز ةرتفل سقطلا ةلاح وه خانملا. رحلا

[r]

The study focuses on phonological, orthographical, lexical, syntactical, semantic, pragmatic and tex- tual aspects and reveals the overwhelming influence of French, English and

[r]

[r]