• Aucun résultat trouvé

Partie II. Analyse automatique du moyen français

Chapitre 5. Analyse lexicale des textes en moyen français

3. Reconnaissance des mots simples

3.1. Analyse des contractions

La contraction consiste à réunir au moins deux formes en une seule unité. En effet, cette combinaison des formes entraine une transformation de l’orthographe des formes utilisées en contraction. Le traitement de ce phénomène linguistique consiste à identifier les formes contractées par exemple « au » est la combinaison des formes contractées « à » et « le ».

Ce traitement améliore considérablement les performances des applications d’annotation automatique et des applications d’interrogation des textes. En effet, les contractions sont fréquentes dans les textes et ne pas en tenir compte produit soit un taux de silence considérable soit un important taux d’erreur qui diminue considérablement la précision du système. A titre d’exemple l’analyse de la contraction « au » est nécessaire à la recherche et à l’annotation de toutes les occurrences des groupes nominaux constitués d’un déterminant « le » suivi d’un nom commun « NC » pour analyser par exemple des séquences comme « au

roi » et « aux seigneurs ».

Le moyen français se caractérise par une fréquente utilisation des contractions. Cependant, contrairement au français moderne, cet usage n’est pas stabilisé, rendant plus complexe l’automatisation de traitement.

3.1.1. Contraction avec « à »

La préposition « à » est souvent placée avant un complément pour décrire plusieurs situations telles qu’exprimer une localisation géographique, indiquer une distance, décrire une composition, des expressions temporelles comme la date et l’heure, mentionner un prix et exprimer des relations de contenance et d’appartenance. Nous avons recensé 4 variantes graphiques possibles de la préposition « à » à savoir « à », « a », « as » et « ad ».

Nous illustrons dans notre graphe de la figure 82 l’analyse de trois cas d’utilisation de la préposition « à » en contraction :

- lorsqu’elle est suivie d’un article défini masculin singulier « le » ou un article défini au pluriel « les » ;

- lorsqu’elle est suivie du pronom « lequel » au masculin singulier ou du pronom au pluriel « lesquels » ou « lesquelles » ;

- lorsqu’elle est suivie d’un article défini singulier masculin « le » ou d’un article défini au pluriel « les », eux-mêmes suivis de participe passé « dit ».

165

Figure 82. Contraction avec « à »

En français moderne, il existe deux occurrences « au » et « aux » qui résultent de la contraction de la préposition « à » avec les articles définis « le » et « les ». En moyen français, nous avons recensé trois variantes de l’occurrence « au » à savoir « au » et « al » et quatre variantes de l’occurrence « aux » à savoir « aux », « aulx », « aus » et « as ».

Notre grammaire de la figure 83 permet d’analyser la contraction de la préposition « à » avec les articles définis « le » et « les » en décomposant les variantes des occurrences « au » et « aux » en préposition « à » suivi du déterminant « le ». De plus, elle permet de lever d’éventuelles ambiguïtés posées par certaines variantes ou par la syntaxe.

Figure 83. Analyse des contractions des variantes des occurrences « au » et « aux »

En effet, certaines variantes des occurrences « au » et « aux » comportent des ambiguïtés. A l’instar de la forme « as » dont les expressions suivantes illustrent deux différents contextes d’apparition. En effet, l’expression (i) montre l’apparition de « as » comme une variante de la préposition « à », tandis que l’expression (ii) illustre l’utilisation de « as » comme une variante de la forme « aux ». Notre grammaire permet de résoudre cette ambiguïtés en annotant la forme « as » par <à, PREP> lorsqu’elle est suivie par l’article définit « le ».

-

establies as l’indignacion de nostre dit seigneur (i)

-

Les heritages soient departiz as enfanz (ii)

166

Au contraire du français moderne, l’occurrence « aux » peut être suivie par le déterminant « les » comme montre l’exemple (iii). Ces cas rares mais bien présents dans notre corpus sont traités par notre grammaire en annotant « as » par la préposition « à » et « les » comme déterminant « le ».

-

mes l'en doit eschiver as les euvres humaines (iii)

Quand la préposition « à » introduit le pronom relatif « lequel » au masculin singulier ou au pluriel, elle génère l’une des trois occurrences suivantes : « auquel », « auxquels » et « auxquelles ». Nous avons recensées une liste non-exhaustive des variantes des occurrences « auquel », « auxquels » et « auxquelles », à savoir respectivement, 2 variantes, 11 variantes et 7 variantes.

La grammaire de la figure 84 permet donc d’analyser les formes contractées en les décomposant en deux unités à savoir la préposition « à » suivi du pronom relatif « lequel ».

Figure 84. Analyse des contractions des variantes des occurrences « auquel », « auxquels » et « auxquelles »

De même pour les occurrences « audit », « auxdits » et « auxdites » qui résultent de la contraction de la préposition « à » avec le déterminant « le » suivi de participe passé « dit », la grammaire de la figure 85 liste les variantes de ces occurrences « audit », « auxdits » et « auxdites » et génèrent trois étiquettes qui correspondent à la succession de la préposition « à » <à,PREP>, du déterminant « le » <le,DET> et de participe passé « dit » <dit,V> et qui seront, chacun, sauvegardé dans la TAS.

167

Figure 85. Analyse des contractions des variantes des occurrences « audit », « auxdits » et « auxdites »

3.1.2. Contraction en « de » et en « du »

A l’inverse du français moderne, l’utilisation des formes simples « de » et « du » n’est pas stable. En effet, la forme « de » peut être une variante de la forme « du » comme montre l’exemple (i) et vice versa la forme « du » peut être une variante de « de » comme illustre l’exemple (ii).

- Il embusoigne en ascun tiel Prince de Monde. (i) - ainsné filz du Roy du France. (ii)

De ce fait, nous considérons que les formes « du » et « de » peuvent avoir trois étiquettes possibles à savoir le déterminant partitif du <du,DET>, préposition de <de,PREP> et l’article indéfini un <un,DET>.

Les formes « de » et « du » peuvent être des occurrences qui résultent des formes contractées de la préposition « de » et du déterminant « le » ou des formes contractées de la préposition « de » et du déterminant « du ».

168

Figure 86. Analyse des contractions des occurrences « de » et « du »

Cependant, quand les formes « de » et « du » sont suivies par le pronom « le », elles seront annotées en proposition avec l’étiquette <de,PREP>. On constate que la séquence « de

la » est bien présente dans notre corpus. Mais, la forme « la », lorsqu’elle est annotée en

pronom ou en déterminant, n’est jamais précédé par la préposition « du ». Il existe trois analyses possibles de la séquence ambiguë « de la ». Cette dernière peut correspondre à une préposition « de » suivie soit du pronom « la » soit du déterminant « la » comme elle peut être la forme féminine du déterminant partitif « du ».

Si le déterminant partitif « du », ou sa forme au féminin « de la », sont suivis d’un mot à initiale vocalique, il s’élide en « de l’ ». En effet, de même que la séquence « de la », notre grammaire de la figure 86 permet de générer trois analyses possibles de la séquence « de l’ ». Il convient de signaler que la séquence « du l’ » est non attestée dans MEDITEXT.

Nous avons développé un graphe, figure 87, qui permet d’analyser l’occurrence « duquel » en la décomposant en préposition « de » et en pronom « lequel » et l’occurrence « dudit » en la décomposant en préposition « de », en déterminant « le » et en participe passé « dit ».

169 3.1.3 Contraction en « des »

Comme en français moderne, la forme simple « des » peut avoir deux annotations possibles à savoir le déterminant indéfini « un » en lui attribuant l’étiquette <un,DET> ou la séquence d’annotation composée de la préposition « de » <de,PREP> suivi du déterminant

« le » <le,DET> .

La forme « des » peut être utilisée en contraction avec d’autres formes afin de générer les variantes des occurrences « desquels », « desquelles », « desdits » et « desdites ». L’analyse de ces formes contractées est assurée par le graphe de la figure 88 qui permet de décomposer les occurrences « desquels » et « desquelles » en préposition « de » suivie du pronom « lequel » et les occurrences « desdits » et « desdites » en préposition « de » suivie du déterminant « le ». Il est important de souligner que nous avons recensé plusieurs variantes des occurrences « desquels », « desquelles », « desdits » et « desdites » et que la forme « de » issue de ces différentes contractions est toujours un pronom.

Figure 88. Analyse des contractions des occurrences « desquels », « desquelles », « desdits » et « desdites »

3.1.4. Contraction avec « dit »

Les analyses, vues précédemment, traitent les différentes variantes des occurrences issues des contractions des formes « à », « de », « du » et « des » avec le participe passé « dit » à savoir « audit », « auxdits », « auxdites » « dudit », « desquels », « desquelles », « desdits » et « desdites ». Nous analysons donc, par la suite, seulement un cas particulier de la contraction de participe passé « dit » à savoir avec le déterminant « le ». En effet, cette contraction donne lieu à quatre occurrences « ledit », « ladite », « lesdits » et « lesdites ». De ce fait, nous avons recensé une liste des variantes pour chacune de ces formes. Ces listes, qui ont été utilisées par

170

notre grammaire présente à la figure 89, ont été décomposées en déterminant « le » suivi d’un participe passé « dit ».

Figure 89. Analyse des contractions des occurrences « ledit », « ladite », « lesdits » et « lesdites »