• Aucun résultat trouvé

Codification des catégories et traits flexionnels

Dans le document Modélisation de la morphosyntaxe du malgache (Page 196-200)

9.0. Introduction

Le traitement d’une langue agglutinante par Unitex nécessite de déterminer une segmentation des mots en unités morphologiques, de classer ces éléments en catégories morpho-syntaxiques et de leur associer des traits flexionnels. Dans ce chapitre, nous expliquons d’abord l’utilité de la codification des catégories et traits ; la codification des catégories grammaticales est développée en deuxième lieu ; ensuite, la codification des traits flexionnels est abordée ; enfin, les correspondances entre les catégories de morphèmes et les traits flexionnels sont exposées.

9.1. Utilité de la codification des catégories grammaticales et traits flexionnels

Il n’existe pas de preuve que les programmes informatiques soient capables de détecter automatiquement un nom, ou un adjectif ou un verbe ou un adverbe, etc. si les informations les concernant ne sont pas présentes dans le dictionnaire, c’est-à-dire dans le dictionnaire du programme. La codification des catégories grammaticales et traits flexionnels est réalisée dans le but de permettre aux programmes informatiques de détecter convenablement ces différents mots et/ou morphèmes. En effet, les programmes informatiques ne sont pas comme les êtres humains qui possèdent des acquis linguistiques ; alors qu’une fois les informations nécessaires disponibles, les programmes informatiques deviennent les meilleurs alliés de l’homme dans l’accomplissement de son travail (traduction de documents, recherche d’informations, etc.).

Sur un plan technique, l’utilisation des informations par les machines suppose qu’elles soient sous forme structurée comme dans les dictionnaires électroniques. En effet, les dictionnaires électroniques ne sont pas comme les dictionnaires usuels où les articles sont composés de phrases, d’exemples. Dans les dictionnaires électroniques, les articles sont entièrement constitués de codes qui renseignent sur le mot. Pour ce qui concerne le présent travail, les variations morphologiques des radicaux verbaux ou classes radicales, les classes de combinaison des affixes ou classes affixales, les groupes, modèles et classes de conjugaison sont les renseignements dont la machine a besoin pour construire les ressources utilisées par

196 l’analyseur morphologique afin de reconnaître automatiquement les verbes dans les textes sous format électronique. Tout bien considéré, l’utilité de la codification des catégories gammaticales repose sur le fait que la codification de la catégorie grammaticale d’un mot permet de relier ce mot à son code de partie de discours. Par la suite, il permet de distinguer les mots comme melonnée N. et melonné, ée Adj. ou ànatra N. et ànatra V., etc. Quant à la codification des traits flexionnels, elle permet de donner les valeurs des morphèmes grammaticaux, donc de les relier également aux morphèmes grammaticaux eux-mêmes, ce qui fournit un minimum de précision dans l’identification automatique des morphèmes grammaticaux.

9.2. Codification des catégories grammaticales

Les catégories grammaticales qui entrent en jeu dans ce travail forment une classification morpho-syntaxique des morphèmes. Le terme de catégorie grammaticale est utilisé non seulement pour les mots, mais aussi pour les morphèmes qui les composent. Il y a deux types de morphèmes : les morphèmes lexicaux et les morphèmes grammaticaux. Les codifications de ces deux types de morphèmes sont traitées ci-dessous dans cet ordre.

9.2.1. Codification des morphèmes lexicaux

Les verbes, plus exactement les radicaux verbaux, sont considérés comme morphèmes lexicaux. Ils sont tous codés V. Au chapitre 12, la codification de leurs variations morphologiques est développée.

9.2.2. Codification des morphèmes grammaticaux

Les morphèmes grammaticaux sont les morphèmes de mode, de temps, de voix et d’aspect. Ils peuvent être ou bien des préfixes, ou bien des suffixes. Les suffixes sont de deux types selon qu’ils sont SI « suffixe d’impératif » ou SV « suffixe de voix ». En revanche, les préfixes peuvent être T « préfixe de temps », PV « préfixe de voix », PA « préfixe d’aspect résultatif », PR « préfixe du réciproque » et PF « préfixe du factitif ».

9.2.3. Rôle des codes des catégories grammaticaux

Ces codes (codes des morphèmes lexicaux et morphèmes grammaticaux), pour cette étude, permettent de reconnaître automatiquement dans des textes :

197

− les catégories des affixes verbaux une fois que ceux-ci sont indiqués dans des graphes d’affixes (voir chap. 11.2.).

Ils sont les bases ultimes de l’analyseur morphologique car ils permettent de reconnaître les entrées verbales mêmes et les affixes grammaticaux disséminés partout dans des textes, une fois que les verbes ont été insérés dans le dictionnaire et les affixes gammaticaux indiqués dans des graphes de mots.

9.3. Codification des traits flexionnels

Les traits permettent de fournir les valeurs des affixes grammaticaux dans l’analyseur morphologique. En ce qui concerne les verbes, 4 types de codifications des traits sont à réaliser, celles du mode, du temps, de la voix et de l’aspect. Ci-dessous ces 4 codifications sont développées dans cet ordre.

9.3.1. Trait flexionnel de mode

Le mode peut être indicatif ou impératif. Seul le mode impératif est marqué par l’un des morphèmes -a, -o, -y et ils sont les seules marques de l’impératif. Il s’ensuit que les verbes ne comportant pas ces morphèmes sont nécessairement au mode indicatif. -a est la marque de l’impératif de l’actif-statif ; -o, -y sont les marques de l’impératif du circonstanciel, de l’agissif-instrumentif, du locatif et de l’objectif. Ainsi, les valeurs que peuvent porter le mode sont a « actif-statif », c « circonstanciel », i « agissif-instrumentif », l « locatif » et o « objectif »[81].

9.3.2. Trait flexionnel de temps

Selon le mode, impératif ou indicatif, le temps peut être un « thème de présent » pour le premier et « passé », « présent », « futur » pour le second. En effet, ce « thème de présent » a comme affixe, celui du temps « présent » même, mais parce que celui-ci ne s’oppose à aucun autre temps, Siméon RAJAONA a voulu marqué cette différence par l’utilisation d’un terme autre que « présent », d’où le terme « thème de présent ». Il s’ensuit que les valeurs du temps sont toujours ou bien passé ou bien présent ou bien futur. Leurs codes respectifs sont p « passé », r « présent » et f « futur ».

81 Siméon RAJAONA, pour départager les valeurs des morphèmes du mode impératif emploie les termes d’aspect « duratif » pour celle de l’impératif qui marque l’actif-statif ; et d’aspect « ponctuel » pour celle de l’impératif qui marque le circonstanciel, l’agissif-instrumentif, le locatif et l’objectif pour faire correspondre le traits du mode aux traits de la voix.

198 9.3.3. Trait flexionnel de voix

Les voix utilisées dans la formalisation des verbes sont les voix active-stative, circonstancielle, agissive-instrumentive, locative, objective (cf. chap. 5). Leurs codes respectifs sont a « actif-statif », c « circonstanciel », i « agissif-instrumentif », l « locatif » et o « objectif ». Au chapitre 11 est développé le système de combinaison des radicaux verbaux avec les affixes qui portent ces traits.

9.3.4. Trait flexionnel d’aspect

L’aspect peut être résultatif ou non résultatif. L’aspect non résultatif n’est pas marqué par un morphème particulier ; seul l’aspect résultatif est marqué et dans ce cas, les morphèmes sont les seules marques de l’aspect résultatif. Leurs morphèmes sont codés au 11.1.2.1. et 11.1.2.3. Leurs valeurs sont les valeurs de la voix auxquelles elles correspondent 82.

Lorsqu’un préfixe d’aspect résultatif (PA) est présent dans une forme verbale, il est la seule marque de la voix du verbe. Ainsi, les traits que peuvent porter ces préfixes sont a « actif-statif », i « agissif-instrumentif », l « locatif » et o « objectif ». Nous avons observé un verbe pour lequel l’aspect résultatif est compatible avec la voix circonstancielle : c’est le cas du verbe saotra « remercier », verbe du 1er groupe.

(111) Misaotra azy aho. Je le remercie.

(112) Mahasaotra azy aho. J’arrive à le remercier. (113) Voasaotrako izy.

Je l’ai complètement remercié.

Dans (111), le préfixe de voix PV:a marque l’actif-statif. Entre (111) et (112), il n’y a aucun changement de position du verbe, donc le préfixe d’aspect correspond à l’étiquette PA:a dans (112). Le complément d’objet dans (111) azy «lui » devient sujet dans (113) : c’est la phrase correspondante à la diathèse passive - mais ici à l'aspect résultatif - alors que la forme verbale à l’objectif pour saotra n’est pas attestée. On n’emploie pas *saorina ou *saorana comme dans :

82 Siméon RAJAONA (1972, p. 239) corrobore ce fait en disant qu’il y a des morphèmes à valeur uniquement d’aspect et qui son affectés à des voix particulières. C’est le cas par exemple de maha- « résultatif de l’agentif-statif », Ø-, voa- « résultatif de l’objectif ».

199 (114) *Saorako izy. ou *Saoriko izy.

La seule phrase attestée est celle à la voix circonstancielle comme dans : (115) Isaorako izy. (PV:c)

C’est lui que je remercie.

Cela veut dire que la voix circonstancielle, telle qu’elle a été définie dans cette thèse, à partir des affixes du non-résultatif, ne sert pas toujours à la diathèse circonstancielle, puisqu'ici elle marque le passif (cf. R.B. RABENILAINA, 1991, p.45). Ainsi, les correspondances entre voix et diathèse admettent des irrégularités. On peut supposer qu'une diathèse donnée, observée dans une paire telle que (113)-(115) pour un verbe donné, est marquée par la même voix dans les deux phrases. Le temps imparti pour ce travail ne nous permet pas de revoir les verbes systématiquement du point de vue syntaxique pour la vérification de cette hypothèse, mais nous fournissons seulement ici un contre-exemple pour mentionner l’existence des faits. 9.4. Correspondance entre traits et valeurs flexionnels

Les valeurs du trait que portent les préfixes de temps (T) sont p « passé », r « présent » etf « futur » alors que les valeurs du trait que portent les préfixes de voix (PV) sont a « actif-statif », c « circonstanciel » et i « agissif-instrumentif ». Par ailleurs, les suffixes de voix (SV) portent les valeurs suivants : l « locatif », o « objectif » et c « circonstanciel ».

Traits Affixes Valeurs

Temps préfixes T p « passé », r « présent », f « futur » Modes préfixes SI

Voix préfixes PV a « actif-statif » c « circonstanciel » i « agissif-instrumentif » suffixes SV o « objectif », l « locatif »

c « circonstanciel » Aspect préfixes PA

Dans le document Modélisation de la morphosyntaxe du malgache (Page 196-200)