• Aucun résultat trouvé

Chapitre 3 : Langue arabe et les difficultés de sa traitement

2 Langue Arabe

2.3 Catégories d’un mot

Avant de commencer le traitement automatique de la langue arabe, il faut tenir compte

de la classification des unités lexicales de la langue arabe (nom, verbe, pronom…) sur

laquelle doit se baser le traitement.

2.3.1 Le verbe

La majorité de mots arabes, dérivent d’un verbe de trois consonnes qui représente

lui-même une racine d’un groupe de mots. Par conséquent, le mot en arabe se déduit à partir de la

racine en rajoutant des suffixes, des préfixes ou les deux en même temps.

En arabe, la conjugaison des verbes dépend de facteurs suivants :

- Le temps : accompli (passé) ou inaccompli (présent).

- Le nombre du sujet : singulier, duel, pluriel.

- Le genre : masculin ou féminin.

34

- La voix : active ou passive.

Voici un exemple qui explique l’effet de ces différents facteurs :

Dans cet exemple, on prend la combinaison de ces trois consonnes (ب + ت + ك) « k + t

+ b » donne le verbe بتك « écrire ».

Les trois lettres K, T, B, on les trouvera dans tous les mots qui dérivent de cette racine,

en rajoutant des préfixes, des suffixes ou les deux à la racine.

La conjugaison des verbes arabes dépend de plusieurs facteurs, parmi ces facteurs le

temps. Par contre, la notion du temps est différente de celle du français, il se divise en deux

temps : l’accompli et l’inaccompli. L’inaccompli recouvre le présent et le futur et l’accompli

représente le passé.

- L’accompli : Il désigne le passé et le verbe conjugué se distingue par des suffixes.

Dans notre cas, la conjugaison du verbe بتك « écrire » avec le pluriel féminin donne

نبتك KaTaBna, « elles ont écrit » et avec le pluriel masculin donne اوبتك KaTaBuu, « ils

ont écrit ».

- L’inaccompli présent : Dans ce cas, l’action est en cours d'accomplissement. Les

verbes conjugués se distinguent par les préfixes. Comme exemple, la conjugaison du

verbe بتك « écrire » au masculin singulier donne بتكي yaKTuBu, « il écrit » et avec le

féminin singulier donne بتكت taKTuBu, « elle écrit ».

- L’inaccompli futur : Dans ce cas, l’action se déroulera au futur et elle est marquée par

l'antéposition de س sa ou فوس sawfa au verbe. En ajoutant l'antéposition س sa à notre

exemple, on obtient بتكيس sayaKTuBu , « il écrira » et en ajoutant l'antéposition فوس

sawfa, on obtient فوس بتكي sawfa yaKTubu « il va écrire ».

2.3.2 Le nom

En arabe, le nom se divise en deux catégories, ceux qui sont dérivés d’une racine

verbale et ceux qui ne le sont pas, tel est le cas des noms propres, des noms étrangers...

La déclinaison des noms obéit à plusieurs règles :

- Le féminin singulier : dans la plupart des cas, on ajoute la lettre ة t pour obtenir le nom

au féminin singulier (exemple : ريغص « petit » devient ةريغص « petite »).

- Le féminin pluriel : généralement, on rajoute les deux lettres تا (exemple : لماع «

Chapitre 3 : Langue arabe et les difficultés de sa traitement

35

- Le masculin pluriel : généralement, on rajoute les deux lettres نو ou les deux lettres ني

qui dépendent de la position du mot dans la phrase (sujet ou complément d’objet).

Exemple : مّلعم « enseignant » devient نيمّلعم ou نومّلعم « enseignants ».

- Le pluriel irrégulier : c’est le cas le plus complexe en arabe, pour transformer un mot

au pluriel, on doit insérer des lettres au début, au milieu ou à la fin du mot, (exemple :

لفق « serrure » devient لافقأ « serrures »).

Le problème du pluriel irrégulier dans l'arabe pose un défi à la morphologie, non

seulement à cause de sa nature non concaténative, mais aussi parce que son analyse dépend de

la structure de chaque mot (Kiraz, 1996) comme pour les verbes irréguliers.

2.3.3 Les particules

En arabe, les particules sont principalement les mots outils de la langue, comme les

conjonctions de coordination et de subordination. Elles ont un rôle très important dans

l’interprétation de la phrase (Kadri & Benyamina, 1992). Les particules sont classées selon

leur fonction dans la phrase, on en distingue plusieurs types (introduction, explication,

conséquence). Elles jouent un rôle important dans l’interprétation de la phrase. Elles sont

utilisées dans la phrase pour situer des faits ou des objets par rapport au temps ou au lieu ;

elles jouent, également, un rôle clé dans l'enchaînement et la cohérence d'un texte.

Par exemple, on trouve des particules temporelles ou spatiales qui désignent :

- Un temps ذنم (pendant), لبق (avant), دعب (après).

- Un lieu : ثيح (où).

On trouve aussi des particules qui peuvent exprimer des pronoms relatifs (la

détermination avec une valeur référentielle), par exemple : نيذّللا « ceux », يذّللا « ce », يتّللا

« cette ».

De même façon que les noms et verbes arabes, certaines particules peuvent également

avoir des préfixes et suffixes ce qui rajoute une complexité quant à leur identification.

2.3.4 Les préfixes

En arabe, les préfixes présentent les morphèmes correspondant aux lettres qui se

situent en début de mot. Ils servent à indiquer la personne de la conjugaison des verbes. Le

tableau suivant illustre les préfixes verbaux les plus fréquents en arabe.

36

Lettre Rôle

أ Indique la première personne au singulier (je) ن Indique la première personne au pluriel (nous)

ت Indique la deuxième personne féminine, masculine, singulière et duelle

ي Indique la troisième personne masculine au singulier, duel, pluriel, masculin et féminin pluriel.

Tableau 4 : Liste des préfixes verbaux les plus fréquents en arabe

2.3.5 Les suffixes

En arabe, les suffixes présentent essentiellement les terminaisons des conjugaisons

verbales, ainsi que les marques du pluriel et du féminin pour les noms. On ne trouve jamais

une combinaison entre deux suffixes. Le tableau suivant illustre les suffixes les plus fréquents

en arabe.

ا ة ني ةي مه هت هو تا

ه هي كت نه مت نا او

ي ةي ان اه مك يت نو

Tableau 5: Liste des suffixes les plus fréquents en arabe

2.3.6 Les proclitiques

A la différence des préfixes et suffixes, les proclitiques se combinent entre eux pour

donner des informations pertinentes sur le mot arabe (coordination, détermination, traits

sémantiques…). Selon (Abbes, 2004), dans le cas des verbes, les proclitiques dépendent

exclusivement de l’aspect verbal. Ils comprennent donc tous les pronoms et par conséquent,

ils sont compatibles avec tous les préfixes pris par l’aspect. Dans le cas des noms, le

proclitique dépend du mode et du cas de déclinaison.

Les proclitiques peuvent exprimer la coordination en utilisant les coordonnants ف « f »

et ن « w », l’interrogation en utilisant la lettre أ « hamza », le futur avec la marque س « s ».

Chapitre 3 : Langue arabe et les difficultés de sa traitement

37

Il n’est pas toujours facile de faire la différence entre les proclitiques et les lettres de la

racine. Par exemple, la lettre س « s » dans le verbe رفا « il a voyagé » est une lettre de la س

racine, par contre dans le mot بهذيس « il va partir » c’est un proclitique (il marque le futur).

2.3.7 Les enclitiques

De la même manière que les proclitiques, les enclitiques se combinent entre eux pour

donner une post-base composée. On les trouve toujours attachés à la fin du mot pour produire

des pronoms qui s’attachent au verbe (complément d’objet direct), au nom et à la préposition

(complément d’objet indirect).

Voici quelques exemples d’enclitiques :

- ي « Y » : ينطعأ « il m’a donné».

- امه « homA » امهاطعأ« il les a donnés ».

- مه « hom » مهاطعأ « ils l’ont donné ».

2.3.8 Les pré-bases

Les pré-bases en arabe sont obtenues par la concaténation des proclitiques et des

préfixes. On peut générer d’une manière automatique les pré-bases en utilisant la liste des

proclitiques et des préfixes. Dans la langue arabe, il y a 192 concaténations possibles. Le

tableau suivant montre un exemple de pré-bases :

Pré-base Préfixe Proclitique تسأ (asata) ت (ta) سأ (asa) تس (sata) ت (ta) س (sa) تفأ (afata) ت (ta) فأ (afa) تسف (fasata) ت (ta) سف (fasa)

Tableau 6 : Exemple de pré-bases

2.3.9 Les post-bases

Les post-bases en arabe sont obtenues par la concaténation des enclitiques et des

suffixes. Théoriquement, il y a 233 concaténations possibles qui peuvent se lier après la base.

38

Selon (Abbes, 2004) les compatibilités dépendent des pronoms décrits par chacune des

particules. Le tableau suivant montre un exemple de post-bases :

Pré-base Suffixe Enclitique

مهو(wahom) و(wa) م (hom) ه

يننو(wanany) ين(nY) نو(wan)

مكّنأ(Annakom) ّنأ(Anna) مك(kom)

مهّنأ(Annahom) ّنأ(Anna) مه(hom)

Tableau 7: Exemple de post-bases

3 Difficultés du traitement automatique de la langue