Chapitre 3 : Langue arabe et les difficultés de sa traitement
2 Langue Arabe
2.3 Catégories d’un mot
Avant de commencer le traitement automatique de la langue arabe, il faut tenir compte
de la classification des unités lexicales de la langue arabe (nom, verbe, pronom…) sur
laquelle doit se baser le traitement.
2.3.1 Le verbe
La majorité de mots arabes, dérivent d’un verbe de trois consonnes qui représente
lui-même une racine d’un groupe de mots. Par conséquent, le mot en arabe se déduit à partir de la
racine en rajoutant des suffixes, des préfixes ou les deux en même temps.
En arabe, la conjugaison des verbes dépend de facteurs suivants :
- Le temps : accompli (passé) ou inaccompli (présent).
- Le nombre du sujet : singulier, duel, pluriel.
- Le genre : masculin ou féminin.
34
- La voix : active ou passive.
Voici un exemple qui explique l’effet de ces différents facteurs :
Dans cet exemple, on prend la combinaison de ces trois consonnes (ب + ت + ك) « k + t
+ b » donne le verbe بتك « écrire ».
Les trois lettres K, T, B, on les trouvera dans tous les mots qui dérivent de cette racine,
en rajoutant des préfixes, des suffixes ou les deux à la racine.
La conjugaison des verbes arabes dépend de plusieurs facteurs, parmi ces facteurs le
temps. Par contre, la notion du temps est différente de celle du français, il se divise en deux
temps : l’accompli et l’inaccompli. L’inaccompli recouvre le présent et le futur et l’accompli
représente le passé.
- L’accompli : Il désigne le passé et le verbe conjugué se distingue par des suffixes.
Dans notre cas, la conjugaison du verbe بتك « écrire » avec le pluriel féminin donne
نبتك KaTaBna, « elles ont écrit » et avec le pluriel masculin donne اوبتك KaTaBuu, « ils
ont écrit ».
- L’inaccompli présent : Dans ce cas, l’action est en cours d'accomplissement. Les
verbes conjugués se distinguent par les préfixes. Comme exemple, la conjugaison du
verbe بتك « écrire » au masculin singulier donne بتكي yaKTuBu, « il écrit » et avec le
féminin singulier donne بتكت taKTuBu, « elle écrit ».
- L’inaccompli futur : Dans ce cas, l’action se déroulera au futur et elle est marquée par
l'antéposition de س sa ou فوس sawfa au verbe. En ajoutant l'antéposition س sa à notre
exemple, on obtient بتكيس sayaKTuBu , « il écrira » et en ajoutant l'antéposition فوس
sawfa, on obtient فوس بتكي sawfa yaKTubu « il va écrire ».
2.3.2 Le nom
En arabe, le nom se divise en deux catégories, ceux qui sont dérivés d’une racine
verbale et ceux qui ne le sont pas, tel est le cas des noms propres, des noms étrangers...
La déclinaison des noms obéit à plusieurs règles :
- Le féminin singulier : dans la plupart des cas, on ajoute la lettre ة t pour obtenir le nom
au féminin singulier (exemple : ريغص « petit » devient ةريغص « petite »).
- Le féminin pluriel : généralement, on rajoute les deux lettres تا (exemple : لماع «
Chapitre 3 : Langue arabe et les difficultés de sa traitement
35
- Le masculin pluriel : généralement, on rajoute les deux lettres نو ou les deux lettres ني
qui dépendent de la position du mot dans la phrase (sujet ou complément d’objet).
Exemple : مّلعم « enseignant » devient نيمّلعم ou نومّلعم « enseignants ».
- Le pluriel irrégulier : c’est le cas le plus complexe en arabe, pour transformer un mot
au pluriel, on doit insérer des lettres au début, au milieu ou à la fin du mot, (exemple :
لفق « serrure » devient لافقأ « serrures »).
Le problème du pluriel irrégulier dans l'arabe pose un défi à la morphologie, non
seulement à cause de sa nature non concaténative, mais aussi parce que son analyse dépend de
la structure de chaque mot (Kiraz, 1996) comme pour les verbes irréguliers.
2.3.3 Les particules
En arabe, les particules sont principalement les mots outils de la langue, comme les
conjonctions de coordination et de subordination. Elles ont un rôle très important dans
l’interprétation de la phrase (Kadri & Benyamina, 1992). Les particules sont classées selon
leur fonction dans la phrase, on en distingue plusieurs types (introduction, explication,
conséquence). Elles jouent un rôle important dans l’interprétation de la phrase. Elles sont
utilisées dans la phrase pour situer des faits ou des objets par rapport au temps ou au lieu ;
elles jouent, également, un rôle clé dans l'enchaînement et la cohérence d'un texte.
Par exemple, on trouve des particules temporelles ou spatiales qui désignent :
- Un temps ذنم (pendant), لبق (avant), دعب (après).
- Un lieu : ثيح (où).
On trouve aussi des particules qui peuvent exprimer des pronoms relatifs (la
détermination avec une valeur référentielle), par exemple : نيذّللا « ceux », يذّللا « ce », يتّللا
« cette ».
De même façon que les noms et verbes arabes, certaines particules peuvent également
avoir des préfixes et suffixes ce qui rajoute une complexité quant à leur identification.
2.3.4 Les préfixes
En arabe, les préfixes présentent les morphèmes correspondant aux lettres qui se
situent en début de mot. Ils servent à indiquer la personne de la conjugaison des verbes. Le
tableau suivant illustre les préfixes verbaux les plus fréquents en arabe.
36
Lettre Rôleأ Indique la première personne au singulier (je) ن Indique la première personne au pluriel (nous)
ت Indique la deuxième personne féminine, masculine, singulière et duelle
ي Indique la troisième personne masculine au singulier, duel, pluriel, masculin et féminin pluriel.
Tableau 4 : Liste des préfixes verbaux les plus fréquents en arabe
2.3.5 Les suffixes
En arabe, les suffixes présentent essentiellement les terminaisons des conjugaisons
verbales, ainsi que les marques du pluriel et du féminin pour les noms. On ne trouve jamais
une combinaison entre deux suffixes. Le tableau suivant illustre les suffixes les plus fréquents
en arabe.
ا ة ني ةي مه هت هو تا
ه هي كت نه مت نا او
ي ةي ان اه مك يت نو
Tableau 5: Liste des suffixes les plus fréquents en arabe
2.3.6 Les proclitiques
A la différence des préfixes et suffixes, les proclitiques se combinent entre eux pour
donner des informations pertinentes sur le mot arabe (coordination, détermination, traits
sémantiques…). Selon (Abbes, 2004), dans le cas des verbes, les proclitiques dépendent
exclusivement de l’aspect verbal. Ils comprennent donc tous les pronoms et par conséquent,
ils sont compatibles avec tous les préfixes pris par l’aspect. Dans le cas des noms, le
proclitique dépend du mode et du cas de déclinaison.
Les proclitiques peuvent exprimer la coordination en utilisant les coordonnants ف « f »
et ن « w », l’interrogation en utilisant la lettre أ « hamza », le futur avec la marque س « s ».
Chapitre 3 : Langue arabe et les difficultés de sa traitement
37
Il n’est pas toujours facile de faire la différence entre les proclitiques et les lettres de la
racine. Par exemple, la lettre س « s » dans le verbe رفا « il a voyagé » est une lettre de la س
racine, par contre dans le mot بهذيس « il va partir » c’est un proclitique (il marque le futur).
2.3.7 Les enclitiques
De la même manière que les proclitiques, les enclitiques se combinent entre eux pour
donner une post-base composée. On les trouve toujours attachés à la fin du mot pour produire
des pronoms qui s’attachent au verbe (complément d’objet direct), au nom et à la préposition
(complément d’objet indirect).
Voici quelques exemples d’enclitiques :
- ي « Y » : ينطعأ « il m’a donné».
- امه « homA » امهاطعأ« il les a donnés ».
- مه « hom » مهاطعأ « ils l’ont donné ».
2.3.8 Les pré-bases
Les pré-bases en arabe sont obtenues par la concaténation des proclitiques et des
préfixes. On peut générer d’une manière automatique les pré-bases en utilisant la liste des
proclitiques et des préfixes. Dans la langue arabe, il y a 192 concaténations possibles. Le
tableau suivant montre un exemple de pré-bases :
Pré-base Préfixe Proclitique تسأ (asata) ت (ta) سأ (asa) تس (sata) ت (ta) س (sa) تفأ (afata) ت (ta) فأ (afa) تسف (fasata) ت (ta) سف (fasa)
Tableau 6 : Exemple de pré-bases
2.3.9 Les post-bases
Les post-bases en arabe sont obtenues par la concaténation des enclitiques et des
suffixes. Théoriquement, il y a 233 concaténations possibles qui peuvent se lier après la base.
38
Selon (Abbes, 2004) les compatibilités dépendent des pronoms décrits par chacune des
particules. Le tableau suivant montre un exemple de post-bases :
Pré-base Suffixe Enclitique
مهو(wahom) و(wa) م (hom) ه
يننو(wanany) ين(nY) نو(wan)
مكّنأ(Annakom) ّنأ(Anna) مك(kom)
مهّنأ(Annahom) ّنأ(Anna) مه(hom)