• Aucun résultat trouvé

Les recherches morpho-syntaxiques de l'arabe pour la TA

Chapitre 5. Règles morphologiques pour le transfert de l'anglais vers

1. Les recherches morpho-syntaxiques de l'arabe pour la TA

Dans cette section on présente quelques exemples de travaux effectués sur l'analyse morphologique et l'analyse syntaxique de la langue arabe pour la traduction automatique, pu- bliés de 2010 à 2013.

Bouzit et al. [93] présentent une contribution en vue de développer un système de tra- duction de l'arabe vers n'importe quelle autre langue en utilisant des méthodes purement lin- guistiques.

Ch. 5 Règles morphologiques pour le transfert de l'anglais vers l'arabe 101. Bies et al. [94] décrivent les ressources linguistiques notamment les plus adaptées avec

la traduction automatique pour l'arabe. Ces ressources ont été publiées par The Linguistic Da- ta Consortium, LDC.

Les travaux de Habash [95] étudient l'effet de prétraitement des différents niveaux du mot arabe sur la qualité de la TA statistique à base de phrase.

Zbib et al. [96] décrivent l'application de deux techniques de prétraitement de la tra- duction statistique de l'anglais vers l'arabe : la segmentation morphologique et le ré- ordonnancement syntaxique. Ces techniques peuvent être adaptées pour les appliquer à la tra- duction vers l'arabe en fournissant des améliorations signifiantes pour les systèmes à base de phrase.

Le travail de Violetta et al. [97] décrit comment l'information morphologique est utili- sée dans les approches à base d'exemples pour la traduction de l'arabe vers l'anglais pour pro- duire des améliorations signifiantes dans la qualité de la traduction que ce soit pour de petits ou de gros corpus.

Le travail de Zbib et al. [98] présente plusieurs techniques pour intégrer des informa- tions à partir des systèmes de traduction à base de règles à des systèmes de traduction statis- tique. Ces informations sont regroupées en trois niveaux (morphologique, lexical, système), le travail montre comment des informations spécifiques à une langue obtenues à partir des mé- thodes à base de règles peuvent améliorer la traduction statistique qui est souvent indépen- dante de la langue.

Marton et al. [99] explorent la contribution des caractéristiques lexicales et morpholo- giques pour l'analyse de dépendance de l'arabe. Le travail montre que les traits fonctionnels de genre et de nombre et le trait humain sont plus utiles dans l'analyse que les méthodes basées sur la forme de genre et de nombre.

Arwa et al. [100] ont proposé une approche de transfert en utilisant l'analyse morpho- logique pour induire à une symétrie morphologique et syntaxique qui a pour objectif d'amélio- rer la TA entre l'arabe et l'anglais.

Dans le travail d'El Kholy et al. [101],les auteurs étudient l'effet de la segmentation morphologique et la normalisation orthographique sur la traduction statistique vers la langue arabe. Les résultats montrent que la meilleure segmentation est celle de Penn Arabic Treebank.

Dans le travail de Hasan [102], les auteurs ont examinés les différentes méthodologies de la segmentation dans la langue arabe pour la traduction statistique par une comparaison

Ch. 5 Règles morphologiques pour le transfert de l'anglais vers l'arabe 102. entre la segmentation dans la traduction à base de règles et les segmentations dans la traduc-

tion statistique.

Alkuhlani et al. [103] présentent une version enrichie de Penn Arabic Treebank où les caractéristiques nécessaires pour la modélisation d'accord morpho-syntaxique en arabe sont annotées manuellement. Ainsi, ils présentent une analyse quantitative du phénomène morpho- syntaxique de l'arabe.

Hassan [104] a réalisé une extension de la traduction statistique à base de phrase avec des descriptions lexicales syntaxiques qui localisent l'information globale syntaxique dans le mot sans introduire l'ambigüité syntaxique redondante.

Le travail de Shaalan et al. [105] utilise les techniques d'apprentissage automatique supervisé pour induire les règles de transfert de l'arabe à l'anglais à partir des ressources lin- guistiques parallèlement alignées. Les règles de transfert structurel assurent le passage d'une structure syntaxique de l'arabe vers une structure syntaxique de l'anglais. Ainsi l'induction des règles morphologiques pour assurer l'apprentissage des règles morphologiques de l'arabe.

Alawneh et al. [106] présentent une approche de traduction des phrases structurées de l'anglais vers l'arabe en utilisant les méthodes basées sur la grammaire et les techniques de traduction à base d'exemples pour résoudre les problèmes d'accord et d'ordonnancement.

Abu Shquier et al. [107] ont étudié les problèmes d'accord et d'ordonnancement dans les systèmes de TA. Ils exposent une approche à base de règles pour la traduction des phrases en anglais bien structurées vers des phrases en arabe structurés.

Le travail de Bisazza et al. [108] propose une méthode de segmentation pour le ré- ordonnancement pour déplacer le verbe de la première position dans la langue arabe vers la deuxième position en anglais. La méthode est utilisée pour le prétraitement des données d'ap- prentissage pour avoir des informations statistiques sur le mouvement du verbe. Les résultats montrent des améliorations au niveau de l'ordonnancement ainsi dans la qualité de traduction.

Le travail de Carpuat et al. [109] étudie les défis d'ordre du verbe arabe et de son sujet dans la traduction statistique. Les auteurs proposent une nouvelle méthode pour intégrer les informations de verbe et de son sujet dans la traduction statistique.

Marton et al. [110] intègrent à un modèle de traduction issu des textes parallèles ali- gnés des informations syntaxiques de la langue source. Les résultats montrent des améliora- tions importantes dans la performance pour la traduction de l'arabe vers l'anglais.

Alawneh et al. [111] présentent une approche de traduction des phrases en anglais bien structurées vers des phrases en arabe bien structurées aussi en utilisant les techniques à base

Ch. 5 Règles morphologiques pour le transfert de l'anglais vers l'arabe 103. de grammaires et les techniques à base d'exemples pour traiter les problèmes d'accord et de

ré-ordonnancement. Cette technique est hybride car elle combine les techniques de traduction à base de règles et les techniques à base d'exemples.

Ture et al. [112] comparent les modèles de traduction linéaires et hiérarchiques à base de phrase pour la traduction des requêtes. Les deux méthodes donnent de meilleurs résultats par rapport aux méthodes à base de jetons ou à base d'une traduction référence.

Documents relatifs