• Aucun résultat trouvé

CHAPITRE I : INTRODUCTION

N/A
N/A
Protected

Academic year: 2022

Partager "CHAPITRE I : INTRODUCTION"

Copied!
3
0
0

Texte intégral

(1)

6

CHAPITRE I : INTRODUCTION

1.1 Q U ' EST CE QUE LA TALN ?

L'objectif du traitement automatique du langage naturel (TALN) est la conception de logiciels, capables de traiter de façon automatique des données linguistiques, c’est-à-dire des données exprimées dans une langue (dite "naturelle"). Ces données linguistiques peuvent être des textes écrits, ou bien des dialogues écrits ou oraux, ou encore des unités linguistiques de taille inférieure à ce que l’on appelle habituellement des textes (par exemple : des phrases, des énoncés, des groupes de mots ou simplement des mots isolés).

1.2 D OMAINES D APPLICATION DU TALN ?

Parmi les diverses applications possibles, on peut citer principalement :

− La traduction automatique.

− Le résumé automatique des textes.

− La réalisation d’interface en langue naturelle.

− L’indexation automatique de documents.

− L’enseignement assisté par ordinateur.

− Serveurs vocaux

− Correction lexicale et syntaxique

− Outils d’aide à la rédaction

− Dictée vocale

− … etc.

1.3 L ES NIVEAUX DE TRAITEMENT :

Pour traiter le langage naturel, on a besoin d’informations coordonnées et pertinentes sur la langue à des niveaux divers. Le plus souvent on a recours à cinq niveaux de connaissances sur une langue:

phonologique, morpho-lexical, syntaxique, sémantique et pragmatique. Ces niveaux se superposent, chacun apportant des problèmes spécifiques à résoudre relatif à un niveau donné. Cela nous donne la hiérarchie suivante :

(2)

Introduction au TALN

Mourad LOUKAM

7

pragmatique sémantique syntaxique Morpho-lexical

phonologique

Le niveau phonologique : La machine doit reconnaître les signaux acoustiques (domaine de la phonétique) et les identifier en tant que mots.

Exemple : « Vincent mit l’âne dans un pré ou vingt cent mille ânes dans un pré».

Plus précisément, il s’agit de reconnaître dans le flot sonore les unités acoustiques élémentaires (phonèmes). La difficulté est que la forme acoustique d’un phonème varie selon plusieurs facteurs : le sexe, l’âge, la région, la fatigue, la peur, l’intensité de la parole, etc…

Le niveau morpho-lexical : il concerne l’étude de la formation des mots et de leur variation de formes.

Exemple : « Aujourd’hui, parce qu’il a acheté un micro, Paul a payé la T.V.A ».

Le niveau syntaxique : il s’intéresse à l’agencement des mots et à leurs relations structurelles.

Exemple : « Le boucher sale la tranche ».

Le niveau sémantique : se consacre au sens des énoncés.

Exemple : « Elle a mangé du poisson avec des amis ».

Le niveau pragmatique : prend en compte le contexte d’énonciation.

Exemple : « La mousse aux fraises est sur la table de l’avocat ».

1.4 L' ANALYSE VS LA GENERATION :

En fonction des objectifs attendus d'un système de TALN, on peut le classer dans l'un des domaines suivants : analyse et génération.

Le processus d'analyse consiste à démarrer de la structure de surface (locution ou texte écrit) pour arriver à la structure profonde équivalente.

Le processus de génération est le processus inverse : il consiste à passer de la structure profonde à la structure de surface.

(3)

8

Figure 1.2 Analyse-Génération

Remarque : il est possible qu'une application de TALN appartienne en même temps aux deux domaines : analyse et génération; c'est le cas par exemple d'une application de traduction automatique.

1.5 L E PROBLEME CENTRAL DU TALN : L ' AMBIGUÏTE .

Parmi les problèmes les plus importants du traitement des langues naturelles, on trouve en premier rang le problème de l’ambiguïté (on dit qu'il y a ambiguïté lorsqu'il y a plus d'une interprétation pour une structure linguistique donnée). En effet, l'être humain parlant d’une langue donnée, passe à côté de la plupart des ambiguïtés, puisqu'il est très doué en la manière de les résoudre : il utilise ses connaissances qu'il a accumulées à propos du monde et du contexte. Mais, malheureusement, les machines ne sont pas encore aussi compétentes. Les applications du TALN sont souvent confrontées aux ambiguïtés à tous les niveaux d'analyse.

Exemple :

Le secrétaire vole des livres

Cette phrase comporte cinq mots ambigus, comme le montre le tableau suivant :

Mot Sens

01 Le Article ou pronom

02 Secrétaire Homme, meuble, oiseau 03 Voler Planer, dérober

04 Des Article contracté ou article partitif 05 Livre Bouquin, monnaie, poids

Elle correspond donc à 108 possibilités. Le programme d’analyse devra lever ces ambiguïtés de diverses façons complémentaires, en considérant des règles morphologiques, syntaxiques, sémantiques, … etc.

Structure profonde

Structure de surface Structure de surface

analyse génération

Références

Documents relatifs

Exercice 1 (2.5 pts) : Expliquez pourquoi l’affirmation suivante est fausse : « L’étape morpho-lexicale a pour but d’isoler les mots constituant la phrase à analyser ». Réponse :

Expliquer brièvement pourquoi les grammaires formelles sont inadaptées pour le langage naturel. La correction et les résultats seront publiés sur le site

Les grammaires formelles sont inadaptées pour le langage naturel car elles ne peuvent pas rendre compte toute la complexité du langage (phénomène d’accord,

Donnez un exemple d’ambiguïté qui peut être levée au niveau syntaxique (trouver votre propre exemple, et ne pas présenter l’exemple vu en cours).. Expliquer pourquoi la

La notion de « mot » est problématique en TALN car en réalité le mot ne représente pas l’unité de base pour l’analyse : au niveau d’un mot on retrouve des éléments plus

Expliquez pourquoi les grammaires formelles sont insuffisantes pour modéliser le langage naturel. La correction et les résultats seront publiés sur le site

Réponse : Les grammaires formelles ne sont pas outillée pour endre compte de phénomènes, même simples, du langage naturel. Exemple l’accord : comment générer : Il est parti/Elle

Expliquez brièvement pourquoi les grammaires formelles sont inadaptées pour modéliser le langage naturel. Exercice 4 (03