• Aucun résultat trouvé

2.3. Lexique

2.3.2. Unités lexicales

Parmi les diverses définitions du mot en vietnamien, les linguistes sont parvenus à un accord et

considèrent comme un mot la plus petite unité ayant un sens spécifié et une structure stable, et utilisée

pour composer des constituants de phrase. Une grande partie des mots vietnamiens sont des mots

simples repérés exactement comme des morphèmes et des syllabes morphologiquement invariables.

Mais il existe également un nombre important de mots composés dont nous présentons ici la structure.

La structure d’un mot est décrite en se basant sur le nombre de syllabes (pour distinguer des mots

mono- ou multi-syllabiques), et la manière dont sont composés les mots complexes (pour déterminer

leurs éléments et la relation entre ces éléments).

Le dictionnaire vietnamien contient donc :

1. Des mots simples ou mots monosyllabiques correspondant aux catégories 1 et 2 de « tiếng ».

Nous considérons également comme mots simples quelques mots multi-syllabiques soit

empruntés à des langues étrangères, soit composés de syllabes dont le sens n’est pas

reconnaissable.

Exemples :

nhà = maison, cửa = porte, bàn = table, ghế/ chaise, cười = rire, nói

= parler, hát = chanter, đi = aller

bồ câu = pigeon, bù nhìn = épouvantail, ễnh ương = kaloula (espèce de

crapaud),…

Il convient d’apporter une attention particulière aux « tiếng » sino-vietnamiens, parce que

certains d’entre eux ont été tout à fait vietnamisés (par exemple : tuổi = âge, buồm = voile,

đầu = tête), alors que d’autres ne peuvent être qu’élément d’un mot composé (par exemple :

nhân = personne, humain ne peut se situer que dans des mots composés comme nhân tài

= homme de talent,nhân lực = main-d’œuvre,nhân loại = genre humain …).

Il existe également des syllabes d’origine vietnamienne qui étaient autrefois des mots

simples mais ne peuvent en vietnamien moderne être employées seules (par exemple trốc =

tête, tác = âge…).

2. Des mots complexes qui ont plus d’une syllabe. Ce sont des mots redoublés et des mots

composés sémantiquement.

a. Mots redoublés : Les mots redoublés sont construits par combinaison phonique,

généralement de deux syllabes. On entend par combinaison phonique, un phénomène

de répétition et de symétrie. La répétition peut être totale ou (plus fréquemment)

partielle, et on distingue ainsi des mots répétés totalement ou partiellement.

Les mots redoublés totalement sont généralement des mots décrivant le son, par

exemple : oe oe dans la phrase Em bé khóc oe oe =

litt

enfant

pleurer [le son] = Le nouveau-né vagit. On trouve aussi dans cette catégorie

des noms d’animaux ou de plantes, par exemple cu cu = coucou, chôm chôm =

ramboutan.

Les mots redoublés partiellement sont créés par la répétition partielle des syllabes

suivant certaines règles de combinaison phonique :

ƒ Quand le premier son (cf. 2.2) est redoublé, il est possible de constater une

combinaison phonique modifiant par un mécanisme dit de « symétrie » une

partie de la syllabe, qui peut être :

• le son noyau : nhúc nhích = pincer légèrement les lèvres ;

• le dernier son : chằm chp = fixement ;

• le son intercalé (répétés) : xunh xoàng = simplement (en parlant

d’une tenue vestimentaire) ;

• le ton : may mắn = chanceux ;

ƒ Il est également possible de redoubler la rime et le ton, alors que les premiers

sons sont symétriques dans le système phonique du vietnamien : lí nhí =

très petit, càu nhàu = grommeler.

Parmi les mots de cette catégorie, nous pouvons distinguer une classe de mots dont

aucune des deux syllabes n’a de sens (par exemple : trục trặc = détraqué, en

panne), et une classe de mots dont une syllabe a un sens qui se trouve spécialisé par

la répétition (par exemple : nhỏ = petit => nhỏ nhắn / nhỏ nhoi = menu,

mignon / minime, modique).

b. Mots composés : Ces mots sont composés à partir des syllabes en suivant une

combinaison sémantique. On distingue deux classes de mots composés, en fonction de

la composition sémantique des syllabes composantes.

La première classe contient les mots dits composés parallèles (ou composés

copulatifs), dont la composition représente une coordination sémantique des syllabes.

Chaque composant a son propre sens et joue un rôle égal, et l’ordre des mots est donc

généralement variable (à l’exception de quelques mots composés dont une ou toutes

les syllabes sont d’origine chinoise, pour lesquels l’ordre des syllabes est fixe). Par

exemple :

quần = pantalon, áo = chemise => quần áo / áo quần = vêtement

giang = rivière, sơn = montagne

19

=> giang sơn = pays natal

Pour les mots composés de deux syllabes, il existe habituellement une symétrie

entre ces syllabes et leur sens devient symbolique. Par exemple :

vuông = carré, tròn = rond => vuông tròn = à souhait

cười = rire, cợt = taquiner => cười cợt = rigoler, badiner.

La deuxième classe constitue des mots dits composés majeur/mineur, dont la

composition manifeste une subordination sémantique de normalement deux

composants. Un composant jouant le rôle de majeur porte un sens général, et l’autre

composant jouant le rôle de mineur limite le domaine du majeur. Dans ce cas, l’ordre

des éléments est important, habituellement majeur-mineur. Par exemple :

nhà = maison, khách = invité, tù = prisonnier => nhà khách =

maison de réception ; nhà tù = prison.

làm = faire, việc = travail, giàu = riche => làm việc = travailler ;

làm giàu = s’enrichir.

nhanh = rapide, tay = main, ý = idée, pensée, esprit => nhanh tay =

se dépêcher ; nhanh ý = avoir la présence d’esprit.

Pour les composés dont les composants sont d’origine chinoise, l’ordre devient

mineur-majeur. Par exemple :

quốc = national, kì = drapeau, ca = chanson

20

=> quốc kì = drapeau

national, quốc ca = hymne national.

Le mot jouant le rôle majeur peut porter un sens généralisé ou symbolique. Par

exemple :

chân = pied, trời = ciel, vịt = canard => chân trời = horizon,

chân vịt = hélice (de bateau).

Pour les adjectifs, le mot jouant le rôle mineur indique l’intensité de la

qualification. Par exemple :

đen = noir => đen sì = trop noir; đen ngòm = très sombre, très

obscur.

3. Enfin, des expressions figées et des locutions, qui sont généralement aussi considérées

comme des unités lexicales.

La Figure 2-1 synthétise les différentes formes de mots du vietnamien.

Figure 2-1 Formes des mots en vietnamien

Cette complexité des formes des mots vietnamiens constitue une difficulté majeure pour la tâche de

segmentation automatique des textes en unités lexicales. Ce sujet est concrètement discuté à la section

3.4.3.

Avant de nous concentrer sur le sujet de la grammaire vietnamienne, nous émettons encore

quelques remarques importantes concernant l’emprunt par le vietnamien de mots étrangers.