2.3. Lexique
2.3.2. Unités lexicales
Parmi les diverses définitions du mot en vietnamien, les linguistes sont parvenus à un accord et
considèrent comme un mot la plus petite unité ayant un sens spécifié et une structure stable, et utilisée
pour composer des constituants de phrase. Une grande partie des mots vietnamiens sont des mots
simples repérés exactement comme des morphèmes et des syllabes morphologiquement invariables.
Mais il existe également un nombre important de mots composés dont nous présentons ici la structure.
La structure d’un mot est décrite en se basant sur le nombre de syllabes (pour distinguer des mots
mono- ou multi-syllabiques), et la manière dont sont composés les mots complexes (pour déterminer
leurs éléments et la relation entre ces éléments).
Le dictionnaire vietnamien contient donc :
1. Des mots simples ou mots monosyllabiques correspondant aux catégories 1 et 2 de « tiếng ».
Nous considérons également comme mots simples quelques mots multi-syllabiques soit
empruntés à des langues étrangères, soit composés de syllabes dont le sens n’est pas
reconnaissable.
Exemples :
nhà = maison, cửa = porte, bàn = table, ghế/ chaise, cười = rire, nói
= parler, hát = chanter, đi = aller…
bồ câu = pigeon, bù nhìn = épouvantail, ễnh ương = kaloula (espèce de
crapaud),…
Il convient d’apporter une attention particulière aux « tiếng » sino-vietnamiens, parce que
certains d’entre eux ont été tout à fait vietnamisés (par exemple : tuổi = âge, buồm = voile,
đầu = tête), alors que d’autres ne peuvent être qu’élément d’un mot composé (par exemple :
nhân = personne, humain ne peut se situer que dans des mots composés comme nhân tài
= homme de talent,nhân lực = main-d’œuvre,nhân loại = genre humain …).
Il existe également des syllabes d’origine vietnamienne qui étaient autrefois des mots
simples mais ne peuvent en vietnamien moderne être employées seules (par exemple trốc =
tête, tác = âge…).
2. Des mots complexes qui ont plus d’une syllabe. Ce sont des mots redoublés et des mots
composés sémantiquement.
a. Mots redoublés : Les mots redoublés sont construits par combinaison phonique,
généralement de deux syllabes. On entend par combinaison phonique, un phénomène
de répétition et de symétrie. La répétition peut être totale ou (plus fréquemment)
partielle, et on distingue ainsi des mots répétés totalement ou partiellement.
Les mots redoublés totalement sont généralement des mots décrivant le son, par
exemple : oe oe dans la phrase Em bé khóc oe oe =
littenfant
pleurer [le son] = Le nouveau-né vagit. On trouve aussi dans cette catégorie
des noms d’animaux ou de plantes, par exemple cu cu = coucou, chôm chôm =
ramboutan.
Les mots redoublés partiellement sont créés par la répétition partielle des syllabes
suivant certaines règles de combinaison phonique :
Quand le premier son (cf. 2.2) est redoublé, il est possible de constater une
combinaison phonique modifiant par un mécanisme dit de « symétrie » une
partie de la syllabe, qui peut être :
• le son noyau : nhúc nhích = pincer légèrement les lèvres ;
• le dernier son : chằm chặp = fixement ;
• le son intercalé (répétés) : xuềnh xoàng = simplement (en parlant
d’une tenue vestimentaire) ;
• le ton : may mắn = chanceux ;
Il est également possible de redoubler la rime et le ton, alors que les premiers
sons sont symétriques dans le système phonique du vietnamien : lí nhí =
très petit, càu nhàu = grommeler.
Parmi les mots de cette catégorie, nous pouvons distinguer une classe de mots dont
aucune des deux syllabes n’a de sens (par exemple : trục trặc = détraqué, en
panne), et une classe de mots dont une syllabe a un sens qui se trouve spécialisé par
la répétition (par exemple : nhỏ = petit => nhỏ nhắn / nhỏ nhoi = menu,
mignon / minime, modique).
b. Mots composés : Ces mots sont composés à partir des syllabes en suivant une
combinaison sémantique. On distingue deux classes de mots composés, en fonction de
la composition sémantique des syllabes composantes.
La première classe contient les mots dits composés parallèles (ou composés
copulatifs), dont la composition représente une coordination sémantique des syllabes.
Chaque composant a son propre sens et joue un rôle égal, et l’ordre des mots est donc
généralement variable (à l’exception de quelques mots composés dont une ou toutes
les syllabes sont d’origine chinoise, pour lesquels l’ordre des syllabes est fixe). Par
exemple :
quần = pantalon, áo = chemise => quần áo / áo quần = vêtement
giang = rivière, sơn = montagne
19=> giang sơn = pays natal
Pour les mots composés de deux syllabes, il existe habituellement une symétrie
entre ces syllabes et leur sens devient symbolique. Par exemple :
vuông = carré, tròn = rond => vuông tròn = à souhait
cười = rire, cợt = taquiner => cười cợt = rigoler, badiner.
La deuxième classe constitue des mots dits composés majeur/mineur, dont la
composition manifeste une subordination sémantique de normalement deux
composants. Un composant jouant le rôle de majeur porte un sens général, et l’autre
composant jouant le rôle de mineur limite le domaine du majeur. Dans ce cas, l’ordre
des éléments est important, habituellement majeur-mineur. Par exemple :
nhà = maison, khách = invité, tù = prisonnier => nhà khách =
maison de réception ; nhà tù = prison.
làm = faire, việc = travail, giàu = riche => làm việc = travailler ;
làm giàu = s’enrichir.
nhanh = rapide, tay = main, ý = idée, pensée, esprit => nhanh tay =
se dépêcher ; nhanh ý = avoir la présence d’esprit.
Pour les composés dont les composants sont d’origine chinoise, l’ordre devient
mineur-majeur. Par exemple :
quốc = national, kì = drapeau, ca = chanson
20=> quốc kì = drapeau
national, quốc ca = hymne national.
Le mot jouant le rôle majeur peut porter un sens généralisé ou symbolique. Par
exemple :
chân = pied, trời = ciel, vịt = canard => chân trời = horizon,
chân vịt = hélice (de bateau).
Pour les adjectifs, le mot jouant le rôle mineur indique l’intensité de la
qualification. Par exemple :
đen = noir => đen sì = trop noir; đen ngòm = très sombre, très
obscur.
3. Enfin, des expressions figées et des locutions, qui sont généralement aussi considérées
comme des unités lexicales.
La Figure 2-1 synthétise les différentes formes de mots du vietnamien.
Figure 2-1 Formes des mots en vietnamien
Cette complexité des formes des mots vietnamiens constitue une difficulté majeure pour la tâche de
segmentation automatique des textes en unités lexicales. Ce sujet est concrètement discuté à la section
3.4.3.
Avant de nous concentrer sur le sujet de la grammaire vietnamienne, nous émettons encore
quelques remarques importantes concernant l’emprunt par le vietnamien de mots étrangers.
Dans le document
Outils et ressources linguistiques pour l'alignement de textes multilingues français-vietnamiens
(Page 58-61)