• Aucun résultat trouvé

5 L’argumentation champ d’étude de l’éthos

1. La lexicométrie 1 Historique

1.4 Les principes et les concepts de base de la lexicométrie

Pour mener une analyse lexicometrique convenable, il est nécessaire de connaitre les concepts de base de cette méthode qui constituent ses principes et ses conditions, nous allons les énumérer en nous référant à l’analyse de Claudine Ambomo (2013 : 72, 73, 74, 75, 76) :

La partition du corpus : pour le comptage et la comparaison des unités lexicocmériques86 , on a besoin de répartir le corpus en partie selon les prises de parole de chaque participant au débat ; nous avons 10 parties (10 candidats).

L’occurrence est l’apparition d’une unité lexicométrique dans le corpus. Chaque forme graphique est répertoriée selon ses occurrences. Ainsi, la forme grammaticale «je » a 345 occurrences dans le corpus des débats « controverse » avec une fréquence de 345. La forme graphique « président » a une fréquence de 68. Par conséquent, la taille d’un corpus et de ses parties est exprimée en nombre d’occurrences.

Notre corpus compte 5525 de formes graphiques dont la fréquence entre 1 et 1200, ce qui donne à notre corpus la taille de 32706 occurrences. Aussi l’une des parties de notre corpus, celle de LH, compte 2244 formes graphiques avec une fréquence maximale (Fmax) de 340 pour la forme graphique « de », une forme qui représente une fréquence maximale dans les autres parties aussi. Cependant une seule partie, celle de MB, possède une forme graphique différente « je » avec la fréquence maximale de 41. Cela est démontré dans la figure des principales caractéristiques lexicométriques de notre corpus :

86Une forme graphique, un lemme (mot ramené à sa racine), une partie du discours, un segment répété, un groupe de formes (- Ibid., p72)

Figure 8 : les principales caractéristiques

Les formes graphiques les plus fréquentes sont celles qui représentent une fréquence maximale. D’une manière générale, la forme « de » est la plus fréquente dans tous les débats (220, 959, 305, 899,846, 1330, 281, 237, 528) sauf dans le débat avec Morad Boukhelifa, où le « je » est l’unité lexicometrique la plus fréquente avec 325 occurrences.

Les mots outils sont les mots les plus fréquents (déterminants, pronoms, conjonctions). Les formes lexicales sont toujours listées après les mots outils, ce sont les verbes, adjectifs et les noms. Dans le dictionnaire (liste des formes graphiques), la première forme lexicale citée c’est « pays » qui marque157 occurrences et se situe au 37ème rang.

Le nombre de formes par rapport au nombre des occurrences peut nous renseigner sur la variété de son vocabulaire. Les sous corpus n’ont pas la même taille. Donc, cela indique que le nombre des occurrences n’est pas identique et par conséquent la variété du lexique ne sera pas la même. Dans les sous corpus de notre corpus, certains débats ont une richesse lexicale d’autres se caractérisent par la variété des formes grammaticales. Aussi, certains sont marqués par une fréquence maximale du pronom personnel « je » d’autres du pronom« nous » d’autres encore du pronom« on ».

Les unités lexicométriques sont aussi attestées en fonction de leur ventilation (leur distribution) dans les différentes parties du corpus. Ainsi, se forme une suite de sous fréquences qui correspondent à la fréquence de l’unité lexicométrique dans chaque partie du corpus. Ces sous fréquences sont comptabilisées, puis comparées. Pour cela il faut une certaine opération de calcul qui visent à donner un diagnostic de spécificité, reposant sur quatre paramètres : T (la taille du corpus), t (la taille de la partie), F (la fréquence totale de l’unité ou du trait linguistique considéré), f (la sous fréquence de l’unité ou du trait linguistique considéré).

Cette opération va permettre de découvrir si l’unité est sous représentée dans la partie du corpus par rapport à sa fréquence dans le corpus, c’est-à-dire que sa fréquence réelle est inférieure à sa fréquence théorique (spécificité négative). Ou surreprésentée, quand sa fréquence

réelle est supérieure à sa fréquence théorique (spécificité positive). Ou représentée de façon homogène dans la partie du corpus, c'est-à-dire sa sous fréquence dans la partie est attendu compte tenu de sa fréquence dans le corpus (banalité). Voilà la procédure qui nous permet d’avoir les spécificités positives et négatives pour la partie ABO (Ali Benouari) :

Figure 9: les spécificités positives d’ABO

Cela est complété par les partitions (graphes) qui permettront de comparer les spécificités dans toutes les parties du corpus. Celui-ci est découpé en 10 parties selon le discours de chaque participant au débat (LH, MB, TM, RN, ABY, LB, AS, ABO, SDJ, AHM). Par exemple, La forme graphique « pays » avec une fréquence de 157 sur l’ensemble du corpus, se trouve utilisée à quelques exceptions dans les parties du corpus. Elle représente une spécificité positive chez Abdelmalek Sellal et une spécificité négative chez Louiza Hanoun, et une banalité chez les autres invités, comme le montre la ventilation suivante :

Figure 10 : Graphique de ventilation des spécificités de l’unité lexicale « pays »

En effet, «Pays » est une forme lexicale sur-utilisée par Abdelmalek Sellal et sous – utilisée par Louiza Hanoun. Donc, le but des calculs des occurrences est de comparer les spécificités dans toutes les parties du corpus. Ainsi, selon Claudine Ambomo nous pouvons distinguer une forme pôle et ses cooccurrences spécifiques quand celle-ci est sur-utilisée et nous pouvons distinguer une forme pôle et ses répulsions spécifiques lorsque celle-ci est sous-utilisée (2013 : p 77)

Enfin un concept de base qui représente l’un des principes fondamentaux de la lexicométrie, l’analyse factorielle. C’est une méthode multidimensionnelle fondée sur le principe de l’algorithme, dont la complexité nous pousse à hésiter via son utilisation dans notre analyse ; voilà un exemple donné avec cette analyse factorielle :

Nous arrivons ainsi à dire que les concepts de bas de la lexicométrie sont superficiellement décrits dans les paragraphes ci-dessus, d’autres principes ne sont pas bien détaillés. Mais du moins, nous avons pu rassembler les connaissances suffisantes pour mener une analyse objective et bien déterminée.