• Aucun résultat trouvé

Les lacunes et les limites des plates-formes d’ouvrages numérisés29

2. Méthodologie

2.5. L’exploitation des données numérisées pour un travail de recherche en

2.5.5. Les lacunes et les limites des plates-formes d’ouvrages numérisés29

faut alors approfondir ses recherches en utilisant d’autres bases de données ou systèmes d’archivages en ligne. Dans de nombreux cas, Internet Archive et sa base de données Open library permettent d’avoir accès à un ouvrage étranger que l’on ne peut trouver que partiellement numérisé sur Google, Livres. Cependant, il est incontestable que la vérification textuelle ne peut être remplacée. Ainsi dans tous les cas troubles, nous avons vérifié les données directement dans les ouvrages.

2.5.5. Les lacunes et les limites des plates-formes d’ouvrages numérisés

S’il est indéniable que les plates-formes d’ouvrages numérisés sont un outil formidable pour l’étymologiste, ce dernier doit se montrer tout de même vigilant face aux données proposées. Les recherches peuvent se faire en recoupant les informations trouvées sur les plates-formes d’ouvrages numérisés avec des recherches faites sur l’auteur et sur l’ouvrage proposé. Rien ne remplace la confrontation des ouvrages numérisés avec les originaux, essentiellement lorsqu’il n’y a qu’un extrait proposé et non pas l’ouvrage numérisé en entier.

L’une des erreurs les plus fréquemment rencontrée avec les plates-formes d’ouvrages numérisés est celle concernant les datations proposées. Nous avons consulté la notice étymologique phonétique du TLF-Étym (cf. Michelini 2009 in TLF-Étym s.v. phonétique), qui propose 1801 comme première attestation de l’adjectif. En cherchant à antédater le lexème français par sa correspondance anglaise, nous avons alors lancé une recherche sur JSTOR en sélectionnant le critère sélectif des datations dans le champ consacré, associé au critère linguistique. Une partie des résultats de recherche sur phonetic dans des textes compris entre 1750 et 1805 sont les suivants, dont voici une copie d’écran :

30

Recherche d’ouvrages contenant phonetic, entre 1750 et 1805 à l’aide de JSTOR :

L’une des propositions faite par JSTOR est l’article « Scientific reasons for the study of the Bushman language » rédigé par Wilhelm Heinrich Immanuel Bleek (Bleek 1873). S’il est en effet possible de relever une occurrence de l’adjectif phonetic dans cet article, un élément va contredire la possibilité que cet article date de 1800, comme JSTOR le présente. En effet, l’auteur de cet article, Wilhelm Heinrich Immanuel Bleek, est né en 1827, contredisant ainsi la possibilité qu’il ait pu rédiger un article en 1800. Nous avons alors entrepris des recherches sur l’article de Bleek et nous avons pu observer qu’il est cité dans la bibliographie de nombreux ouvrages et daté de 1873.

Ce cas n’est pas isolé, et nous avons fréquemment relevé des contradictions chronologiques entre les dates proposées par les plates-formes d’ouvrages numérisés et la réalité. Il y a souvent une confusion entre la date d’un article de revue et la date de la première publication du premier volume de la revue dans lequel l’article est publié.

31

2.6. Vers une micro-étymologie : principes et méthode

Dès le début de notre travail de thèse, nous avons été confrontée à la problématique liée à la représentativité lexicographique de chaque lexème. Nous désirions mettre en exergue la complexité du parcours étymologique des vocables polylexicaux, que la tradition rattache en général à un seul et unique étymon. Nous appliquons toujours la méthode traditionnelle, cependant notre méthode a d’original qu’elle s’applique à un nouvel objet, le lexème et non plus le vocable. Cette méthode consiste à appliquer les principes éprouvés de l’étymologie à un vocable en tenant compte de l’opposition formalisée par la Théorie Sens-Texte entre vocable et lexème. Lexème c'est-à-dire « un mot pris dans une signification bien déterminée et muni de toutes les informations caractérisant le comportement de ce mot justement lorsqu’il a cette signification » et vocable c'est-à-dire « une famille de tous les lexèmes tels que : (i) leurs signifiants sont identiques, (ii) les signifiés de deux lexèmes quelconques sont liés soit directement, soit par intermédiaire d’une chaîne de liens directs » (Mel’čuk/Iordanskaja/Arbatchewsky/Jumarie 1981 : 6 ; Budzinski 2012 : 12 ; Buchi à paraître : 339).Toutefois il n’existe pas à notre connaissance de termes pour désigner ce type spécifique de travail étymologique. Nous risquons le terme micro-étymologie « science qui a pour objet l’origine de chaque lexème d’un vocable afin d’établir avec précision le parcours historique complet de ce dernier ».

Ainsi chaque lexème d’un vocable est étymologisé et, pour davantage de clarté, nous consacrons un article lexicographique indépendant à chaque lexème. De cette manière, le lecteur peut avoir une vision générale du parcours historique d’un vocable tout en observant comment chaque lexème a pu influencer ou non la suite des lexèmes créés. Comme nous venons de le souligner, la micro-étymologie met en avant l’intérêt de faire l’étymologie de chacun des lexèmes d’un vocable et non plus l’étymologie d’un vocable in toto. De cette façon nous pouvons enfin retracer avec exactitude le chemin pris par les lexèmes dans le cadre d’un emprunt. Par ailleurs, dans le cadre d’une création française, nous détaillons le type de formation du lexème.

La méthodologie de la micro-étymologie implique par ailleurs d’étendre les recherches à tous documents afin de reconstruire non plus uniquement les aspects généraux de l’histoire d’un vocable, mais également les aspects particuliers qui font que chaque lexème est une partie d’un tout dans le parcours du vocable.

32

3. Partie lexicographique :