• Aucun résultat trouvé

Les catalogues de jouets comme corpus

Macro-structure du catalogue de jouets

PHOTOGRAPHIENOM JOUET

1.3. Les catalogues de jouets comme corpus

Parmi la cinquantaine de catalogues de jouets rassemblés pour cette étude, quatre constitueront le corpus proprement dit. Nous préciserons maintenant comment cette notion de corpus est envisagée en nous basant sur les différents travaux dans le domaine de la linguistique « de corpus ».

1.3.1. Spécificités du corpus

Si l’on considère que tout texte relève d’un discours, avec des conditions de production et une situation de communication qui lui sont spécifiques (Charaudeau 1995 ; Cornish 2006a), on peut tenir pour acquise la corrélation entre la situation de communication (les paramètres situationnels) et les formes linguistiques. D’où la constitution du corpus à partir des paramètres situationnels ou de critères externes, même si ces éléments de caractérisation sont qualifiés d’éléments a priori (Habert 2000). Dans un tableau qui s’inspire très succinctement des paramètres situationnels de Biber (1988 ; 1995)11, figurent les spécificités des corpus. Même si nous faisons appel à des outils et méthodes dont l’objet d’étude est traditionnellement le texte, rappelons que notre corpus est constitué par l’ensemble du catalogue aussi bien la partie textuelle (nom de jouet, nom de marque, texte) que les photographies.

corpus Caractéristiques des corpus La Grande Récré

Leclerc Eveil & Jeux

Toys "Я" Us

code/support écrit/publié écrit/publié écrit/publié écrit/Web

statut social public public public public

destinateur grande surface spécialiste grande surface non spécialiste V.P.C. spécialiste grande surface spécialiste destinataire Enfant + adulte

non spécialiste Enfant + adulte non spécialiste Enfant + adulte non spécialiste Enfant + adulte non spécialiste

thématique jouet jouet jouet jouet

fonction du texte prescriptive informative prescriptive informative prescriptive informative prescriptive informative nb de mots12 10 800 7 500 20 500 243 500

Tableau 2 – Paramètres situationnels

11 Huit catégories de critères extralinguistiques : canal (écrit, parlé, écrit lu), format (publié, non publié), cadre (institutionnel, public, privé-interpersonnel), destinataire (pluralité ou non, présence ou non, interaction, connaissances partagées), destinateur (caractéristiques, statut), factualité (informatif-factuel, intermédiaire, imaginaire), visée discursive (persuader, amuser, édifier,

Par le canal, ou code, on distingue les productions écrites des productions parlées. Le format oppose support publié (format papier) et support Web (site internet).

Le statut social est déterminé par le fait que les documents circulent soit dans un cercle restreint (privé) soit dans la sphère publique (public). Les quatre corpus partagent une sphère de diffusion large : distribution dans les boîtes aux lettres (plusieurs millions de catalogues sont diffusés chaque année) pour les uns ; consultation libre sur internet pour Toys "Я" Us.

Le destinateur représente l’entité émettrice : on distingue dans le domaine du jouet les spécialistes des non spécialistes et au plan du type de distribution les grandes surfaces de la V.P.C. (vente par correspondance). Qui rédige les catalogues ? Une petite enquête téléphonique nous a permis de réunir un certain nombre d’informations. Le catalogue est élaboré soit par une agence de publicité indépendante soit, et c'est le cas le plus fréquent, par la centrale d’achat ou le service marketing du magasin. Le texte descriptif est rédigé par une ou plusieurs personnes qui s'inspirent du texte figurant sur le catalogue du fournisseur ou bien de l’emballage du jouet. Parfois le texte est restitué tel quel, parfois il est retravaillé. Chez Leclerc (ou Carrefour), on utilise systématiquement les textes des fournisseurs (sauf pour les produits d’importation où ce seront des « phrases maison »). A La Grande Récré (ou chez Joué Club), le texte fournisseur est systématiquement retravaillé. Il peut être difficile de juger si telle tournure récurrente relève d’un scripteur particulier ou est une particularité du genre

catalogue.

Le destinataire est le consommateur, non spécialiste du domaine : l’enfant, mis en avant, et l’adulte au second plan (parfois c’est l’inverse). On verra plus loin que le destinataire n’est pas clairement défini, que sa prise en compte par le destinateur oscille entre individualité et pluralité.

La fonction du texte est à la fois informative et prescriptive. Le texte est à dominante descriptive, il s’agit d’informer le lecteur sur les caractéristiques du jouet ; sa visée est également prescriptive puisqu’il s’agit de faire acheter les produits présentés.

1.3.2. Choix et préparation des données

Le choix des catalogues s’est fait sur trois critères afin d’obtenir un facteur de variation : critère du support ou médium (trois catalogues sur support papier, un catalogue sur support Web), critère de l’appartenance de l’entité

émettrice/destinateur à la catégorie spécialiste/non spécialiste, critère du lieu de vente de l’entité émettrice (grande surface/V.P.C), époque de l’offre (Noël/été).

D’un point de vue méthodologique, les deux catalogues à texte court – ceux qui présentent un module canonique – nous servent généralement de base de départ pour l’analyse. La possibilité d’une exploitation « manuelle » de ces corpus nous permet de repérer des fonctionnements linguistiques. Les structures linguistiques mises au jour sont ensuite recherchées sur les autres corpus et les éventuelles variations interprétées en fonction des variantes affectant les paramètres situationnels (cf. tableau 2).

En ce qui concerne la préparation des données, les textes Leclerc et La

Grande Récré ont été saisis manuellement. Le catalogue Eveil & Jeux a pu être copié automatiquement13 et le catalogue Web a été « aspiré14 ».

Un formulaire de saisie a été créé sur la base ACCESS qui permet, outre la saisie du texte, d’identifier le catalogue source, la catégorie du jouet (bébé, garçon, fille…), le nom du jouet (qui est aussi le « titre » du module), les indications périphériques au texte (âge, taille) ou particulières (piles), la marque du jouet et des éléments comme la couleur de la typographie (cf. formulaire en annexe 11). Pour le catalogue Eveil & Jeux, le formulaire a dû être adapté car le catalogue est construit de manière différente : tantôt les titres sont de vrais titres, tantôt le nom du jouet en tient lieu.

1.3.3. Le corpus comme lieu d’identification de fonctionnements

possibles

La question des corpus suscite de nombreuses réflexions. Les moyens informatiques sans cesse perfectionnés ont permis d’extraire, de stocker et d’exploiter un nombre de plus en plus important de données textuelles. La problématique des corpus est centrale dans la communauté TAL. Dans son article

Des corpus représentatifs de quoi, pour quoi, comment ? Habert (2000 : 333) propose une réflexion sur l’utilisation des corpus et un état des lieux, après l’ouvrage de 1997 Les linguistiques de corpus. Il y pose très clairement la diversité des approches possibles. La Revue française de Linguistique Appliquée présentait dans son numéro de 1996 « Corpus. De leur constitution à leur exploitation » à la fois des corpus existants, des travaux sur corpus et une réflexion plus large sur l’utilisation des corpus en linguistique notamment avec l’article de Blanche-Benveniste (1996). La même revue s’interroge encore une

13 Je remercie Ludovic Tanguy d’avoir opéré cette copie.

fois dans son premier numéro de 2007 « Corpus : état des lieux et perspectives » sur les problèmes liés à la constitution des corpus écrits et oraux et à leur utilisation à des fins diverses. La revue Corpus, créée en 2001, s’intéresse à la linguistique de corpus sous ses aspects théorique, épistémologique, méthodologique ainsi qu’à des applications sur des domaines linguistiques variés. Plus récemment un ouvrage regroupe différents linguistes sur la problématique « sémantique et corpus » (Condamines 2005a). Des colloques sont également consacrés à la question et donnent lieu à des publications (entre autres, Bilger 2000 ; Williams 2005).

Le corpus est constitué en vue d’une étude particulière : ici, il s’agit d’analyser des productions langagières situées. C’est parce qu’il est posé comme objet d’étude, parce qu’il présente une utilisation de la langue dans un contexte (au sens large) particulier, que le catalogue devient un corpus. L’analyse fait apparaître certaines régularités, d’ordre micro- ou macrostructurel, morphologique, syntaxique…, qu’il est intéressant de confronter à des éléments qui ont déjà été étudiés voire modélisés ailleurs (dans les textes descriptifs, par exemple). La comparaison tient une place importante et permet d’affiner la description.

Si l’on considère le corpus comme « une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques explicites pour servir d’échantillon du langage » (Habert & al. 1997 : 11), les quatre corpus étudiés, même s’ils partagent certains traits entre eux et avec d’autres productions du même type, constituent-ils un « échantillon du langage » ? En d’autres termes sont-ils représentatifs ?

Les quatre catalogues constituant le corpus d’étude ne sont-ils que de simples « carottes » prélevées pour un sondage ? Eu égard au travail de dépouillement effectué comme préalable à la constitution définitive du corpus, on peut les considérer comme représentant une pratique langagière située relativement stable. Si l’on reprend la distinction que fait Habert (2000) entre corpus éphémères (pour les productions collectées sur le Web, par exemple) et corpus persistants, on peut leur attribuer le qualificatif de persistant.

Une fois justifiée la constitution des corpus, vient la question de la généralisation des résultats. Ici, l’ambition est mesurée : l’objectif se veut descriptif. C’est le catalogue de jouets qui sera décrit mais il n’est pas certain que les résultats obtenus soient généralisables au-delà du domaine du jouet.

Le travail d’analyse se fait en partant des données du corpus – de manière ascendante – de façon à mettre en évidence des fonctionnements linguistiques réguliers. Il s’agit « de systématiser ce passage des usages en corpus vers la

délimitation de sens et, plus généralement, de fonctionnements linguistiques » (Condamines 1999 : 103).