• Aucun résultat trouvé

L’ANALYSE DU CONTENU

Dans le document Initiation aux méthodes des sciences sociales (Page 185-200)

L’enquête documentaire

II. L’ANALYSE DES DOCUMENTS

2. L’ANALYSE DU CONTENU

Retour à la table des matières

On peut distinguer deux types de techniques d’analyse du contenu des documents : les techniques que l’on peut qualifier de "classiques"

- et d’autre part les techniques dites "scientifiques", "modernes" ou

"quantitatives"

a) L’analyse classique du contenu

Cette méthode est en fait la plus utilisée. Elle doit beaucoup à la pratique des historiens et des critiques littéraires. C’est la méthode traditionnelle que l’on emploie pour faire habituellement l’analyse puis le commentaire d’un texte. Celle dont l’on use soi-même sponta-nément lorsque on essaie de dégager la signification d’une correspon-dance ou d’un article de presse.

[127]

• On peut dire d’abord que l’analyse classique est qualitative : elle ne procède à aucune quantification. Son souci est de rechercher la si-gnification du document, aussi bien la sisi-gnification évidente que la signification implicite. Elle s’oppose par là aux techniques modernes à base quantitative, à base de dénombrement. Elle repose souvent sur un fondement rationnel. Pour dégager la signification du texte, on se ré-fère alors au sens des mots employés et à la structure logique du do-cument étudié. On essaie de déceler les lignes directrices du docu-ment, d’en découvrir les idées fondamentales et leur articulation. On distinguera ainsi les idées principales et les idées secondaires du texte, non en fonction de leur répétition, mais en fonction de leur place dans l’architecture d’ensemble du document, en fonction de la dynamique interne de celui-ci. C’est donc à partir de l’agencement logique du texte que sera déterminée sa signification après une analyse raisonnée de celui-ci par le chercheur. Ainsi, une idée pourra, par exemple, n’apparaître qu’une seule fois, à la fin d’un texte, et pourtant être considérée comme la plus révélatrice de la signification de ce texte, parce que toute la construction logique antérieure du document aura été agencée pour amener la formulation finale de cette idée.

• Ce type d’analyse fait aussi souvent une place à l’appréciation in-tuitive du chercheur, reposant sur la prise en compte d’éléments plus impondérables encore. Supposons, dit un auteur, que l’on se propose d’évaluer le respect que témoigne à son auditoire un conférencier ré-puté. Une analyse quantitative consistera à dénombrer les louanges et

les blâmes et à interpréter la différence entre ces deux chiffres. En re-vanche, l’analyse qualitative prendra en considération la manière de présenter ces louanges et ces blâmes. Un mélange savamment dosé d’approbation et de critique, comportant des critiques nuancées adres-sées à d’hypothétiques publics analogues, indiquera que le conféren-cier traite son auditoire avec déférence. Au contraire, une brusque et fréquente alternance de compliments épais et d’âpres reproches signi-fiera un mépris peu voilé. Ce sont là des nuances difficiles à saisir que l’analyse qualitative peut permettre d’évaluer et que l’analyse quanti-tative laisserait échapper.

• Ce qui fait l’intérêt de l’analyse classique en fait aussi la faibles-se. La finesse et la profondeur de l’analyse classique se paient par des risques de subjectivité, dans la mesure où sa valeur dépend en grande partie de la sûreté de jugement de celui qui procède à l’analyse. La distinction de ce qui est important et de ce qui est se-condaire, de l’essentiel et de l’accessoire, donne lieu à des jugements de la part de l’observateur avec le risque que ceux-ci soient influencés par sa subjectivité. On peut donc adresser deux critiques principales à cette analyse classique du contenu qui, encore une fois, dans la prati-que, est la plus utilisée. Elle comporte des risques d’erreur en raison du coefficient de subjectivité que l’on vient de signaler. Elle rend d’autre part difficile l’organisation de travaux de recherche en équipe, du fait que la validité de [128] ses résultats est tributaire des qualités personnelles du chercheur qui la met en œuvre et que donc la fidélité de cette approche est faible.

b) l’analyse quantitative du contenu

Il faut d’abord signaler ici que, lorsque l’on parle "d’analyse de contenu", sans autre précision, il arrive souvent que l’on désigne par là ce que l’on appelle ici "analyse quantitative du contenu".

Cette technique prétend aboutir à des analyses objectives par le re-cours à la quantification. Il s’agit toujours d’interpréter les docu-ments, mais on espère arriver grâce à cette technique à une analyse objective, indépendante de la personnalité de l’analyste et de ses

ju-gements. Cette méthode a, de ce fait, l’avantage de permettre le travail en équipe. Le principe fondamental de cette technique consiste à étu-dier le document en dénombrant les différents éléments qui le consti-tuent, en les classant, en chiffrant leur fréquence, leur répétition Et ce sont les résultats chiffrés de ce dénombrement qui sont ensuite inter-prétés. Si cette analyse est plus objective que l’analyse classique, ses résultats sont aussi souvent plus superficiels.

Cette technique d’analyse quantitative du contenu a été particuliè-rement mise au point durant la seconde guerre mondiale. Elle fut ainsi utilisée par H. Lasswell pour étudier dans quelle mesure diverses pu-blications américaines, suspectes aux yeux de la justice, pouvaient être considérées comme des instruments de la propagande allemande.

Pour cette recherche, Lasswell procéda à une analyse du contenu de ces publications à partir d’un recensement des thèmes traités. Il prit pour point de départ de son étude une analyse de la propagande radio-phonique allemande distinguant dans celle-ci seize thèmes principaux.

L’enquête proprement dite consista ensuite à comparer ces thèmes avec les thèmes développés dans les articles des journaux incriminés.

Ainsi, dans un procès, celui du Galilean, l’analyse porta sur 157 arti-cles parus entre décembre 41 et mars 42 : elle fit ressortir 1195 concordances des thèmes de ces articles avec ceux de la propagande allemande contre seulement 45 contradictions, comme le montre le tableau ci-après :

Accord ou contradiction du Galiléan avec la propagande nazie

Accord Désaccord 1. Les États-Unis sont intérieurement corrompus 279 26 2. La politique étrangère des Etats-Unis est

morale-ment injustifiable

39 0

3. Le Président des États-Unis est critiquable 70 0 4. La Grande-Bretagne est intérieurement corrompue 28 0 5. La politique de la Grande-Bretagne est moralement

injustifiable

23 0

6. Le Premier Ministre Churchill est critiquable 16 0 7. L’Allemagne nazie est juste et vertueuse 12 2 8. La politique étrangère du Japon est moralement

justifiable

14. Les États-Unis et le monde sont menacés par les communistes

43 0

15. Les États-Unis et le monde sont menacés par les juifs

112 0

16. Les États-Unis et le monde sont menacés par les ploutocrates

1 0

[129]

Après la guerre, ce procédé a été codifié par Bernard Berelson et l’on peut, dans le processus de l’analyse du contenu, distinguer deux phases : tout d’abord, la quantification du document, c’est-à-dire la transformation de celui-ci en données chiffrées, ensuite, l’analyse sta-tistique de ces données.

1o) La quantification des documents

Avant l’étape de la quantification des documents, l’analyse du contenu comporte un certain nombre d’opérations préparatoires.

Cette préparation consiste d’abord à déterminer l’objectif de l’enquête. En effet en général, l’analyse est faite en fonction d’un but déterminé : étudier l’orientation politique d’un journal, analyser les opinions d’un homme politique à travers ses discours, etc. Il est rare qu’une analyse quantitative de documents soit entreprise sans avoir un objectif précis. La seconde étape consiste ensuite, en fonction de l’objectif de la recherche, à préciser l’univers de l’enquête, c’est-à-dire à préciser et à recenser les documents sur lesquels doit porter la recherche. Cette opération peut s’accompagner d’une troisième, l’échantillonnage. En effet, s’il est des cas où l’on dépouillera la tota-lité des documents constituant l’univers de l’enquête, il en est d’autres - lorsque la masse des documents est trop volumineuse et lorsqu’on pense qu’elle présente une certaine homogénéité - où on se limitera à dépouiller une fraction de cet univers et à extrapoler les résultats ob-tenus. L’échantillon est alors la partie de l’univers qui sera effective-ment analysée. Cet échantillon doit être choisi de façon à être repré-sentatif de l’univers en employant les procédés utilisés pour la cons-truction des échantillons dans les sondages d’opinion : soit le système du modèle réduit, soit la méthode probabiliste (par exemple par tirage au sort : on dépouillera un journal sur 10 ou sur 20..).

• Ces opérations préalables effectuées, interviendra la quantifica-tion proprement dite, qui suppose un choix au niveau de la détermina-tion des unités de quantificadétermina-tion et au niveau de l’établissement des catégories d’analyse. L’unité de quantification est le fragment de contenu que l’on prend en considération pour effectuer le dénombre-ment. Par exemple, si l’on étudie le contenu d’un journal en décomp-tant le nombre d’articles consacrés à la politique, aux variétés, aux faits divers, au sport, etc. : l’article constitue l’unité de quantification de cette recherche. La variété des unités de quantification possibles est

très grande et le choix entre celles-ci dépendra d’une part de la nature des documents analysés et, d’autre part, des objectifs de la recherche.

Dans certains cas, l’unité choisie pourra être le mot. Des sociolo-gues américains ont ainsi étudié, avec le mot comme unité de quanti-fication, le contenu des slogans du ler mai en Union Soviétique de 1917 à 1953, en recensant les mots-clés et en les classant en deux ca-tégories : symboles révolutionnaires (ex. : révolution, prolétariat parti, [130] etc.), symboles nationaux (ex. : patrie, pays, frontière, sécurité, etc.). Cette analyse a montré que la fréquence des mots de la deuxiè-me catégorie a augdeuxiè-menté de façon assez régulière à partir de 1933, avec un maximum dans la période 1940-42, et ceci au détriment des mots classés dans la première catégorie.

Dans de nombreuses analyses le type de catégorie retenu est le thème, en entendant par là un groupe de mots, de phrases, ou d’images se rapportant à un sujet précis et ayant une signification uni-que. D’un point de vue pratique, l’utilisation de ce type d’unité de quantification peut présenter des difficultés. Assez souvent en effet un même groupe de mots peut comporter plusieurs thèmes et de ce fait le découpage des documents en thèmes distincts peut s’avérer une opéra-tion délicate et un peu artificielle. Dans d’autres cas, on pourra choisir des unités de quantification matérielles. Ainsi, dans l’exemple précé-dent, en prenant pour unité l’article dans une analyse de presse. Mais il en est d’autres : le nombre de lignes, le nombre de pages, le nombre de colonnes, le nombre de centimètres-carré. S’il s’agit d’une com-munication orale ce pourra être aussi le nombre de minutes ou le nombre de secondes, etc. Ainsi dans cette étude de presse américaine l’unité qui a été choisie est la longueur des colonnes calculée en pou-ces :

1910 1920 1930 1940

Col. Prop. Col. Prop. Col. Prop. Col. Prop.

Nouvelles de l’étranger 2,4 0,001 6,2 0,099 6,9 0,049 14 0,079

Éditoriaux 3.0 0,009 2,8 0,040 3,0 0,021 3,1 0,019

Sports 7,1 0,094 10,4 0,146 19,2 0,129 10,9 0,119

Programme radio 0,9 0,010 2,0 0,029 2,5 0,019 2,5 0,014

Humour - dessins 4,0 0,054 4,0 0,057 5,1 0,006 10,9 0,061

Illustrations 0,5 0,060 19,9 0,112

• Après avoir choisi l’unité de quantification intervient la détermi-nation des catégories d’analyse. Il s’agit là de l’opération la plus dé-licate et la plus déterminante pour la validité et l’intérêt des résultats de la recherche. Elle consiste à déterminer les classifications, les ru-briques dans lesquelles le contenu des documents, décomposé en uni-tés de quantification, sera réparti. Ainsi, dans l’exemple ci-dessus, le contenu des journaux étudiés, décomposé en "pouces colonnes" est classé selon la matière traitée : nouvelles de l’étranger, éditoriaux, sports, illustrations, etc. Ces différentes rubriques constituent les caté-gories d’analyse. Ces catécaté-gories peuvent être, elles aussi, d’une très grande diversité, et de multiples solutions sont possibles selon les do-cuments étudiés, selon les buts de la recherche.

Pour certaines études, comme dans notre exemple, on se référera à des catégories de matière permettant le recensement des sujets abor-dés dans le document. Ainsi, en 1960, dans une analyse des réactions de la presse au voyage en France du chef de l’URSS, Nikita Khrout-chev, Violette Morin classait les thèmes développés en six grandes catégories [131] matérielles 47

47 V. Morin, L’écriture de presse, Paris, PUF, 1969.

: le voyage (itinéraire, accueil, etc.), les anecdotes (gastronomie, cadeaux, etc.), les personnages (Khroutchev, De Gaulle), l’entourage (Nina, les journalistes, etc.), les problèmes politiques (le désarmement, les syndicats français, etc.), les rapports France-URSS. (les affinités naturelles, l’histoire, etc.). On peut aussi utiliser des catégories de forme en se référant à la manière dont les

sujets abordés sont traités. J.M. Cotteret et R. Moreau, dans une étude sur le vocabulaire du Général de Gaulle, ont, par exemple, classé les discours de celui-ci en "discours-bilan", où domine l’emploi du

"Nous", et en "discours-programme", où domine l’emploi du "je" 48. Ces catégories peuvent être encore des catégories d’opinion, établies en fonction des jugements émis dans les documents, en tenant compte de l’orientation de ces jugements (ex. : favorable/ défavorable, etc.) ou de l’intensité de l’opinion émise. Dans d’autres cas ces catégories peuvent être des catégories de valeur, suivant les valeurs auxquelles se réfèrent le document : justice sociale, patriotisme, pacifisme, etc.

comme dans l’exemple de l’étude portant sur les slogans du Premier Mai en URSS (nationalisme /révolution). Encore une fois, il ne s’agit là que de quelques exemples.

• Le choix de ces catégories dépendra essentiellement de la nature des documents et de l’objectif de la recherche. Pour le choix de ces catégories, diverses recommandations ont cependant été formulées afin d’assurer la validité des résultats :

- les catégories doivent être pertinentes, c’est-à-dire déterminées en fonction des buts de la recherche. Ce choix est évidemment étroi-tement lié aux questions que l’on se pose sur les documents étudiés.

En général, on recommande de procéder à un survol préalable des do-cuments, ce qui permettra de discerner les catégories les plus adéqua-tes aux texadéqua-tes que l’on veut analyser.

- les catégories d’analyse doivent être exhaustives : elles doivent permettre de quantifier l’ensemble des éléments contenus dans le texte en rapport avec le but de la recherche, sans laisser échapper aucun élément significatif. Il y a ici deux dangers à éviter : soit la multiplica-tion des catégories qui, sous prétexte de précision, enlèverait de sa simplicité à la technique d’analyse ; soit une catégorisation trop ap-proximative qui laisserait de côté des éléments importants.

- les catégories choisies doivent être exclusives : elles doivent être construites de telle façon qu’un même élément ne puisse être classé

48 Recherche sur le vocabulaire du Général de Gaulle, Paris, PUF, 1969.

dans deux catégories différentes. Les frontières de chaque catégorie doivent être nettes et ne laisser place à aucune ambiguïté.

- les catégories doivent être fidèles : elles doivent être formulées assez clairement pour que plusieurs analystes opérant séparément sur le [132] même document en utilisant cette échelle de catégories par-viennent au même résultat, en classant les mêmes éléments dans les mêmes catégories.

- les catégories doivent être valides : elles doivent traduire la réali-té du document étudié. Cela est souvent difficile en raison de l’incertitude qui règne en sciences sociales et en science politique sur la définition des concepts utilisés (ex. : les notions de socialisme, de fascisme, de démocratie ... ).

2o) L’analyse statistique

Lorsque les documents ont été ainsi décomposés en données chif-frées, l’observateur sera amené à analyser ces données pour en tirer des significations. Cette analyse peut s’orienter dans des directions diverses et l’on évoquera seulement ici quelques-unes de ces direc-tions.

Une première direction est constituée par ce que l’on appelle la sémantique quantitative ou l’analyse lexicographique. C’est un type de recherche qui s’intéresse en priorité à l’analyse du vocabulaire, du style, des modes d’expression utilisés dans les documents qui font l’objet de l’étude. Il s’agit de recherches dans lesquelles les unités de quantification utilisées sont souvent des unités grammaticales (mots, phrases, etc.) et les catégories des catégories de forme. On pourra par exemple établir un lexique des mots utilisés par un auteur, un homme politique, un parti. On étudiera aussi la longueur des mots, celle des phrases, leur rythme, leur construction. On pourra ainsi arriver à une véritable photographie du style d’une œuvre, d’un mode de communi-cation et la comparer avec d’autres œuvres, d’autres types de commu-nication.

On peut ici citer par exemple l’étude portant sur les "54774 mots"

de la confrontation télévisée de V. Giscard d’Estaing et de F. Mitte-rand lors de la campagne électorale des élections présidentielles de 1974.

Rang Mot Nombre Rang Mot Nombre

1 France 117 1 Français 63

2 République 55 2 France 52

3 Française 53 3 Monsieur 41

4 Français 52 4 Politique 35

5 Président 50 5 Giscard d’Est. 27

Société 50 6 Vie 26

7 Politique 46 7 Travail 25

8 Travail 43 8 Prix 24

9 Campagne 42 9 Temps 23

Monsieur 42 Hommes 23

11 Problème 37 11 Nombre 22

Travailleurs 37 12 Président 21

13 Choix 35 13 Pays 20

Monde 35 Mois 20

15 Vie 33 14 Question 19

16 Sociale 30 Monde 19

17 Présidentielle 29 16 République 18

18 Changement 28 Milliards 18

Pays 28 Gauche 18

20 Choses 27 Forces 18

Giscard d’Estaing Mitterand

[133]

Cette étude montre ainsi qu’en moyenne V. Giscard d’Estaing a parlé plus rapidement que son adversaire (148,7 mots à la minute contre 129,4), mais qu’en revanche la longueur des phrases est à peu près analogue (30 mots en moyenne), tandis que le vocabulaire de F.

Mitterand a été le plus riche (2725 mots différents pour 17140 mots prononces, contre 2450 mots différents pour 19250 mots utilisés par V. Giscard d’Estaing). De même, il est possible de comparer le conte-nu du vocabulaire des deux candidats, comme dans le tableau

ci-dessus, et d’en tirer des enseignements pour analyser leur programme ou leur stratégie.

• Une seconde direction est celle de l’analyse de fréquence. Bien que certaines recherches de sémantique quantitative puissent compor-ter des décomptes de fréquence, cette orientation doit être distinguée de la procédure précédente. Jusqu’aux alentours des années 50 c’était d’ailleurs le seul instrument de mesure utilisé en analyse du contenu.

Le principe est simple : il consiste à décompter la fréquence des unités de quantification classées dans chaque catégorie d’analyse et à inter-préter les chiffres ainsi obtenus. D’utilisation très facile, l’analyse de fréquence permet des mesures d’intensité et d’importance, en assimi-lant fréquence et importance (ou intensité). Elle sert donc à hiérarchi-ser les unités, les thèmes, les catégories, isolés dans un système de messages. Son principe pose le problème de la validité de l’association fréquence-importance.

On trouvera ci-dessous un exemple d’analyse de ce type appliquée à trois discours de Maurice Thorez, qui permet de constater une crois-sance des thèmes légalistes (démocratie, république, etc.) et une dimi-nution des thèmes révolutionnaires (bourgeoisie, révolution, marxis-me, capitalisme) lorsque le P.C est associé à la gestion gouvernemen-tale en 1937 et surtout en 1945 49

49 Analyse faite par P. Gaborit. Citée par G. Lavau, in Le communisme en France, Paris, Co-lin, 1969.

:

Janvier 1936 VIIIe congrès

Décembre 1937 IXe congrès

Juin 1945 Xe congrès 1. PROBLEMES DE L’UNITÉ

Unité d’action 16 13 2

Front unique 18 3 1

Unité (union, unir) 9 26 38

2. RÉFÉRENCES AU MARXISME

Marx(isme), marxisme-léninisme 30 18 8

Lénine(isme) 30 20 2

Staline(isme) 19 10 7

3. PROBLÈMES DE RÉGIME

Bourgeoisie (gde) 21 3 1

Capitalisme, (régime) 32 24 4

Trusts, monopoles 4 2 39

Nationalisations 0 2 21

Bolchevik (isme) 11 10 0

Prolétariat 31 24 1

Dictature du prolétariat 5 1 0

Révolution (naire) 23 27 13

République (républicain) 15 14 28

Démocrate (démocrate) 10 57 67

[134]

Une autre direction de recherche d’apparition plus récente est l’analyse associative, mise au point notamment par le psychologue Charles Osggood. Elle consiste, non plus à recenser des éléments iso-lés dans les documents, mais à rechercher les relations qu’ils entre-tiennent entre eux, en appliquant les techniques statistiques du calcul de coefficients d’association ou de corrélation. Ainsi, supposons qu’une analyse de fréquence ait indiqué comme thèmes majeurs d’un magazine féminin : le bonheur, l’amour, le bien être, la sécurité, la

jeunesse, la beauté, le standing, la santé 50. L’analyse associative per-mettra de déterminer comment ces divers thèmes sont organisés entre eux en relevant systématiquement le nombre de fois ou ces thèmes

jeunesse, la beauté, le standing, la santé 50. L’analyse associative per-mettra de déterminer comment ces divers thèmes sont organisés entre eux en relevant systématiquement le nombre de fois ou ces thèmes

Dans le document Initiation aux méthodes des sciences sociales (Page 185-200)