Un matériau produit hors laboratoire - Les spécificités heuristiques d’un nouveau matériau

PREMIÈRE PARTIE : LES AUTOPUBLICATIONS NUMÉRIQUES COMME SOURCE DE RENOUVELLEMENT THÉORIQUE ET

CHAPITRE 1 - LES USAGES COMMERCIAUX ET SCIENTIFIQUES DES AUTOPUBLICATIONS NUMÉRIQUES DES AUTOPUBLICATIONS NUMÉRIQUES

2. Les spécificités heuristiques d’un nouveau matériau d’étude du monde social

2.1. Un matériau produit hors laboratoire

Contrairement aux matériaux empiriques générés par les méthodologies « classiques » des sciences sociales, les autopublications apparaissent comme des données non stimulées, non impactées par l’intervention du chercheur (2.1.1). Mais n’étant précisément pas produites et récoltées en situation de « laboratoire », les conditions sociales et contextuelles de production des autopublications numériques peuvent alors partiellement ou totalement échapper au chercheur (2.1.2). Face à ce manque de données, deux stratégies de recherche peuvent être alors adoptées (2.1.3).

2.1.1. Des verbatims non altérés par la situation d’enquête

Les autopublications présentent en effet la particularité de ne pas être des données produites en situation de laboratoire. Formule empruntée aux « sciences dures », la situation de « laboratoire » représente symboliquement en sciences sociales la phase de production et de collecte de données empiriques, qu’elles soient de nature qualitative (entretiens individuels ou collectifs, observations ethnographiques, etc.) ou quantitative (sondages, recensements, etc.). L’usage de matériaux empiriques en sciences sociales, théorisé dès le dix-neuvième siècle par Émile Durkheim, repose sur la volonté de pratiquer les sciences sociales selon des règles analogues aux sciences de la nature. Cependant, à la différence des sciences dures, les objets des sciences sociales – les hommes en société – sont « des êtres qui pensent, parlent et

font circuler des récits, des êtres qui peuvent s’approprier le discours des scientifiques et modifier leurs comportements en conséquence »⁸⁸. L’adaptabilité des hommes à leur environnement et à la science – dont ils sont à la fois le sujet et l’objet – constitue précisément « le malheur »⁸⁹ des sciences sociales. Les enquêtés peuvent attribuer au chercheur des intentions qui ne sont pas les siennes mais qui vont conditionner leurs réponses, leur manière de parler, ce qu’ils vont choisir de montrer ou au contraire de dissimuler, etc.⁹⁰. Dès lors, tout

88 Michel Grossetti, « Plus largement, les sciences sociales… », SociologieS [En ligne], Débats, La situation actuelle de la sociologie, mis en ligne le 27 janvier 2012, consulté le 14 octobre 2013. URL : http://sociologies.revues.org/3788

Pierre Bourdieu, Jean-Claude Chamboredon et Jean-Claude Passeron, Le métier de sociologue. Préalables épistémologiques, Paris, Éditions de l'EHESS, 1968.

90 Philippe Baumard, « Quelles approches avec quelles données ? » in Marie-Laure Gavard-Perret, David Gotteland, Christophe Haon et Alain Jolibert (dir.), Méthodologie de la recherche en gestion, Paris, Nathan, 1998.

recours au questionnement ou à l’observation produit des effets propres à la situation d’enquête, qui ne se seraient sans doute pas produits dans d’autres situations. Ces effets sont donc des artefacts, c’est-à-dire des purs produits générés par la situation d’enquête. Chaque méthodologie employée par les sciences sociales, qu’elles soit qualitative ou quantitative, produit des artefacts spécifiques. L’objectivation – ou l’absence d’objectivation – de ces biais méthodologiques a donné lieu à des nombreux travaux et controverses académiques.

L’entretien est un exemple d’une situation sociale littéralement extraordinaire, car dissemblable, en raison de son formalisme, des interactions sociales ordinaires. Pour Pierre Bourdieu, la situation d’enquête repose sur une double dissymétrie. La première concerne l’établissement des règles du jeu : « c'est l'enquêteur qui engage le jeu et institue la règle du

jeu; c'est lui qui, le plus souvent, assigne à l'entretien, de manière unilatérale et sans négocia-tion préalable, des objectifs et des usages parfois mal déterminés, au moins pour l'enquêté »⁹¹. Elle se double de plus d’une dissymétrie sociale, lorsque l’enquêteur occupe une position sociale plus élevée que l’enquêté, ou, inversement, lorsque l’enquêteur est dominé⁹². La possession d’un plus grand capital culturel – pouvant se manifester durant l’entretien par un niveau de langue plus élevé de l’enquêteur – peut conduire à une situation de violence symbolique, bridant alors la parole des enquêtés.

Les méthodes quantitatives produisent, elles aussi, des artefacts. Les biais déclaratifs générés par les sondages d’opinion ont donné lieu à une longue controverse scientifique, initiée en France dès les années 1970 par Madeleine Grawitz⁹³ et Pierre Bourdieu⁹⁴. Un des principaux biais des sondages⁹⁵ réside selon ces auteurs dans l’imposition de problématique, à savoir le fait de « mettre en demeure [les enquêtés] de répondre à des questions qu’ils ne se

sont pas posées »⁹⁶. Cette critique émane de la remise en cause d’un des postulats sur lequel repose les sondages d’opinion : « tout le monde n’interprète pas les questions de la même

façon »⁹⁷ et, plus encore, tout le monde n’est pas en mesure d’avoir un avis sur tous les

91 Pierre Bourdieu, La misère du monde, Paris, Seuil, 1993.

92 Monique Pinçon-Charlot, Michel Pinçon, Voyage en grande bourgeoisie, Paris, PUF, 1997.

Madeleine Grawitz, « Les sondages d’opinion publique », Revue des travaux de l’Académie des sciences morales et politiques, 125^ème année, 1^er semestre 1972, p. 99-108.

94 Pierre Bourdieu, « L’opinion publique n’existe pas », Les temps modernes, n°318, 1972, p. 1292-1309. 95 Si ces critiques sont principalement adressées aux sondages d’opinion commerciaux, la proximité voire la confusion structurelle des instituts de sondage et de certains Instituts d’Étude politique, confère, plus ou moins implicitement, aux sondages universitaires, du moins tels qu’ils sont pratiqués par la science politique, les mêmes biais. Cf. Pierre Bourdieu, « Les doxosophes », Minuit, 1972.

96 Pierre Bourdieu, « L’opinion publique n’existe pas », art. cit. 97

sujets⁹⁸. De nombreux travaux américains⁹⁹ et français¹⁰⁰ ont de longue date démontré empiriquement l’inégale distribution sociale de la compétence politique, entendue comme la capacité à maîtriser et manipuler les schèmes de perception, d’évaluation et de classification du champ politique.

Seule la pratique très controversée, et relativement rare, de l’observation ethnographique « clandestine » – ou « incognito » – est à même de produire des matériaux empiriques (dont les enregistrements dissimulés sont l’archétype) non impactés par l’intervention ou l’observation du chercheur, les enquêtés ignorant par définition sa présence. Pour se rendre « invisible », le chercheur peut dissimuler son identité en se présentant à l’enquêté sans mentionner sa profession et ses intentions ou, plus rarement, en ne développant aucune interaction avec l’enquêté¹⁰¹. Ainsi, afin de ne pas troubler le déroulement des interactions observées, le sociologue américain Laud Humphreys, dans son étude des « pissotières », lieu de rencontre homosexuelle anonyme, a dissimulé son identité de chercheur et a adopté une posture de « voyeur », socialement tolérée. Il n’a ainsi noué aucune interaction directe avec les enquêtés. La dissimulation de l’identité du chercheur et la pratique d’enregistrement clandestin posent néanmoins de lourds problèmes déontologiques et éthiques¹⁰² dont il est d’ailleurs intéressant de noter qu’ils se posent aujourd’hui en des termes relativement identiques dans le débat académique sur la politique de recherche à adopter face aux données récoltées sur internet¹⁰³.

À l’instar des enregistrements clandestins, les autopublications numériques constituent un matériau empirique non stimulé par l’intervention du chercheur. Cependant, alors que le recours à l’observation clandestine est souvent légitimé comme relevant d’un choix par défaut, comme étant le seul dispositif d’enquête à même d’étudier des terrains sensibles voire dangereux, l’étude des autopublications numériques permet d’investiguer des objets variés et ne se réduit pas à l’étude de terrains sensibles. Les autopublications offrent ainsi la possibilité

98 Pierre Bourdieu, « L’opinion publique n’existe pas », art. cit.

99 Philip Converse, « The Nature of Mass Beliefs in Mass Publics », in David Apter (dir.), Ideology and Discontent, New York, The Free Press, 1964, p. 206-261 ; John R. Zaller, The Nature and Origins of Mass Opinion, Cambridge, Cambridge University Press, 1992.

100 Daniel Gaxie, Le cens caché. Inégalités culturelles et ségrégation politique, Paris, Édition du Seuil, 1978 ; Pierre Bourdieu, La Distinction, Critique sociale du jugement, Paris, Les Éditions de Minuit, 1979.

101 Laud Humphreys, Le commerce des pissotières. Pratiques homosexuelles anonymes dans l’Amérique des années 1960, Paris, La découverte, 2007.

102 Christophe Dargère, L’observation incognito en sociologie, Notions théoriques, démarche réflexive, approche pratique et exemples concrets, Paris, L’Harmattan, 2012.

103 Pour avoir un aperçu des termes des débats, cf. Guillaume Latzko-Toth et Serge Proulx, « Enjeux éthiques de la recherche sur le Web », in Christine Barats (dir.), Manuel d’analyse du Web, Paris, Arman Colin, 2012.

d’appréhender des objets classiques des sciences sociales à partir d’un matériau empirique inédit et « authentique ».

« Authentique » ne signifie pas que les autopublications sont la manifestation pure et inaltérée d’opinions ou de sentiments « privés » jusqu’alors enfouis dans le for intérieur de leurs auteurs. Nous le verrons, comme cela est le cas avec les discussions politiques hors-ligne¹⁰⁴, les auteurs des autopublications adaptent plus ou moins consciemment le contenu de leur message en fonction des autres individus qui prennent part à la discussion et/ou de leurs lecteurs, mais aussi en fonction des contraintes d’énonciation parfois imposées par les espaces d’autopublication (usage ou non de l’anonymat, publication visible par tous ou par un public restreint et choisi, taille limitée ou non du nombre de caractères, etc.)¹⁰⁵. Qualifier de plus « naturelles » ou de plus « authentiques » les autopublications ne signifie donc pas que leur expression n’est pas contrainte par des dispositifs sociotechniques ou par des normes sociales, mais simplement qu’elle n’est pas altérée par le dispositif d’enquête. Sauf à adopter volontairement une stratégie de recherche « ouverte »¹⁰⁶, les auteurs des autopublications ne peuvent se savoir lus et analysés par des chercheurs.

Les autopublications peuvent donc se prévaloir de ne pas être des données générées artificiellement par une situation d’enquête. Cependant, précisément parce que la production de ces données ne se déroule pas en laboratoire, sous la focale du chercheur, les conditions sociales de production de ces messages et l’identité socio-démographique de leurs auteurs peuvent alors partiellement ou totalement lui échapper.

2.1.2 Des données de seconde main décontextualisées et désincarnées

Les autopublications numériques ne sont pas collectées dans le cadre d’un dispositif d’enquête dont le chercheur maîtrise et contrôle les différents paramètres. Elles ne peuvent donc être considérées comme des données de première main. Les autopublications numériques se distinguent néanmoins des données dites de « seconde main ». Les données de

104 Nina Eliasoph, L'évitement du politique. Comment les Américains produisent l'apathie dans la vie quotidienne, Paris, Economica, 2010 ; Vincent Goulet, Médias et classes populaires. Les usages ordinaires des informations, Paris, INA Édition, 2010.

105 Dominique Boullier et Audrey Lohard. Opinion mining et Sentiment analysis : Méthodes et outils, op. cit. 106 Nous entendons par stratégie « ouverte » le fait de se présenter aux enquêtés « à visage découvert » en leur présentant explicitement les enjeux de la recherche.

seconde main sont des données collectées et traitées par un tiers (chercheurs, journalistes, archivistes, etc.), ou une chaîne de tiers, à partir de « sources primaires ». Ainsi les résultats du recensement de la population par l’INSEE, avant de se présenter sous la forme de tableaux statistiques, ont d’abord été le produit d’interactions sociales entre des enquêteurs et des enquêtés à qui a été administré un questionnaire. Les données de seconde main sont collectées et traitées en fonction de problématiques et d’un cadre théorique qui ne sont pas nécessairement ceux du chercheur qui les mobilise « en seconde main ».

Les autopublications numériques se distinguent donc sur ce point des données de seconde main. Les messages publiés sur internet n’ont pas été collectés, traités et analysés par d’autres chercheurs. Ils se présentent sous la forme de verbatims bruts, publiés directement par leurs auteurs, généralement sans médiation ni intermédiaire. Les messages publiés sur internet s’apparentent donc davantage à des « sources primaires ». Mais comme cela peut être le cas avec des données de seconde main, le chercheur ignore souvent les caractéristiques sociologiques de ces sources.

Les autopublications numériques se présentent en effet au chercheur comme des verbatims décontextualisés et désincarnés. Si l’heure et la date de publication des messages sont des informations facilement disponibles, les motivations et l’identité sociale de leurs auteurs sont en revanche des données qui échappent bien souvent à l’analyse. Alors que dans les enquêtes déclaratives les variables socio-démographiques des enquêtés (âge, sexe, PCS, niveau de diplôme, préférence politique, etc.) sont au centre de l’analyse et permettent de situer socialement les opinions, les attitudes et les comportements (déclarés) des enquêtés, sur internet, ces données ne sont pas systématiquement disponibles.

Sur les forums de discussion, l’anonymat et l’usage de pseudonyme est une pratique majoritaire. Si les effets sociaux de l’anonymat sur la prise de parole en ligne ont donné lieu à de nombreux travaux, concluant souvent à un effet désinhibant voire abréactif¹⁰⁷, une autre conséquence de l’anonymat, peut-être évidente mais assez peu soulignée, réside dans la difficulté à identifier et à qualifier les auteurs des autopublications. La nature du pseudonyme choisie n’est toutefois pas neutre socialement et peut être parfois un indice de caractérisation sociologique. Ainsi, Sylvain Paraisie et Jean-Philippe Cointet, dans une étude statistique et lexicométrique de forums mis en place par un quotidien régional à l’occasion des élections municipales de 2008, ont démontré que la nature des pseudonymes adoptés par les

107

usagers des forums était déterminée par la taille de la commune dans laquelle ils résidaient (le journal avait mis en place un forum propre à chaque commune de la région). Dans les communes de moins de 2 000 habitants les pseudonymes faisaient ainsi majoritairement référence à la localité, par la mention du lieu de résidence (« un vrai gonnehemois ») et/ou d’une fonction, d’un engagement associatif (« un footballeur de St-Souplet ») ou d’une responsabilité locale (« le maire ») tandis que dans les communes de plus de 10 000 habitants les pseudonymes étaient davantage critiques (« il faut changer ») et associés à des références nationales (« socialiste en colère »)¹⁰⁸. Si les pseudonymes peuvent donc dans certaines configurations se révéler être des indices de caractérisation sociologique, ces données sont parcellaires et leur traitement non-systématisable.

Le recours à l’anonymat est en revanche moins développé sur les réseaux sociaux. Facebook et Google+ ont ainsi imposé à leurs utilisateurs de déclarer leur identité légale. Cependant, cette règle est loin d’être totalement respectée¹⁰⁹, l’usage de pseudonyme est encore répandu. De plus, si les réseaux sociaux invitent – et ont un véritable intérêt économique à le faire – les internautes à publier de nombreuses informations sociodémographiques (sexe, âge, ville de résidence, ville de naissance, niveau d’étude et établissements fréquentés, professions, etc.) mais aussi politiques, culturelles ou religieuses, les usagers des réseaux sociaux restent libres de ne pas dévoiler ces informations.

Même sur les réseaux sociaux, où le recours à l’anonymat est moins répandu, les données socio-démographiques et politiques des auteurs des autopublications ne sont disponibles que de façon parcellaire. Face à ce constat empirique, deux stratégies s’offrent alors aux chercheurs.

2.1.3 Les stratégies de (non) qualification sociodémographique des auteurs des autopublications numériques

La première stratégie consiste à compléter les informations manquantes par une phase de production ex post de données de première main. La production de ces données peut être réalisée à partir de deux méthodes : des enquêtes par questionnaire en ligne visant

108 Sylvain Paraisie et Jean-Philippe Cointet, « La presse en ligne au service de la démocratie locale. Une analyse morphologique de forums politiques », art. cit.

109

explicitement à caractériser sociologiquement les enquêtés et/ou un profilage des auteurs à partir d’un croisement de données collectées sur internet.

La première méthode consiste à administrer aux enquêtés – les auteurs des autopublications du corpus étudié – un questionnaire en ligne¹¹⁰. Il s’agit alors d’interroger directement les enquêtés sur leurs attributs socio-démographiques. Ce faisant, le principal attrait heuristique des autopublications numériques, à savoir l’absence d’interaction entre enquêteurs et enquêtés, peut être alors partiellement altéré. Le moment choisi pour administrer le questionnaire est alors déterminant. S’il intervient en amont de la constitution du corpus, les autopublications étudiées peuvent être potentiellement impactées par le protocole de recherche. En revanche, cette situation peut être évitée si l’interrogation des enquêtés intervient en aval de la collecte¹¹¹.

Une deuxième méthode consiste à profiler les auteurs des autopublications à partir d’un croisement de données recensées sur internet¹¹². Si les informations socio-démographiques déclarées des enquêtés sont insuffisantes ou incomplètes, le chercheur peut alors, à partir des données parcellaires dont il dispose rechercher des informations complémentaires sur d’autres espaces d’autopublication où peuvent être inscrits les enquêtés. En moyenne, un internaute serait membre de 3,5 réseaux sociaux¹¹³. Des individus peuvent communiquer assez peu d’informations sur un réseau social et être plus prolixes sur d’autres. Les réseaux sociaux dits « professionnels » (Linkedin, Viadéo, etc.), sur lesquels le profil des inscrits s’apparente à des curriculum vitae en ligne, constituent par exemple des sources d’informations particulièrement riches pour déterminer le niveau d’étude ou la catégorie socioprofessionnelle des enquêtés. Les informations recueillies sur les différents espaces d’autopublications peuvent être ensuite croisées et regroupées, afin de compléter les données démographiques manquantes. À défaut ou en complément de ces données socio-démographiques, des informations relatives aux goûts culturels des enquêtés peuvent constituer des indices sociologiques révélateurs de leur catégorie sociale d’appartenance. Les

110 Concernant l’administration de questionnaires en ligne, cf. notamment Arnaud Mercier, « Étudier les internautes par des questionnaires en ligne », in Amandine Degand et Benoît Grevisse (dir.), Journalisme en ligne, Bruxelles, de Boeck, 2012, p. 292-297 ; Dieudonné Tchuente et alii, « Pour une approche interdisciplinaire des TIC. Le cas des réseaux socionumériques », Document numérique 2011/1 (Vol. 14) ou encore Gersende Blanchard, Simon Gadras et Stéphanie Wojcik, « Analyser la participation politique en ligne : des traces numériques aux pratiques sociales » in Christine Barats (dir.), Manuel d’analyse du Web, Paris, Arman Colin, 2012.

111 Nous aborderons plus en détail ces questions dans le chapitre 2, lors de la présentation de notre méthodologie de panélisation de la twittosphère politique.

112 Dominique Boullier et Audrey Lohard, Opinion mining et Sentiment analysis : Méthodes et outils, op. cit. 113

goûts culturels des individus sont en effet, on le sait, fortement discriminants et socialement déterminés¹¹⁴. Dès lors, par un renversement méthodologique, l’étude inductive des goûts culturels exprimés par les enquêtés peut fournir des informations relatives à leurs attributs sociaux. Si cette méthode présente l’avantage de ne pas nécessiter une interaction directe avec les enquêtés, elle ne permet pas néanmoins un recueil systématisé des informations nécessaires : des individus peuvent ne pas être inscrits sur d’autres réseaux sociaux ou, si ils le sont, ne pas y dévoiler davantage d’informations.

Ces deux méthodes de production de données sociodémographiques complémentaires sur les auteurs des autopublications numériques présentent un coût relativement élevé et de surcroît proportionnel à la taille du corpus étudié. Plus le nombre d’autopublications collectées est important, plus la recherche d’informations complémentaires sur leurs auteurs sera chronophage. Une autre stratégie possible consiste alors, pour reprendre les termes de Dominique Boullier Audrey Lohard, à « accepter d’abandonner la référence

socio-démographique »¹¹⁵. Selon ces auteurs, puisque « ce qui est étudié [les autopublications] ne

fait plus référence à des émetteurs bien identifiés dont les chercheurs posséderaient les caractéristiques socio-démographiques classiques et considérées comme définitoires de la personne »¹¹⁶, les sciences sociales n’auraient plus d’autres choix que de « faire [leur] deuil

et pour longtemps des repères socio-démographiques sur le web actuel et pour cela changer de paradigme »¹¹⁷.

De plus, le développement de logiciel permettant de traiter des quantités très importantes de données numériques a offert aux chercheurs la possibilité de collecter de façon exhaustive – et non de façon échantillonnée comme avec les méthodes quantitatives traditionnelles – les messages publiés sur les espaces d’autopublication. Dès lors, face à l’attrait de corpus exhaustifs de très grande taille, l’opération de qualification « manuelle » (c’est-à-dire non automatisée) des données socio-démographiques peut, pour certains chercheurs, apparaître secondaire.

Nous le verrons dans la prochaine section de ce chapitre, les stratégies et arbitrages de

Dans le document Analyser les opinions politiques sur internet Enjeux théoriques et défis méthodologiques (Page 60-68)