• Aucun résultat trouvé

Pour une approche interdisciplinaire des TIC

N/A
N/A
Protected

Academic year: 2022

Partager "Pour une approche interdisciplinaire des TIC"

Copied!
28
0
0

Texte intégral

(1)

des TIC

Le cas des réseaux socionumériques

Dieudonné Tchuente

1

— Marie-Françoise Canut

1

Nadine Baptiste-Jessel

1

— Alexandre Coutant

2

Thomas Stenger

2

— Olivier Rampnoux

2

1. Institut de Recherche en Informatique de Toulouse (IRIT) Équipe SIG/D2S2, 118 Route de Narbonne, F-31062, Toulouse 2. CEntre de REcherhe en GEstion (CEREGE - IAE Poitiers) 20 Rue Guillaume VII Le Troubadour – BP 639, F-86022, Poitiers

RÉSUMÉ. L’analyse des réseaux sociaux est menée dans le domaine des sciences sociales depuis les années 1930. L’avènement du web social et le développement des réseaux socionumériques ont la particularité de fournir des environnements propices pour l’accès à des masses importantes de données utiles pour la caractérisation d’un réseau social au moyen d’outils de fouille de données, d’analyse de graphes, etc. Pour autant, ces nouveaux espaces ne se réduisent pas à une reproduction des réseaux sociaux hors-ligne. Dès lors, une analyse interdisciplinaire exploitant les possibilités d’outils informatisés d’analyse de données tout en éclairant les résultats obtenus à la lumière de ceux issus d’une analyse ethnographique se révèle judicieuse. Cet article présente les résultats d’une enquête sur les principaux usages des internautes sur les réseaux socionumériques en suivant cette approche interdisciplinaire.

ABSTRACT. Social network analysis is conducted in the social sciences since the 1930s. The advent of social web and the development of online social networks provide suitable environments for accessing large amounts of users’ social networks data and users’

interactions data.Thus, many tools for data mining or graph mining can then be used to automatically characterize users’ social networks. However, users’ social networks and users’ interactions in online social social networks are not reduced to a reproduction of their offline social networks and interactions.Therefore, an interdisciplinary analysis exploiting the possibilities of automatic tools for data analysis while highlighting the results achieved from an ethnographic analysis makes sense. This article aims to present the results of a survey on the main usage of online social networks following this interdisciplinary approach.

MOTS-CLÉS : réseaux sociaux numériques, réseaux socionumériques, interdisciplinarité, approche sociotechnique.

KEYWORDS: online social networks, social networks sites, interdisciplinary, sociotechnical approach.

DOI:10.3166/DN.14.1.31-57 © 2011 Lavoisier, Paris

(2)

1. Introduction

Deux internautes sur trois dans le monde ont visité une plateforme sociale (Nielsen, 2009) et trois quarts des internautes européens ont visité un réseau socionumérique1 (Rsn) selon ComScore (décembre 2008). En Europe, ces sites attirent déjà plus de 41,7 millions d’utilisateurs2 et les internautes français ne sont pas en reste puisque 64 % d’entre eux ont déjà visité un de ces sites web, ce qui représente 21,7 millions de visiteurs uniques (Ipsos, décembre 2008). Parmi ces derniers, 43 % disposent d’un profil et les trois quarts ont un profil sur au moins deux plateformes socionumériques. Selon l’Institut Nielsen, 17 % du temps passé en ligne est consacré aux Rsn (août 2009). Facebook aime rappeler qu’avec plus de 500 millions de profils actifs (dont 15 millions en France), s’il était un pays, il serait le 4e plus important de la planète (devant le Brésil, la Russie et le Japon). La moitié des utilisateurs accéderaient à leur profil quotidiennement.

Les Rsn constituent donc incontestablement un phénomène important qui interroge d’autant plus la communauté scientifique qu’il demeure encore difficile à différencier très clairement, dans les discours médiatiques comme académiques, des autres types de plateformes disponibles sur internet (Stenger et al., 2010a).

Web/médias sociaux, web/médias participatifs, web/médias communautaires, web/médias 2.0 (parfois 3.0 ou au carré), réseaux socionumériques, communautés en ligne, communautés virtuelles, crowdsourcing, folksonomy, bookmarking social, réseaux communautaires… autant d’appellations qui font que les spécificités de chaque plateforme et des configurations sociotechniques qui s’y développent, sont difficiles à appréhender. Ainsi, si ces termes possèdent l’avantage de permettre de regrouper de manière floue un ensemble de phénomènes, ils se révèlent peu opérationnalisables, voire nocifs à la bonne identification non seulement des différents éléments les constituant mais aussi des usages s’y développant.

Ce phénomène soulève de nombreuses questions pour les chercheurs intéressés par les TIC et leurs usages. Quelle définition précise donner aux Rsn ? Quelles théories et méthodes permettent d’en rendre compte ? Quelles activités et formes de regroupements sociaux peut-on trouver sur ces espaces ? Quel type de contenu est créé ou échangé au sein de ces espaces et quels enjeux en découlent ? Quels risques et opportunités les Rsn apportent-ils à leurs différentes catégories d’utilisateurs ? Peuvent-ils et sous quelles conditions être exploités par les différentes institutions civiles (éducation, ONG, vie citoyenne, renseignement et police) et les entreprises (CRM, datamining, publicité comportementale) ?

Plusieurs courants de recherche propres aux disciplines de la sociologie, de l’informatique, des sciences de l’information et de la communication ou de la gestion ont abordé les Rsn selon leurs propres cadres théorique et méthodologique. Cet article

1. Nous préférons l’appellation réseaux socionumériques à celle de réseaux sociaux numériques communément employée (cf. Stenger et Coutant, 2010a).

2. http://www.lemondedublog.com/2009/02/facebookrfigaro.php

(3)

propose de plaider que face à ces questions complexes, seule une approche interdisciplinaire permet de développer une appréhension suffisamment fine du complexe phénomène résultant de la rencontre entre des objets techniques et des usagers.

À travers les résultats d’un projet de recherche initié en janvier 2008 et basé sur 24 mois d’enquête3, cet article propose d’expliquer comment une approche sociotechnique, fondée sur la complémentarité entre sciences de l’information et de la communication, informatique et sciences de gestion, a permis d’affiner le regard posé sur les Rsn par chaque discipline. Après une revue de la littérature consacrée à cet objet, une deuxième partie explicite le cadre théorique interdisciplinaire que nous avons mis en place et la méthodologie qui en a découlé. La présentation d’une partie des résultats obtenus permet d’en illustrer la pertinence.

2. Un état de l’art multidisciplinaire sur les réseaux socionumériques

Nous évoquons dans un premier temps, les travaux informatiques s’intéressant aux Rsn. Nous abordons ensuite les résultats des enquêtes menées en sciences humaines et sociales.

2.1. Les réseaux socionumériques dans la recherche en informatique

De manière générale, un réseau social est un ensemble d’identités sociales telles que des individus ou des organisations sociales reliées entre elles par des liens créés lors des interactions sociales. Les réseaux sociaux sont modélisés par des données hétérogènes et multirelationnelles représentées sous forme de graphe (Wassermann et al., 1994). Dans le monde réel, on peut citer plusieurs exemples de réseaux sociaux : réseaux d’auteurs et de co-auteurs d’articles scientifiques, réseaux de collaboration d’entreprises, réseau de contacts téléphoniques, etc. Dans le contexte du web 2.0, nous nous intéressons aux environnements collaboratifs (blogs, wikis, social bookmarking, etc.) et plus particulièrement aux Rsn (Facebook, MySpace, Orkut, etc.). Les Rsn ont la particularité de fournir au sein d’un seul environnement une palette très diversifiée d’applications au travers desquelles les utilisateurs interagissent ou publient des contenus (photos, tags, vidéos, blogs, liens, articles, commentaires, mur, groupes, forums, etc.). Les activités des utilisateurs dans ces plateformes produisent de plus en plus d’informations qui peuvent permettre de mieux caractériser un utilisateur individuel, mais également l’influence de son réseau social dans son comportement (ses connexions avec des applications ou avec d’autres membres du réseau). Notre objectif vise donc à analyser les contenus (qualité) des activités des utilisateurs au sein des Rsn. Même si les travaux de la

3. « Projet RSN » financé par la Mission Recherche et la DIDES du Groupe La Poste et coordonné par Thomas Stenger (laboratoire CEREGE, IAE de Poitiers).

(4)

littérature sur le recueil de données dans les réseaux sociaux portent à la fois sur des données quantitatives et qualitatives, les analyses, quant à elles, s’appuient en général sur la structure des réseaux et sur les données quantitatives des activités du réseau. Dans ce qui suit, nous présentons les principales problématiques abordées au niveau du recueil (et de la représentation) de données ainsi que de l’analyse des Rsn.

2.1.1. Recueil et représentation des données dans les réseaux socionumériques Les techniques utilisées pour le recueil et la représentation des données dans les environnements web 2.0 et dans les Rsn peuvent être regroupées en deux catégories : recueil de données via les API (Application Programming Interface) proposées par les plateformes ou représentation des données par des vocabulaires du web sémantique.

L’usage des API proposées par les plateformes (Facebook API, OpenSocial, etc.) (Bernie, 2008 ; Jessel et al., 2009) ne permet pas de récupérer toutes les informations sur les activités des utilisateurs, mais celles qui sont recueillies peuvent être suffisantes pour comprendre leurs principaux usages et centres d’intérêts (voir section 4). Cependant, même si les plateformes définissent souvent des politiques de confidentialité bien précises sur l’accès aux données des utilisateurs via leurs API, ces dernières peuvent être la source de plusieurs attaques. Il s’agit d’attaques telles que la recomposition d’un réseau à partir des fragments de données accessibles (Tianjun et al., 2008), le scannage des ports et l’exécution de scripts malicieux sur les machines des utilisateurs (Patakis et al., 2009), la collecte massive des données des profils utilisateurs pour des usages douteux (Bonneau, Danezis, 2009), etc. Du point de vue inverse, certains auteurs proposent plutôt des méthodes pour intégrer des couches de sécurité basées sur la cryptographie au dessus des niveaux de sécurité définis par les plateformes (Baatarjav et al., 2009 ; Saikat Guha et al., 2008 ; Felt et al., 2008).

Le vocabulaire RDF (Resource Description Framework) FOAF4 (Friend of a Friend) est très utilisé depuis plusieurs années pour la représentation des données sociales des utilisateurs sur le web. Il compte parmi les espaces de noms les plus utilisés sur le web (Golbeck, 2005). Les usages de ce vocabulaire sont très variés, on peut citer par exemple la détection des communautés d’intérêts ou la détection des identités multiples sur le web (Golbeck et al., 2008). Cependant, ce vocabulaire comporte plusieurs propriétés encore en phase de test et n’inclut pas tous les concepts présents dans les Rsn (par exemple, la classification en catégories des contacts d’un utilisateur ou les données échangées entre utilisateurs). Pour l’enrichir et représenter des informations supplémentaires, certains auteurs (Breslin et al., 2007 ; Uldis, 2008) fusionnent FOAF avec des vocabulaires de représentation de contenus publiés sur le web tels que SIOC5 (Semantically-Interlinked Online

4. http://www.foaf-project.org/

5. http://sioc-project.org/

(5)

Communities Project) ou les standards de centralisation des systèmes d’identification sur le web comme OpenID6.

2.1.2. Analyse de données dans les réseaux socionumériques

L’analyse des Rsn peut tirer parti de toutes les techniques d’analyses existantes pour les réseaux sociaux telles que la segmentation des réseaux, la détection de communautés, l’évolution des communautés, la prédiction des liens (Han et al., 2007) ; la découverte de cliques, K-core, etc. (Mohsen et al., 2006) ; la visualisation des réseaux (Ucinet, Stocnet, Pajek, etc.) ; le calcul de métriques telles que la cohésion des groupes ; la centralité ou l’intermédiarité des nœuds (Reffay et al., 2006) ; le calcul de l’influence d’un individu dans une communauté à partir de modèles probabilistes (Richardson et al., 2002). Dans le cas particulier des Rsn, on peut rajouter les techniques d’analyse s’appuyant sur les résultats obtenus dans les systèmes P2P (Buchegger et al., 2009 ; Juste et al., 2008 ; Figueiredo et al., 2008 ; Yang et al., 2007) ou encore la définition d’ontologies spécifiques à l’analyse des réseaux sociaux (Ereteo et al., 2009). Globalement, pour réaliser les analyses, tous ces travaux s’intéressent à la structure des réseaux et aux données quantitatives sur les activités des utilisateurs (degré des nœuds, centralité des nœuds, intermédiarité des nœuds, etc.). Notre approche vise plutôt à analyser les réseaux du point de vue de la qualité des informations qui y sont véhiculées (voir section 4).

2.2. Les réseaux socionumériques étudiés par les sciences humaines et sociales Les recherches en sciences humaines et sociales qui se sont intéressées aux Rsn sont essentiellement de deux ordres.

Le premier s’inscrit dans la continuité des travaux menés sous l’angle de l’analyse structurale des réseaux sociaux en sociologie (Henry et al., 2008). Ils sont également évoqués dans la littérature Marketing7. Les travaux empiriques sont (très) peu nombreux. Cela peut s’expliquer par la complexité de la mise en œuvre de l’ARS pour des réseaux socionumériques et par l’exigence de cette méthode qui implique idéalement un accès au réseau complet.

Des recherches mettent d’ailleurs en garde contre les confusions entre les réseaux sociaux d’un individu et les réseaux socionumériques sur les Rsn (Stenger, et al., 2010a ; Boyd, 2006, 2008 ; Boyd et al., 2007). Les relations entre ces deux types de réseaux et les versions online/offline du capital social des individus sont examinées.

Ellison et al., (2007 ; 2009) indiquent qu’un usage important de Facebook sera associé à un capital social plus important. En particulier le capital social passerelle (Putnam, 2000), qui renvoie aux « liens faibles », avec des personnes que nous connaissons, qui

6. http://www.openid.net/

7. Sans toutefois être mobilisés.

(6)

peuvent constituer des ressources en informations ou en perspective et sans prise en charge émotionnelle (Granovetter, 1982).

Le second type de recherche, de loin le plus fécond, renvoie à une ethnologie/

sociologie des usages des nouveaux medias et à une approche ethnographique des pratiques sur les Rsn.

Les travaux se sont tout d’abord focalisés sur les spécificités des Rsn et leur dynamique sociale afin de les définir en tant qu’objet et de proposer une méthodologie de recherche appropriée (Boyd et al., 2007 ; Beer, 2008). La question des « amis », des relations sur les Rsn et de leur interaction avec la vie « offline » attire particulièrement l’attention. Les recherches sur ce sujet ont majoritairement procédé à une sociologie de l’amitié sur ces plateformes. Plusieurs travaux ont pris la notion de réseau social à la lettre en cherchant à comparer les structures amicales de différents Rsn (Donath, 2007 ; Papacharissi, 2009). Certains auteurs ont pour leur part cherché à évaluer l’influence du nombre et des caractéristiques des amis dans l’évaluation des individus à travers leur profil (Ellison et al., 2007 ; Jernigan and Mistree, 2009 ; Tong et al., 2008 ; Walther et al., 2008), l’influence des amis dans la gestion par les utilisateurs de leur vie privée (Clarke, 2009), l’apprentissage à se comporter au milieu de ses pairs rendu possible par ces plateformes (Boyd, 2008 ; Greenhow et al., 2009), plus particulièrement pour combler un défaut de socialisation hors-ligne dans le cas d’adolescents en difficulté (Notley, 2009) ou pour renforcer sa popularité, qu’il s’agisse d’élargir celle déjà effective hors-ligne ou de profiter de ce nouveau support pour établir une popularité faisant défaut hors- ligne (Zywica et al., 2009).

Enfin, les chercheurs intéressés par la nature de ces relations sur les Rsn ont dès le début souligné l’absence de connaissance précise sur la qualité des liens noués sur ces sites, que le terme « ami » résume trop rapidement (Stenger et al., 2010b ; Boyd, 2006, 2008 ; Livingstone, 2008). Les utilisateurs des Rsn eux-mêmes ironisent d’ailleurs sur ce terme d’ami.

La vie privée et la protection des données personnelles (privacy) constituent l’autre thème majeur. La plupart des utilisateurs des Rsn fournissent en effet beaucoup d’informations dans leur profil.

Les premières recherches soulignent le paradoxe entre les déclarations et les pratiques des utilisateurs (Acquisti et al., 2006 ; Stutzman, 2006 ; Barnes 2006 ; Gross et al., 2005). S’ils déclarent souhaiter protéger leurs données privées, ils n’en prennent que rarement l’initiative. Certains expliquent à l’inverse qu’ils ne sont pas conscients de l’exposition de leur vie privée, ni de qui peut accéder à leur profil (Dwyer, 2008). Ellison et al. (2007) rapportent que sur Facebook, 70 % des utilisateurs ne savaient pas qu’ils pouvaient contrôler les paramètres de confidentialité de leur profil ou que leur profil était ouvert sans restriction.

D’autres études présentent au contraire, des résultats très différents, précisant que les utilisateurs, notamment les jeunes, sont conscients des menaces éventuelles et

(7)

adoptent des comportements en conséquence : 66 % des adolescents utiliseraient un profil limité (Lenhart et Madden, 2007) et 46 % de ceux ayant un profil ouvert publient délibérément de fausses informations. Des résultats récents étudiant le cas des adolescents en France pointent également un paradoxe de nature quelque peu différente : bien que les jeunes aient tout pour prendre conscience des enjeux de l’accès à leur vie privée et à leurs données personnelles (l’information – par les proches et les médias, les outils et les compétences techniques), ils ne s’en préoccupent pas ou que très rarement dans des cas particuliers (Stenger et al., 2010c).

La présentation de soi et la mise en scène de son identité en ligne constituent le troisième thème central des recherches en sciences humaines et sociales sur les Rsn.

Elles s’intéressent en grande partie aux pratiques des adolescents.

Ces plateformes offrent en effet des conditions pour le développement d’une culture générationnelle disposant de lieux propres. Elles permettent alors de nouvelles formes d’expression de soi à destination de sa génération (Fletcher et Greenhill, 2009) et favorisent l’émergence de nouveaux modes de création de liens et de gestion de ceux-ci (Coleman et Bell, 2009). Soulignons par ailleurs comment ces nouveaux supports digitaux, modifient les manières d’exprimer ces différences.

L’impact des Rsn dans la structuration des relations entre pairs et entre pairs et adultes ne sera jamais dissocié de la situation des jeunes hors-ligne tant contextes en ligne et hors-ligne se trouvent fondamentalement imbriqués (Jones, 2008). À ce titre, nous évoquerons l’impact d’une dernière spécificité de ces supports : leur tendance à gommer le compartimentage des contextes sociaux, ce que Boyd nomme l’effondrement des contextes (Boyd, 2008), et les enjeux que ceci implique en matière d’apprentissage à repérer les cadres sociaux (Goffman, 1986) en ligne et hors-ligne pour les jeunes, particulièrement dans la distinction entre privé et public (Keagan, 2009).

Enfin, soulignons que si des chercheurs en sciences de gestion et plus spécifiquement en marketing travaillent sur cette thématique des Rsn, à ce jour les publications sont encore rares. Les journées d’études fleurissent néanmoins, témoignant d’un intérêt de la discipline pour cet objet. On notera toutefois que le champ des « médias sociaux » et du web 2.0 demeure abordé comme un ensemble homogène, les Rsn se trouvant alors négligés dans leurs spécificités.

Le rôle des infrastructures des plateformes socionumériques et de leurs outils n’a en revanche que peu été exploré. Cette problématique implique en effet, une recherche nécessairement interdisciplinaire qui prend en compte à la fois les propriétés techniques des dispositifs, leurs usages et leurs contextes.

2.3. Les limites de l’approche monodisciplinaire

Ces approches disciplinaires ont donné lieu à des résultats focalisant leur attention sur certains aspects du phénomène aux dépens de l’appréhension de la

(8)

double dimension socio/technique de ces plateformes, rencontre entre des outils techniques et des logiques sociales dont le terme configuration sociotechnique (Rebillard, 2007) évoqué supra rend bien compte et où se fait ressentir la nécessité d’une approche interdisciplinaire. Plusieurs limites majeures en découlent. Le premier risque consiste à ne retenir que les caractéristiques formelles de ces plateformes, comme l’ont proposé (Boyd et al., 2007) dans leur travail pionnier de définition des Rsn. Le fait de proposer un profil, une liste d’amis et des fonctionnalités de navigation par ce biais ne constitue effectivement pas une barrière technique pour les sites pouvant facilement les implémenter. Se pose alors la question des usages se développant sur ces sites et qui pourront différer de ceux rencontrés sur d’autres plateformes. C’est ainsi que nous avons proposé de compléter la définition de Boyd et Ellison en ajoutant cette dimensions des usages.

Les Rsn constituent des services web qui permettent aux individus :

(1) de construire un profil public ou semi-public au sein d’un système, (2) de gérer une liste des utilisateurs avec lesquels ils partagent un lien, (3) de voir et naviguer sur leur liste de liens et sur ceux établis par les autres au sein du système (Boyd et al., 2007), et (4) de fonder leur attractivité essentiellement sur les trois premiers points et non sur une activité particulière (Stenger et Coutant, 2010a).

Cet usage très particulier rencontré lors de nos enquêtes s’est trouvé justifié par les résultats d’une vaste étude menée auprès de plus de 800 jeunes américains à propos de leurs usages des nouveaux médias (Ito et al., 2008). Il y est proposé de distinguer interest-driven online activity et friendship-online driven activity, qui coïncident avec les activités que nous retrouvons sur les Rsn. Mizuko Ito, coordinatrice de l’enquête, s’en explique auprès d’Henry Jenkins :

« Ce qui distingue les pratiques médiatiques des jeunes repose sur la différence entre ce que nous avons appelé les pratiques conduites par l’amitié et les pratiques organisées autour de centres d’intérêt. La participation axée sur l’amitié correspond à ce que la plupart des jeunes font en ligne : passer du temps avec leurs amis, s’amuser, flirter et se comparer par l’intermédiaire des sites sociaux comme MySpace ou Facebook. La participation axée sur les centres d’intérêt, elle, renvoie à des pratiques plus créatives ou plus technophiles, où les jeunes se connectent en ligne avec d’autres autour de passions ou d’intérêts partagés tels que les jeux ou la production créative »8.

Cette définition possède en outre l’avantage d’insister sur la double dimension indissociablement sociale et technique des Rsn, qui devrait dissuader d’appliquer sans réflexion préalable, les modèles théoriques de l’analyse des réseaux sociaux, développés pour des contextes sensiblement différents. Cette importation reposerait effectivement sur un ensemble de présupposés fortement discutables : les Rsn calqueraient à l’identique notre réseau social hors-ligne, nous pouvons qualifier les liens unissant les profils de manière précise, nous pouvons accéder au réseau

8. http://henryjenkins.org/2008/11/hanging_out_messing_around_gee.html

(9)

complet et nous connaissons la finalité de ce réseau9. Enfin, cette double dimension encourage à ne pas focaliser notre attention sur les logiques sociales observables sur les Rsn, sans retenir comment celles-ci, si elles préexistent et servent de fondement à la création de ces plateformes, évoluent avec leur adoption. Le risque consiste alors à se contenter d’identifier ces grandes logiques, sans prendre acte de comment celles-ci ne peuvent exister que sur des supports dont les caractéristiques vont influer sur leur manière de s’actualiser (Kaufmann, 1997).

3. Construction d’une analyse interdisciplinaire de l’objet réseau socionumérique

Nous explicitons dans un premier temps, le cadre théorique interdisciplinaire mis en place, avant de détailler la méthodologie en ayant découlé.

3.1. Penser l’appropriation de l’objet

Edgar Morin le souligne sans équivoque : « l’ennemi de la complexité, ce n’est pas la simplicité, c’est la mutilation […] La mutilation peut prendre la forme de conceptions unidimensionnelles ou de conceptions réductrices » (1990). S’intéresser à l’appropriation de l’objet nécessite donc une approche profondément interdisciplinaire.

L’interdisciplinarité est entendue ici, non pas comme une succession multidisciplinaire de points de vue ne dialoguant pas entre eux, mais comme la tentative de réunir au sein d’une analyse complexe, les différentes dimensions déterminantes d’un objet, à la manière de ce que propose Kline (2003) pour les TIC en identifiant trois circuits culturel, marchand et technologique. Plutôt que de scinder ce phénomène complexe en différentes facettes à étudier séparément ou parallèlement, il s’agit donc de focaliser l’attention sur le moment de la rencontre entre un objet technique et des processus sociaux. Cette posture, particulièrement judicieuse lorsque nous nous penchons sur l’analyse des TIC (Miège, 2004 ; 2007), a déjà été théorisée par de nombreux auteurs à propos des médias (Veron, 1985 ; 1987 ; Proulx, 1994), des objets de la vie quotidienne (Certeau, 1990 ; Kaufmann, 1997 ; Douglas, Isherwood, 1979), des manières d’habiter la ville et de cuisiner (Certeau et al., 1998) ou de la consommation de marques communautaires (Coutant, 2007).

De nombreux travaux ont abordé l’appropriation des objets techniques, notamment informatiques et des systèmes d’information (cf. notamment Vaujany, 2005, 2006 ; Carton et al., 2006 ; Grimand, 2006 ). Sous la diversité des approches, un consensus se fait sur l’impossibilité de prévoir l’usage effectif des objets et outils. Ces travaux portent avant tout sur des activités professionnelles focalisées sur un intérêt précis. Or, nous avons souligné avec Ito et al. (2008), que les activités des individus sur les Rsn

9. Pour une analyse critique approfondie de l’importation de ce courant dans le cadre des Rsn, voir Stenger et Coutant, 2010a.

(10)

ne correspondent à aucun autre objectif que le fait de se retrouver avec ses amis et proches. Elles peuvent donner lieu à une grande variété de pratiques « prétextes » (Lahire, 2004), valant moins pour elles-mêmes que pour l’occasion qu’elles offrent de se retrouver ensemble10. Cette opposition entre activités guidées par un intérêt et activités guidées par l’amitié induit donc une modification radicale dans la manière d’interpréter les usages émergeant sur ce type de plateforme. Les travaux de Certeau (1980) sur les activités ordinaires permettent alors de mieux cerner ces usages quotidiens, doublement invisibles bien qu’occupant une grande partie de nos journées : peu conscients, ils sont peu explicités par les individus ; ne répondant pas à des finalités précises, ils sont aussi ignorés par la plupart des théories scientifiques, fondées sur une représentation de l’activité comme nécessairement focalisée sur un but précis. Proulx (1994, p. 175) souligne ainsi que « Certeau identifie ce qu’il nomme les

« arts de faire » aux manières non stéréotypées de faire usage des produits culturels.

Quoi que socialement invisible, il s’agit bien d’un savoir, même si il est jugé

« illisible » et est ainsi disqualifié, la plupart du temps, par le discours scientifique habitué à construire ses théories à partir de ce que les observateurs peuvent voir ». Cet usage quotidien doit pourtant être pris en compte si l’on souhaite comprendre la dynamique identitaire qui anime les utilisateurs de ces sites. Kaufman (1997) indique ainsi que « les objets du quotidien ont une vertu de permanence qui construit le concret et contrôle les errements de l’identité ».

Le processus identitaire implique de se fonder sur des supports (Martuccelli, 2002).

Cependant, la nécessité de construire une présentation de soi originale à partir de matériaux et d’outils utilisés par tous, amène les individus à employer ces supports de manières inventives (Kaufmann, 2004). Les individus font alors usage de leur métis, ce que les grecs désignaient comme une intelligence contextuelle faite d’expérience, dans leur façon d’agencer de manière inédite des objets aux fonctions prédéfinies, convertissant ainsi des contraintes, des chemins préétablis en nouveaux espaces de possibles. Il y a deux dimensions à ce braconnage : un détournement au sens d’écart d’une part, et un assemblage créatif à partir d’objets divers d’autre part (Certeau, 1980). Kaufmann radicalise même la position certalienne en affirmant que toute la réalité sociale se fonde sur le bricolage des individus avec les objets : « Ces tripotages et bricolages permanents des objets qui nous entourent ont alimenté l’idée que l’univers du quotidien pourrait être vu comme un art de la ruse, d’une personnalisation conduite par l’intermédiaire d’actions marginales de détournement. Michel de Certeau notamment (1980), avec l’intelligence et l’élégance d’exposition qui le caractérisent, a construit une part de sa renommée sur cette idée. Or elle me semble erronée en ce qu’elle prend un processus central pour un simple mouvement de révolte en forme de détail. Il n’y a qu’accessoirement ruses aux marges et détournement (sauf à penser que tout est ruses aux marges et détournement) ; la construction du monde allant de soi,

10. Les échanges initiés autour de la révélation de détails du quotidien dans les statuts (« a raté son café », « se languit du week-end ») illustrent ce type d’activité. Les utilisateurs en sont d’ailleurs très conscients, reconnaissant qu’ils ne font rien de précis sur ces sites, mais que c’est justement ce qui les attire.

(11)

base la plus solide de la réalité sociale, s’effectue de façon privilégiée par les tripotages et autres bricolages du quotidien ». Soulignons que le bricolage ne doit alors pas nécessairement être entendu comme un détournement mais plutôt comme une adaptation d’individus disposant d’un ensemble hétéroclite de dispositions et compétences à des objets aux potentiels variés. Cette rencontre pourra alors actualiser uniquement certains de ces potentiels ou même en « inventer » d’autres.

La diversité disciplinaire des auteurs suscités se réclamant de cette analyse de la rencontre, témoigne de son aspect interdisciplinaire : historiens, anthropologues, sociologues, sémioticiens, chercheurs en SIC. Ce positionnement comporte effectivement l’avantage de supposer une véritable collaboration entre disciplines sur un socle épistémologique commun, qui prévient du risque de se contenter d’accumuler des éclairages disciplinaires indépendants les uns des autres, piège que soulignent Lahire (2001) ou Miège (2004) : « Bien souvent le mot

« interdisciplinarité » renvoie à des collages hétéroclites de « points de vue » disciplinaires dont chaque chercheur sort inchangé »11. Ici se situe toute la différence entre la multidisciplinarité et une véritable interdisciplinarité.

3.2. Aboutir à une méthodologie interdisciplinaire

Pour produire des données qui nous permettent de prendre en compte les enjeux d’une véritable interdisciplinarité, nous avons conduit une réflexion méthodologique qui nous a amenés à développer une méthode adaptée pour nourrir les outils dont disposait chaque discipline par les résultats obtenus avec les outils des autres.

Une première étape a consisté à construire un outil de veille sur le web au travers d’une sélection de 40 blogs de consultants webmarketing ou sites spécialisés et des liens vers lesquels ils menaient. Cette sélection est issue de la consultation régulière du flux RSS Wikio consacré aux « médias sociaux » et du blog consacré à Facebook

« Inside Facebook ». De plus, nous avons effectué une revue éditoriale portant sur 17 ouvrages publiés autour d’internet, du web 2.0 ou des « médias sociaux » par des consultants, intellectuels ou entrepreneurs d’internet12. Le tout fut enrichi par de nombreux contacts avec ces experts lors de conférences et de journées d’études.

Cette première phase a aussi consisté en des observations participantes sur les principaux sites identifiés comme Rsn (Facebook, Myspace, Skyrock, Netlog, Hi5, Orkut), afin de construire des compétences et une expertise partagées. Ce choix

11. http://www.homme-moderne.org/societe/socio/blahire/entrevHP.html

12. Les ouvrages suivants ont été étudiés : Anderruthy, 2007 ; Ayache, 2008 ; Boni, Stemart, 2008 ; Bouteiller et al., 2008 ; Crouzet, 2006 ; Delcroix, Martin, 2008 ; Gervais, 2007 ; Laurent, 2008 ; Layet et al., 2007 ; Lefebvre, 2005 ; Lombard, 2007 ; Pisani, Piotet, 2008 ; Quignaux, 2008 ; Rosnay, 2006 ; Soderqvist, Bard, 2008. La revue web a été effectuée à partir d’une page Netvibes créée pour l’occasion et mise à disposition de la communauté scientifique à l’adresse suivante : http://www.netvibes.com/etudereseauxsociauxnumeriques

(12)

aussi spécifique permet une analyse effective des pratiques et des activités ordinaires repérées sur ces plateformes.

La deuxième phase a consisté à conduire entretiens compréhensifs et focus groups d’une part, et, d’autre part, à administrer un questionnaire selon une double modalité : questionnaire en ligne et application Facebook spécifique.

Les entretiens ont regroupé 65 personnes âgées de 13 à 27 ans (collégiens, lycéens, étudiants et jeunes diplômés). A chaque personne enquêtée, il a été proposé d’associer comme amis à son/ses profils des profils d’observation créés sur chacun des principaux Rsn (Facebook, Skyrock, Myspace). Plus de la moitié des interviewés (38) a accepté de se prêter à ce protocole, nous permettant de développer une analyse systématique des contenus des profils. Nous avons ainsi pu mettre en abyme les déclaratifs des enquêtés avec leurs pratiques effectives mais aussi rendre plus tangibles les activités quotidiennes des personnes interrogées.

Pour la partie plus descriptive et plus quantitative, nous avons structuré un questionnaire comprenant 31 questions. Il se décompose en quatre parties correspondant à quatre objectifs distincts :

– évaluer le degré d’ancienneté des répondants dans leurs pratiques et leurs usages des Rsn

– cerner les usages et le niveau de connaissance qu’ont les membres du Rsn qu’ils utilisent.

– appréhender la convergence des plateformes pour comprendre les modalités de diffusion et d’évolution des représentations

– explorer de façon subjective, les représentations que les jeunes se font de la présence des marques sur les Rsn.

Au total, nous avons collecté 637 questionnaires valides constitués de répondants âgés de 10 ans à 69 ans. Toutefois, compte tenu de l’objet de l’étude, nous avons effectué une sélection au sein de notre échantillon afin de ne conserver que les 552 répondants âgés de 14 à 27 ans.

Ce recueil de données a été complété par un protocole d’observation en ligne avec des profils aux caractéristiques variées afin d’étudier les manières qu’ont les marques d’entrer en contact avec les utilisateurs de ces sites ainsi que, le cas échéant, les modes de prise de contact entre personnes ne se connaissant pas.

Cette phase a abouti à une analyse détaillée des activités menées par les participants de ces sites ainsi qu’à la définition des notions de profil (Coutant, et al., 2010) et d’amis (Stenger et al., 2010b) dans le contexte des Rsn, convoquant alors les concepts associés à l’ordre de l’interaction (Goffman, 1973a, 1973b, 1974, 1990) et la sociologie de l’individu (Corcuff, 2005 ; Kaufmann, 2004 ; Lahire, 2001, 2004 ; Martuccelli, 2002).

Ces premières phases ont permis de passer outre deux difficultés majeures associées à l’emploi d’outils d’analyse quantitative informatisés en nourrissant ces

(13)

derniers des résultats obtenus par nos enquêtes compréhensives. La première correspond à la dimension informelle, non réfléchie de la plupart des activités courantes, ce que Certeau nomme ordinaires (1990), des individus. Nous avons effectivement souligné que ces sites, permettant aux internautes de se retrouver et de passer du temps ensemble, sont l’occasion pour les individus de mener un ensemble d’activités entretenant le lien social sans que celles-ci n’aient d’autre fonction définie ou d’utilité précise au-delà de cette sociabilité. Bien que structurées et identifiables comme telles, ces activités demeurent en grande partie non formulables par les individus concernés. Il s’agit d’une difficulté régulièrement soulevée par les sociologues travaillant sur la jeunesse (Galland, 2007 ; Kaufmann, 2006 ; Singly, 2006) et cherchant à comprendre quelles activités sont réellement effectuées lorsque les enquêtés déclarent « traîner ensemble », pour reprendre l’expression utilisée pour caractériser les activités des jeunes sur les Rsn par (Ito et al., 2008) ou (Boyd, 2008).

La deuxième difficulté renvoie à l’intimité des informations concernant la mise en scène de sa face publique. Goffman (1974) avait déjà souligné à quel point les protagonistes d’interactions sociales rechignent à dévoiler les coulisses de la gestion de leur face. Le travail des individus consiste paradoxalement à paraître naturel quand l’impression que nous donnons a été soigneusement préparée. On comprend donc à quel point les « ficelles » de ce travail ne sont pas aisément avouables par les individus. Ces deux difficultés, le non-formulable et le non-dicible, aboutissent à une même nécessité : déployer une méthodologie de production et de recueil de données qui, d’une part, encourage les enquêtés à la réflexivité et stimule leur mémoire et, d’autre part, permette d’aller au-delà des discours des enquêtés pour observer directement leurs activités en ligne.

Le troisième temps de collecte des données vise à se constituer un corpus pour alimenter une analyse des données sur les activités des utilisateurs sur Facebook via la plateforme logicielle Tétralogie (Dousset, 2006). La méthodologie et quelques résultats de cette analyse sont présentés dans la section 3.2.

4. Résultats

Il ne s’agit nullement ici d’exposer in extenso les différents résultats obtenus au cours de cette enquête. Le lecteur intéressé par certains travaux évoqués pourra se référer à la bibliographie en fin d’article. Nous traitons ici de comment nos enquêtes compréhensives ont permis de préparer la mise en place d’une analyse à l’aide du logiciel Tétralogie (Dousset, 2006) puis de guider l’interprétation des données obtenues.

4.1. D’une compréhension fine des réseaux socionumériques…

Parmi les axes de recherche mis en place, citons tout d’abord l’analyse critique des discours promotionnels. Ceux-ci se fondent sur le potentiel technique des Rsn

(14)

pour développer la publicité comportementale, le marketing relationnel et le datamining. En cela, ils ignorent l’indifférence des utilisateurs à l’égard des marques cherchant à rentrer en contact avec eux et la spécificité des activités que ces derniers mènent sur les Rsn. Celle-ci rend pourtant difficile leur exploitation pour de la publicité ciblée ou du datamining (Stenger et al., 2009, 2010). La mise en scène de soi et la culture de l’expressivité (Allard, 2007) stimulées par les Rsn ont aussi été abordées sous l’angle de la co-construction des usages. Ceux-ci résultent d’outils techniques encourageant à certaines pratiques (comme les tests de personnalité, les invitations à écrire sur le mur d’amis, etc.), de normes sociales exigeant la participation (« pour voir, il faut accepter de montrer ») et de la créativité des individus dans leur manière d’adhérer avec enthousiasme à cette norme, qui les pousse à détourner les fonctionnalités premières de certains outils afin d’en faire des outils d’expression interactifs (Coutant et al., 2010). Dans la lignée de l’interrogation sur les types d’activités menées par les individus sur les Rsn, une réflexion sur les théories de l’influence, fréquemment convoquées à propos des communautés en ligne et souvent importées sur les Rsn, a proposé de remplacer les théories fondées sur les leaders d’opinion, supposant intérêts précis et reconnaissance de relations asymétriques, par une théorie fondée sur les mécanismes de la prescription, entendue comme influence potentielle et à intensité variable sur le comportement et le choix des individus (Stenger et al., 2009). L’attention aux logiques sociales mais aussi aux outils de gestion de ces logiques proposés par les sites nous a enfin conduits à analyser la gestion de l’amitié sur les Rsn en ce qu’elle préside au développement des applications mais aussi comment celle-ci se trouve modifiée en retour par ces outils (Stenger et al., 2010d). Un point a systématiquement été relevé : la liaison extrêmement forte entre pratiques en ligne et pratiques hors-ligne, qui nous a encouragés à insister sur l’inscription de ces pratiques en ligne au sein d’un ensemble d’autres pratiques. Effectivement, si ces sites proposent des fonctionnalités émergeant de logiques sociales préexistantes, les usages s’y développant viennent à leur tour reconfigurer l’expression de ces logiques. Ainsi des possibilités qu’ont les adolescents de s’extraire de l’environnement familial ou éducatif tout en demeurant physiquement présent, des contextes où la face des personnes peut-être mise à mal et où la médiation technique permet d’amoindrir le risque encouru par les participants, des manières de gérer les liens faibles qui ont tendance à se concentrer sur les outils en ligne aux dépens des autres moyens de communication. Ces reconfigurations aboutissent à de nouveaux contextes dont la maîtrise nécessite un ensemble de compétences spécifiques que les jeunes utilisateurs paraissent ne maîtriser que partiellement dès lors que l’on sort de celles convoquées pour savoir se comporter entre pairs, ce qui accentue d’autant plus les enjeux associés à la maîtrise de ses traces en ligne. C’est donc fort de ces résultats issus de nos premières phases de terrain qualitatives que nous avons envisagé l’emploi du logiciel de traitement automatique de données Tétralogie, offrant des fonctionnalités d’analyse de données issues des réseaux sociaux. Notre objectif est d’éclairer les traitements qu’il peut effectuer par la compréhension des activités et des types de relation initiés sur ces plateformes. Des résultats divergents

(15)

des recherches menées dans le cadre de l’analyse des réseaux sociaux ou des opportunités pour les entreprises soulignées par les discours de promotion des Rsn ont ainsi pu être mis à jour, ce que nous allons à présent développer.

4.2. À l’exploitation de ces connaissances dans le cadre d’une analyse Tetralogie

Figure 1. Le processus proposé d’extraction et d’analyse de données à partir de Facebook

Dans le cadre de notre étude, nous nous sommes intéressés au réseau social Facebook qui est le plus utilisé en France depuis décembre 2008. Notre approche consiste à analyser non pas la structure du réseau social Facebook, mais plutôt les activités des utilisateurs au sein de ce réseau via l’usage des applications. Ainsi, nous avons développé une application externe, pour l’extraction des données et des métadonnées sur les interactions entre les utilisateurs et les applications. Une donnée représente une information explicitement indiquée par l’utilisateur (texte d’une mise à jour de statut par exemple) lors de l’usage d’une application. Une métadonnée représente une information contextuelle déduite de l’application ou de l’interaction entre l’application et l’utilisateur (la date de l’interaction, la catégorie d’une page dont l’utilisateur est fan, etc.). L’application ayant uniquement une portée académique, nous ne l’avons pas soumise au répertoire des applications Facebook.

Nous avons recruté des utilisateurs volontaires pour installer l’application sur leur profil. Au total, 85 utilisateurs ont utilisé notre application, ce qui nous a permis

(16)

d’accéder à 7 041 profils utilisateurs (via la lecture des flux d’activités des amis des utilisateurs). Les utilisateurs de notre application nous donnent explicitement le droit de stocker et d’analyser les données relatives à leur profil pendant toute la durée de nos travaux. Notre processus d’extraction et d’analyse de données dans le réseau Facebook est présenté sur la figure 1. Les trois phases de notre processus sont décrites ci-après.

4.2.1. Phase 1 : extraction des données

Nous utilisons l’API Facebook, plus précisément des requêtes FQL (Facebook Query Language), pour extraire les données des profils utilisateurs. De par notre analyse de l’API Facebook, les données des profils utilisateurs peuvent être classées en quatre catégories en fonction de leur accessibilité aux applications externes :

– les informations inaccessibles : il s’agit particulièrement des messages échangés entre utilisateurs tels que les mails et les chats ;

– les informations accessibles mais incomplètes : il s’agit des activités des amis de l’utilisateur qui apparaissent dans ses flux d’activités. Même si ces flux apportent un volume important de données sur les activités des amis de l’utilisateur, ils ne reportent pas systématiquement toutes les activités de ces derniers. On ne retrouve pas, par exemple, un flux pour chaque photo publiée par les amis de l’utilisateur.

Toutefois, on y retrouve des informations importantes comme les interactions entre les utilisateurs et les applications externes. Aussi, l’accès aux flux d’activités d’un utilisateur requiert une autorisation supplémentaire de ce dernier après qu’il ait accepté d’installer l’application sur son profil. Pour chaque flux d’activité on peut accéder aux informations telles que l’émetteur du flux, son type (photos, vidéos, liens, application externe, etc.), et la date d’émission. En plus des activités des amis de l’utilisateur, les informations sur les commentaires et sur les avis (« j’aime ») des utilisateurs sont également fournies de manière incomplète (échantillons) ;

– les informations accessibles chez l’utilisateur sans les données temporelles : il s’agit de dates d’adhésion des utilisateurs aux applications collectives (pages, groupes, événements). De plus, il n’est pas possible d’accéder directement aux interactions entre les utilisateurs et leurs applications, à moins de les retrouver dans les flux d’activités ;

– les informations complètement accessibles chez l’utilisateur de l’application : il s’agit des éléments qu’il publie (photos, vidéos, liens, statuts, articles, tags). Pour chacune de ses applications, on peut accéder à son contenu et à la date de publication.

4.2.2. Phase 2 : traitement et analyse des données et métadonnées textuelles

Pour générer les centres d’intérêts des utilisateurs, nous procédons par l’analyse des textes dérivés des données et des métadonnées des applications qu’ils utilisent (photos, tags, liens, vidéos, articles, commentaires, groupes, pages, événements, flux d’activités) (figure 2a). Les textes extraits sont analysés par le module de fouille de texte de la plateforme de veille scientifique Tétralogie (Dousset, 2006). La structure

(17)

du document (contenant les données à analyser) et le découpage des unités de texte sont définis dans un fichier de description du document (figure 2b).

Figure 2. (a) Extrait du document contenant les données extraites. (b) Descripteur du document

L’extraction des centres d’intérêts se fait ensuite par comptage de cooccurrences de termes dans le document. Pour extraire uniquement les centres d’intérêts pertinents, nous utilisons des filtres et des dictionnaires :

– les filtres positifs (concepts du domaine) : il s’agit d’une liste de termes du domaine à extraire exclusivement dans le texte. Pour l’analyse d’un domaine particulier, les termes peuvent être fournis a priori par les analystes (experts) de ce domaine ou par une projection sur une ontologie du domaine étudié. Dans notre cas, nous souhaitons étudier le vocabulaire employé par les utilisateurs de Facebook dans sa généralité et non dans un domaine précis. Ainsi, nous avons construit un filtre non spécifique à un domaine précis, et contenant uniquement les termes ayant une fréquence supérieure à 1 dans l’ensemble du document (pour simplifier l’étude). La figure 3a montre un extrait de filtre positif contenant les termes retenus dans nos analyses. La figure 4 montre un nuage de termes les plus fréquents dans un

(18)

document comprenant les données renseignées dans la rubrique « centres d’intérêts » des profils utilisateurs auxquels nous avons eu accès (7 041 profils). Les mots les plus fréquents concernent :

- le sport (termes : sport, football, basketball, handball, surf, tennis, rugby, etc.), - les jeux et les distractions (termes : jeu, music, danse, vidéo, piano, guitare, cinéma, comédie, théâtre, sorties, fête, bière, alcool, soirée, etc.),

- la sociabilité (termes : amitié, association, amour, filles, famille), - et les technologies (termes : informatique, internet, ordinateur, console), - Seul le mot « shopping » renvoyant à la consommation marchande est retrouvé.

Figure 3. (A) extrait d’un filtre positif, (B) extrait d’un filtre négatif, (C) extrait d’un dictionnaire de synonymes

– Les filtres négatifs (concepts vides) : il s’agit d’une liste de termes vides de sens dans le contexte de l’étude. Les articles du (des) langage(s) étudié(s) sont des cas simples de termes très souvent inclus dans les filtres négatifs. En fonction des langages, plusieurs types de filtres sont fournis par défaut et peuvent être réutilisés ou enrichis. La figure 3b présente un extrait de filtre négatif utilisé dans notre cas ;

– les dictionnaires de synonymes : il s’agit d’un dictionnaire permettant de mettre en relation les termes de même sens dans le contexte étudié. Si de tels dictionnaires peuvent facilement être constitués dans un domaine bien précis, la tâche s’avère plus compliquée dans les documents à contenu très variés comme dans

(19)

les réseaux socionumériques. Nous avons constitué un fichier de synonymie prenant en compte les termes dans les différentes langues étudiées (français et anglais notamment) ainsi que les abréviations et les caractères spéciaux (les smileys par exemple) (figure 3c).

Figure 4. Nuage de mots fréquents renseignés dans la rubrique « centres d’intérêts » des profils Facebook

Une fois que les centres d’intérêts sont extraits à partir du texte, leur fréquence est calculée pour chaque utilisateur (dont l’identifiant est rendu anonyme via la méthode MD5) pour construire une matrice 2D de cooccurrence entre utilisateurs et centres d’intérêts. La matrice peut éventuellement prendre en compte le temps (matrice 3D) pour pouvoir construire des graphes temporels et de ce fait analyser l’évolution des profils utilisateurs.

4.2.3. Phase 3 : exemple de visualisation des graphes construits

La méthode visuelle d’analyse de profils qui est présentée ici, vise à identifier plus simplement la qualité des liens entre les utilisateurs et leurs centres d’intérêts.

Ces liens peuvent être analysés pour un ou plusieurs utilisateurs. Nous effectuons ici un test sur le profil de l’un des auteurs afin de pouvoir valider la pertinence des résultats obtenus avec Tétralogie. La méthode se veut complémentaire aux analyses ethnographiques en y apportant plus d’ergonomie dans la présentation des résultats et, si les résultats sont validés, en impliquant au minimum la participation des utilisateurs dans les analyses (une simple installation de l’application suffit).

A partir des matrices de cooccurence 2D ou 3D construites, l’algorithme Visugraph (Mothe et al., 2006 ; Loubier, Dousset, 2008) est utilisé pour construire des graphes 2D bipartis (utilisateurs-centres d’intérêts) ou des graphes bipartis 3D (utilisateurs-centres d’intérêts-périodes de temps). Les tailles des nœuds sont proportionnelles à leur nombre de liens.

(20)

Figure 5. Graphe biparti utilisateurs-centres d’intérêts

La figure 5 présente un aperçu du graphe 2D utilisateurs (nœuds en gris clair) - centres d’intérêts (nœuds en gris foncé) obtenu après filtrage et élimination des nœuds ayant très peu de liens. Pour les utilisateurs de notre application, leurs liens d’amitiés ont été pris en compte dans le graphe. Les nœuds correspondant à ces utilisateurs et à leurs centres d’intérêts apparaissent ainsi plus grand en haut et à gauche du graphe (cadre en blanc). Un zoom sur cette partie du graphe permet ainsi de voir avec plus de précision les centres d’intérêts communs aux utilisateurs et à leurs amis. On peut également distinguer dans le graphe des sous-graphes isolés (cadre en gris) qui représentent des utilisateurs ayant des centres d’intérêts communs (femmes, handball, jeu, etc.). Avec un volume plus important de données, on pourrait ainsi identifier des clusters d’individus regroupés par centres d’intérêts.

(21)

Figure 6. Visualisation de l’évolution du profil de l’utilisateur (« up »)

La figure 6 présente l’évolution des centres d’intérêts de l’utilisateur « up » sur quatre semestres. Chaque nœud (un histogramme) représente l’utilisateur (barres à plusieurs couleurs) ou ses centres d’intérêts (barres unicolores). Chaque barre représente la fréquence de l’activité de l’utilisateur ou la fréquence d’un centre d’intérêt sur une période de temps. Pour chaque nœud, les barres se succèdent dans le sens des aiguilles d’une montre à partir de la première période de temps (semestre 1 de l’année 2009 dans ce cas). Par exemple, la première barre représente la fréquence de son activité au semestre 1, année 2009, la deuxième barre représente la fréquence de son activité pour le semestre 1, année 2010 (qui ne prend actuellement en compte que les mois de janvier et février 2010), la troisième barre représente la fréquence de son activité au semestre 2, année 2008, la quatrième barre représente la fréquence de son activité au semestre 2, année 2009). Ce graphe permet d’identifier les centres d’intérêts périodiques (profil à court-terme) de l’utilisateur qui sont les histogrammes proches des périodes (cadre en noir). Par exemple, on constate que l’utilisateur « up » s’est intéressé aux films et à la marque Renault au semestre 1, année 2009. Les centres

(22)

d’intérêts quasi constants (profil à long-terme) de l’utilisateur (histogrammes dont les barres sont significatives dans toutes les périodes de temps) se rapprochent du centre du graphe (cadre en gris). Dans ce cas, on peut considérer que les centres d’intérêts du profil à long-terme de l’utilisateur sont les photos, les vidéos, les articles, le jeu, la musique, le champagne, etc.

Les centres d’intérêts extraits par le traitement automatique des données et métadonnées relatives aux activités des utilisateurs peuvent être plus ou moins pertinents en fonction du contexte d’usage de ces données. Dans l’interprétation des graphes, nous supposons que chaque centre d’intérêt extrait pour un utilisateur représente un lien d’intérêt direct plus ou moins significatif (en fonction de sa fréquence et de sa constance). Une activité fréquente et constante vérifie naturellement cette supposition. Cependant, dès lors que ces activités s’avèrent moins fréquentes et non constantes, il peut s’agir de centres d’intérêts qui ne sont pas directement liés à l’utilisateur, et par conséquent peu pertinents pour son profil.

Ainsi, concernant le profil de la figure 6, l’utilisateur nous a confirmé l’exactitude de la quasi-totalité des centres d’intérêts qui apparaissent (particulièrement tous les centres constants dans cadre en gris). En revanche, il a également indiqué qu’il ne s’est jamais directement intéressé à la marque Renault qui apparaît dans son profil à court terme du semestre 1, année 2009. La raison de la présence de cette marque n’est en effet due qu’à la citation d’un réalisateur de cinéma ayant tourné en dérision Renault et cette citation se trouve elle-même sur le profil pour effectuer un parallèle avec un philosophe et non évoquer l’automobile. L’observation du profil permet effectivement de comprendre sans aucune ambiguïté qu’il ne s’agit pas d’un intérêt pour l’automobile. La citation en question est en effet la suivante : « Godard dit être un “abricant de films” depuis que Renault se dit “créateur d’automobiles”, je me demande ce que je vais pouvoir être maintenant que Lipovetsky se dit sociologue... ». On voit ici tout l’intérêt d’une approche interdisciplinaire pour pallier cette limite de la méthode automatique d’extraction des centres d’intérêts. Le recours à des méthodes qualitatives pour une validation interne ou par l’observation contextualisée des contenus permet de corriger ce qui ne devra alors être envisagé que comme des hypothèses à valider. Techniquement, ces vérifications pourraient hypothétiquement être incluses à partir d’une forte structuration des documents générés par les activités des internautes sur les réseaux socionumériques. Cependant au niveau des réseaux socionumériques, les API actuelles fournissent peu d’éléments sur la structure des activités de leurs utilisateurs.

Ainsi, même si l’évaluation visuelle des profils utilisateurs via la méthode présentée s’avère pertinente au niveau de la quantité d’utilisateurs (à analyser) et de l’ergonomie des résultats des profils à long terme, la faible structuration du texte analysé dans les profils à court terme impose une validation qualitative. Il s’agit donc d’une piste de recherche à approfondir désormais afin d’envisager dans quelle mesure améliorer l’analyse automatique des profils à court terme.

(23)

5. Conclusion

L’extraction et l’analyse des données des profils utilisateurs sur les réseaux socionumériques peuvent bien être rendues possibles au moyen des API, même si les données extraites ne sont pas complètes. Les exemples de graphes présentés montrent uniquement les relations entre utilisateurs et centres d’intérêts, ce qui a l’inconvénient de ne pas apporter de sémantique forte sur la nature des liens entre un utilisateur et ses centres d’intérêts. Il est par exemple impossible de dire à partir du graphe de la figure 6 si le centre d’intérêt « music » de l’utilisateur « up » est perçu positivement (il aime la musique) ou négativement (il déteste la musique) par ce dernier. L’enrichissement des graphes présentés en ajoutant des liens entre centres d’intérêts est une première approche que nous utilisons actuellement pour comprendre le contexte dans lequel l’utilisateur est lié à un ou plusieurs centres d’intérêts. D’autres pistes seront explorées pour résoudre ce problème (traitement d’opinions, rumeurs, etc.). Compte tenu de la sensibilité des données recueillies au moyen d’APIs, nous comptons également explorer la piste du recueil de données au moyen des descriptions RDF telles que FOAF et SIOC. Nous envisageons enfin d’étudier l’apport d’une modélisation bivectorielle (vecteur des centres d’intérêts de l’utilisateur, vecteur des centres d’intérêts des contacts) des profils, et l’élaboration des contraintes et des règles du passage à une modélisation univectorielle du profil à partir des deux vecteurs définis pour chaque utilisateur.

Cet article a cherché à démontrer la valeur heuristique d’une démarche interdisciplinaire dans le cas de l’analyse de la circulation d’objets techniques au sein d’un espace social. Une posture critique associée à une méthodologie plurielle et faisant appel à une posture épistémologique s’intéressant à la rencontre nous semble fournir une conception d’une forme d’interdisciplinarité qui nous paraît particulièrement riche heuristiquement. Bien qu’inspirée par les travaux de plusieurs auteurs relevant des disciplines d’origine des chercheurs ayant participé à ce projet, et dont certaines se revendiquent explicitement de l’interdisciplinarité, nous insistons sur le fait que ce positionnement ne s’y limite pas et que c’est ce dépassement des logiques disciplinaires qui a justement permis à des chercheurs aux profils si variés de se retrouver dans un projet collectif.

Remerciements

Ce travail est issu du projet de recherche « réseaux sociaux numériques » financé par le groupe La Poste (Direction de l’Innovation et des E-services – DIDES - et Mission Recherche et Prospective) et mené durant une période de 24 mois en 2008- 2009. Nous tenons ici à remercier ses membres ainsi que les collègues des laboratoires CEREGE et IRIT ayant participé au projet Rsn. Les réflexions initiées lors de ce projet ont pu être prolongées dans le cadre du projet Existenz soutenu par l’Institut des Sciences de la Communication du CNRS (ISCC) en 2009-2010.

(24)

6. Bibliographie

Allard L., Blondiau O. (dir.), « 2.0 ? Culture Numérique, Cultures Expressives », Médiamorphoses, n° 21, Armand Colin-INA, 2007.

Baatarjav E.-A., Dantu R., Yan Tang, Cangussu J., “BBN-Based Privacy Management Sytem for Facebook”, Intelligence and Security Informatics, ISI’09, IEEE International Conference, 2009, p. 194-196.

Bernie H., “A comparison of on and offline networks through the Facebook API”, http://ssrn.com/abstract=1331029

Bonneau J., Anderson J., Danezis G., “Prying data out of a Social Network”, Advances in Social Network Analysis and Mining, 2009, p. 249-254.

Boyd D., Taken Out of Context - American Teen Sociality in Networked Publics, Doctoral Dissertation, University of California, Berkeley, School of Information, 2008.

Boyd D., Ellison N., “Social Network Sites: Definition, History, and Scholarship”, Journal of Computer-Mediated Communication, vol. 13, 2007, p. 210-230.

Breslin J., Decker S., “The Future of Social Networks on the Internet”, Published by the IEEE Computer Society, December 2007.

Buchegger S., Datta A., “A Case for P2P Infrastructure for Social Networks - Opportunities &

Challenges”, Wireless On-Demand Network Systems and Services, WONS 2009. Sixth International Conference, 2009, p. 161-168.

Caradec V., Martuccelli D., « Matériaux pour une sociologie de l’individu : perspectives et débats », Presses Universitaires du Septentrion, Villeneuve d’Ascq, 2004.

Carton S., Vaujany F.X. (de), Perez M., Romeyer C., « Vers une théorie de l’appropriation des outils de gestion informatisés: une approche intégrative », Revue Management et Avenir, n° 9, mars 2006, p. 159-179.

Certeau (de) M., Giard L., Mayol P., L’Invention au quotidien, tome 2 : Habiter, cuisiner, Paris, Flammarion, 1998.

Certeau (de) M., L’invention du quotidien. 1. Arts de faire, Paris, Folio, 1980.

Corcuff P., « Figures de l’individualité, de Marx aux sociologies contemporaines », EspacesTemps.net, Textuel, 12 juillet, 2005. http://espacestemps.net/document1390.html Coutant A., Les marques identitaires à l’épreuve de leur consommation. Consommateur

identitaire, transculturalité, Thèse Sciences de l’Information et de la Communication, Lyon, Université Jean Moulin Lyon 3, 2007. http://tel.archives-ouvertes.fr/tel-00 268332/fr/

Coutant A., Stenger T., « Processus identitaire et ordre de l’interaction sur les réseaux socionumériques », Les Enjeux de l’Information et de la Communication, 2010.

http://w3.u-grenoble3.fr/les_enjeux/2010/Coutant-Stenger/ index.html Douglas M., Isherwood B., The world of goods, Londres, Routledge, 1979.

(25)

Dousset B., “Tétralogie: a platform for scientific and technological survey”, International workschop on Webometrics, Infometrics and Scientometrics & seventh COLLNET Meeting, LORIA, Nancy France, 2006.

Erétéo G., Buffa M., Gandon F., and Corby O., “Analysis of a Real Online Social Network Using Semantic Web Frameworks”, ISWC 2009, LNCS 5823, p. 180-195.

Felt A., Evans D., “Privacy Protection for Social Networking APIs”, 2008. http://www.cs.

virginia.edu/felt/privacybyproxy.pdf

Figueiredo R.J., Boykin P.O., Juste P.S., Wolinsky D., “Integrating Overlay and Social Networks for Seamless P2P Networking”, Proceedings of the 2008 IEEE 17th Workshop on Enabling Technologies: Infrastructure for Collaborative Enterprises, WETICE 2008, p. 93-98.

Galland O., Sociologie de la jeunesse, Paris, Armand Colin, 2007.

Goffman E., Les cadres de l’expérience, Paris, Les Editions de minuit, 1991.

Goffman E., Les rites d’interaction, Paris, Les Editions de minuit, 1974.

Goffman E., La mise en scène de la vie quotidienne. Tome 1, La présentation de soi, Paris, Les Editions de minuit, 1973.

Goffman E., La mise en scène de la vie quotidienne. Tome 2, les relations en public, Paris, Les Editions de minuit, 1973.

Golbeck J.., Rothstein M., “Linking Social Networks on the Web with FOAF: A Semantic Web Case Study”, Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence, 2008, p. 1138-1143.

Golbeck J., “Sharing and Using links in Social Networks”, IEEE Social Network Applied (Steffen Staab), January/February 2005, p. 85-86.

Grimand A., L’appropriation des outils de gestion. Vers de nouvelles perspectives théoriques ?, Saint-Etienne, Presses Universitaires de Saint-Etienne, 2006.

Ito M. et al., Living and learning with new media: summary of findings from the digital youth project, Berkeley, Mac Arthur Foundation, 2008.

Jessel N., Tchuente D., Canut M.-F., Peninou A., “Quelle modélisation des profils utilisateurs des réseaux sociaux numériques?”, Colloque International EUTIC - Usages et Enjeux des TIC (EUTIC 2009), Bordeaux, p. 163-175.

Juste P.S., Wolinsky D., Jiangyan Xu, Covington M., Figueiredo R., “On the Use of Social Networking Groups for Automatic Configuration of Virtual Environments”, Grid Computing Environments Workshop, 2008. GCE’08, p. 1-10.

Kaufmann J.-C., L’enquête et ses méthodes. L’entretien compréhensif, Paris, Armand Colin, 2006.

Kaufmann J.-C., Le cœur à l’ouvrage. Théorie de l’action ménagère, Paris, Pocket, 2005.

Kaufmann J.-C., L’invention de soi : une théorie de l’identité, Paris, Armand Colin, 2004.

Kline S., Dyer-Witheford N., De Peuter G., Digital Play: The Interaction of Technology, Culture, and Marketing, Kingston, McGill-Queen’s University Press, 2003.

(26)

Lahire B., L’homme pluriel ; les ressorts de l’action, Paris, Nathan, 2001.

Loubier E., Dousset B., “Visualisation and analysis of relationnal data by considering temporal dimension”, International Conference on Enterprise Information Systems (ICEIS 2007), Funchal, Madeira - Portugal, vol. ISAS, INSTICC Press, juin 2007, p. 550-553.

Martuccelli D., Grammaire de l’individu, Paris, Gallimard, 2002.

Miège B., La Société conquise par la communication : Tome 3, Les Tic entre innovation technique et ancrage social, Grenoble, PUG, 2007.

Miège B., L’information-communication, objet de connaissance, Bruxelles, De Boeck & INA, 2004.

Mohsen J., Abolhassani H., “Different Aspects of Social Network Analysis”, Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence, 2006, p. 66-72.

Morin E., Arguments pour une méthode, Paris, Seuil, 1990.

Mothe J., Chrisment C., Dkaki T., Dousset B., Karouach S., “Combining mining and visualization tools to discover the geographic structure of a domain”, Computers, Environment and Urban Systems, Elsevier, Numéro spécial Geographic Information Retrieval, vol. Hors-série n° 4, 2006, p. 460-484.

Patsakis C., Asthenidis A., Chatzidimitriou A., “Social networks as an attack platform:

Facebook case study”, Networks, 2009. ICN ‘09, Eighth International Conference, 2009, p. 245-247.

Proulx S., « Une lecture de l’oeuvre de Michel de Certeau : L’invention du quotidien, paradigme de l’activité des usagers », Communication, vol. 15, n° 2, 1994, p. 171-197.

Rebillard F., Le Web 2.0 en perspective. Une analyse socio-économique de l’internet, Paris, L’Harmattan, 2007.

Reffay C., Lancieri L., « Quand l’analyse quantitative fait parler les forums de discussion », Revue Sticef, vol. 13, 2006.

Richardson M. and Domingos Pedro, “Mining Knowledge-Sharing Sites for Viral Marketing”, SIGKDD 02, Edmonton, Alberta, Canada, 2002.

Saikat G., Tang K., and Francis P., “NOYB: Privacy in Online Social Networks”, WOSN’08, August 18, 2008, Seattle, Washington, USA, p. 49-54.

Singly (de) F., Les adonaissants, Paris, Armand Colin, 2006.

Stenger T., Coutant A., « Les réseaux sociaux numériques : des discours de promotion à la définition d’un objet et d’une méthodologie de recherche », Hermes-Journal of Language and Communication Studies, n° 44, mars 2010a. http://www.asb.dk/ article.Aspx

?pid=2437

Stenger T., Coutant A., « Des amis sur les réseaux socionumériques – Types et formes de relations », Actes des journées d’études du CR 33 de l’AISLF : Dispositifs techniques de communication humaine : transformations du lien et nouveaux lieux sociaux, 19-20 mai 2010b, Namur (Belgique). http://w3.aislf.univ-tlse2.fr/gtsc/activites.htm

Références

Documents relatifs

Utilisation de la simulation sur ordinateur comme outil pédagogique est récente. Dans tous les cas elle cherche à développer chez l'élève une bonne compréhension des

Les auteurs ont comparé leurs résultats avec des données expérimentales et ont montré que pour un profil d'un mètre de corde, les coefficients aérodynamiques variaient

– wiimote-api: librairie C pour exploiter les possibilités de la Wiimote – WiinRemote: Application pour utiliser la Wiimote sous Windows – WiimoteLib: librairie C# et VB.NET

Avec tamazight, nous avons l’exemple d’une langue en situation de minorisation sur le marché linguistique national, mais qui, cependant, a fait l’objet d’une

Pour pallier certaines de ces limitations, des études subséquentes pourraient être envisagées : • Reproduire le programme expérimental sur différents types de sols typiques des

(2010) ont développé une première approche qualitative (L-TRACS) pour décrire la position et le déplacement du pied, cependant, des limites importantes empêchent les chercheurs

Titulaire d’un mastère en Didactique des langues-cultures de l’Université des Langues étrangères de Beijing, et doctorante dans la même matière et la même université,

Le bégaiement, également appelé bégaiement persistant, bégaiement développemental persistant, ou bégaiement chronique, est un trouble de la santé, affectant le débit