UNIVERSITÉ LIBRE DE BRUXELLES
Faculté de Philosophie et Lettres
Année académique 2008-2009
Thèse présentée en vue de l’obtention du grade académique de Docteur en Information et Communication, sous la direction du Professeur François HEINDERYCKX.
Jeremy DEPAUW
Qualité de l'information et vigilance collective sur le web
Étude des stratégies d'évaluation des sources en ligne par les
professionnels de la gestion de l'information dans les organisations
à une bourse de doctorat octroyée dans le cadre du
Fonds des Bourses de l'Université Libre de Bruxelles.
Table des matières
Résumé vii
Rendre à César. . . xi
I Contextualiser la question de recherche 1 Problèmes, questions et pistes de solution 3 Inscrire la question de recherche dans une problématique . . . . 3
Vers un cadre conceptuel cohérent . . . . 8
Constructivisme et sociopsychologie de l’organisation . . . . 8
Les concepts fondateurs : donner du sens à la question de recherche . . . . 10
De l’incertitude à l’ambiguïté : concilier les approches . . . . 15
La question de recherche à la lumière d’autres courants . . . . 17
Cadre théorique : faire le point . . . . 18
II Conceptualiser la question de recherche 21 1 Vers une conceptualisation de la gestion de l’information 27 1.1 Contextualiser la GI . . . . 29
1.1.1 Complexité, ambiguïté et monde complexe . . . . 29
1.1.2 L’information comme facteur de réduction de l’ambiguïté . . . . 32
1.1.3 La bonne information à la bonne personne au bon moment. . . . 35
1.2 Conceptualiser la GI . . . . 39
1.2.1 La question de la définition : la divergence des approches . . . . 39
1.2.2 La question de la définition : une approche convergente . . . . 45
1.3 Modéliser la GI . . . . 57
1.3.1 Réintroduire la création de sens au coeur de la GI . . . . 57
1.3.2 Rapprocher GI et création de savoir organisationnel . . . . 58
1.3.3 Vers un modèle intégré GI/OL . . . . 62
2 Cerner la qualité de l’information et son évaluation 69 2.1 Contextualiser la qualité de l’information . . . . 71
2.2 Qualité et évaluation de la qualité : faire le point . . . . 73
2.2.1 Information seeking et sensemaking : modéliser le processus . . . . 75
2.2.2 Sensemaking et qualité de l’information : les apports spécialisés . . . . 79
2.3 Qualité et critères de qualité : de la théorie à la pratique . . . . 88
2.3.1 Critères de qualité : stabiliser le débat . . . . 88
2.3.2 Qualité de l’information et sources en ligne : recentrer le débat . . . . 93
2.4 Attributs et critères de qualité : de la pratique au terrain . . . . 94
2.4.1 Evaluer la qualité des sources en ligne : retours du terrain . . . . 94
2.4.2 Préparer le terrain : choisir un cadre de référence des attributs de qualité des
sources en ligne . . . . 97
2.5 De la qualité de l’information au Web 2.0 : mobiliser le concept de genre . . . . 99
3 Vers une morphologie du Web 2.0 103 3.1 Contextualiser ce qu’on appelle communément le Web 2.0 . . . 104
3.1.1 Quelques faits . . . 107
3.1.2 Quelques pré-requis . . . 109
3.2 Construire une morphologie du Web 2.0 . . . 111
3.2.1 Les bases théoriques de la morphologie . . . 112
3.2.2 Les bases méthodologiques de la morphologie . . . 114
3.2.3 Baliser une morphologie du Web 2.0 . . . 115
3.2.4 Lier les dimensions du Web 2.0 . . . 118
3.2.5 Exploiter la morphologie du Web 2.0 . . . 119
3.3 La morphologie du Web 2.0 au microscope . . . 121
3.3.1 Au coeur des composantes de la dimension "Outils" . . . 121
3.3.2 Au coeur des composantes de la dimension "Principes et Pratiques" . . . 127
3.3.3 Au coeur des composantes de la dimension "Tendances" . . . 130
3.3.4 Quelques remarques pour conclure . . . 132
III Répondre à la question de recherche 139 4 Conception du dispositif d’enquête 143 4.1 Retour à la question de recherche . . . 143
4.1.1 Mobiliser la GI dans l’enquête de terrain . . . 144
4.1.2 Mobiliser la qualité de l’information dans l’enquête de terrain . . . 144
4.1.3 Mobiliser le Web 2.0 dans l’enquête de terrain . . . 145
4.2 En route pour le terrain : mettre au point le dispositif . . . 146
4.2.1 Choisir une méthode générale . . . 146
4.2.2 Mobiliser les précédents : les dispositifs qui ont fait leurs preuves . . . 148
4.2.3 Vers un dispositif solide . . . 151
4.3 Sur le terrain : collecter les données . . . 154
4.3.1 La phase 1 en détails . . . 154
4.3.2 La phase 2 en détails . . . 157
4.4 Recruter les répondants . . . 158
4.4.1 La question de l’accès . . . 159
4.4.2 Cibler les organisations . . . 159
4.4.3 Identifier les répondants : qui sont-ils ? . . . 161
5 Examiner la perception d’un changement des stratégies d’évaluation de la qualité de l’in- formation 163 5.1 Explorer les données de la phase 1 . . . 163
5.1.1 La structure des variables primaires . . . 164
5.1.2 La structure des variables secondaires . . . 165
5.1.3 Structure d’analyse . . . 170
5.2 Exploiter les variables secondaires : les distributions de fréquences . . . 170
5.2.1 La fréquence des modalités pour l’ensemble des données . . . 171
5.2.2 La fréquence des modalités agrégée par répondant . . . 173
5.2.3 La fréquence des modalités agrégée par genre . . . 174
5.2.4 La fréquence des modalités agrégées par attribut . . . 176
5.3 Exploiter les variables secondaires : les scores . . . 179
TABLE DES MATIÈRES
5.3.1 Les scores et leur apport dans l’analyse . . . 180
5.3.2 Les scores à deux et à trois modalités comparés . . . 181
5.3.3 Les scores agrégés par genre . . . 184
5.3.4 Les scores agrégés par attribut . . . 186
5.3.5 Explorer les profils des répondants : ce qu’apportent les scores . . . 189
5.4 Récapitulons . . . 192
6 Comprendre l’adaptation des stratégies d’évaluation de la qualité de l’information 195 6.1 De la phase 1 à la phase 2 . . . 195
6.1.1 Ce que la phase 1 ne dit pas . . . 196
6.1.2 A la recherche de ces éléments explicatifs . . . 197
6.2 Enrichir les observations de la phase 1 . . . 199
6.2.1 Comprendre le changement perçu des stratégies . . . 199
6.2.2 Comprendre la disparité des réponses . . . 202
6.2.3 Comprendre la spécificité des genres Web 2.0 . . . 204
6.2.4 Comprendre les différences entre les attributs de qualité . . . 213
6.2.5 Work vs Play : réconcilier les genres et les attributs . . . 223
6.3 Ce que la phase 2 dit de plus . . . 224
6.3.1 Commenter le changement perçu . . . 224
6.3.2 Du changement perçu à l’adaptation des stratégies . . . 227
6.4 Clore momentanément la discussion. . . 228
IV Conclusions 231 Vers une réponse riche et nuancée 233 Retour sur les éléments de la question . . . 233
L’enquête de terrain . . . 236
Dépasser la question de recherche : ouvrir de nouvelles pistes . . . 240
Bibliographie 242
Annexes 261
Compléments au dispositif d’enquête 261
Table des figures
1 Structure du cadre conceptuel . . . . 8
2 Cadre conceptuel initial . . . . 25
1.1 La chaîne documentaire de Chaumier . . . . 36
1.2 Les types de veilleurs de Rouach . . . . 46
1.3 Représentation d’un concept . . . . 47
1.4 Répartition des composantes par dimension dans le concept de GI . . . . 50
1.5 Proportion des composantes par dimension du concept de GI . . . . 51
1.6 Proportion des composantes dans le total des dimensions du concept de GI . . . . . 52
1.7 Proportion des composantes dans les dimensions du concept de GI . . . . 53
1.8 Le concept de GI . . . . 54
1.9 Modélisation de la GI . . . . 65
1.10 Cadre conceptuel : mettre en lumière la GI . . . . 67
2.1 Qualité de l’information dans le modèle de GI . . . . 70
2.2 Les différents niveaux d’intervention de la qualité . . . . 73
2.3 Human Information Seeking : an integrated model . . . . 76
2.4 Information seeking process . . . . 77
2.5 Information seeking : perceived source accessibility and quality . . . . 78
2.6 The academics’ view of information quality . . . . 82
2.7 The practitioners’ view of information quality . . . . 83
2.8 Grille d’évaluation du renseignement brut . . . . 87
2.9 Cadre conceptuel de la qualité des données . . . . 89
2.10 Evaluation de qualité de l’information : un modèle intégré . . . . 91
2.11 Cadre conceptuel : mettre en lumière la qualité de l’information . . . 101
3.1 Nombre d’utilisateurs d’internet entre 1995 et 2007 . . . 107
3.2 Le concept de produser . . . 111
3.3 Définition décomposée du Web 2.0 . . . 115
3.4 Définition du Web 2.0 selon Wikipedia . . . 116
3.5 Le Web 2.0 peut être défini comme. . . 120
3.6 Web 2.0 - un ensemble d’outils . . . 121
3.7 Web 2.0 - un ensemble de principes et de pratiques . . . 128
3.8 Web 2.0 - un ensemble de tendances . . . 130
3.9 Matrice du Web 2.0 . . . 133
3.10 Morphologie du Web 2.0 . . . 134
3.11 Longue Traîne . . . 135
3.12 Cadre conceptuel complet . . . 138
5.1 Exemples de combinaisons de scores . . . 168
5.2 Secteur de la distribution de fréquences des modalités . . . 172
5.3 Répartition des proportions de modalités par répondant . . . 173
5.4 Tableau de données des distributions de fréquences par genre . . . 175
5.5 Graphique des distributions de fréquences par genre . . . 176
5.6 Tableau de données des distributions de fréquences par attribut . . . 177
5.7 Graphique des distributions de fréquences par attribut . . . 178
5.8 Tableaux récapitulatifs des scores à 3 et à 2 modalités . . . 181
5.9 Profil des scores indicés à 2 et à 3 modalités . . . 182
5.10 Les scores indicés à 2 et à 3 modalités . . . 183
5.11 Les indices de scores et les distributions de fréquences par genre . . . 185
5.12 Les indices de scores et les distributions de fréquences par attribut . . . 187
5.13 Répartition des scores par répondant . . . 190
6.1 Profils des réponses des participants de la phase 2 . . . 200
6.2 Liens de dépendance entre les genres et les attributs de qualité . . . 215
Résumé
La complexité de l’environnement dans lequel évoluent les organisations se traduit par la co- existence permanente d’interprétations multiples et contradictoires de la situation. Perturbées dans leurs capacités de décision et d’action, les organisations déployent des dispositifs sophis- tiqués de vigilance collective qui permettent de faire face à cette complexité, restaurant leur ca- pacité à dégager du sens et à orienter leur action. La gestion de l’information en fait partie. Parmi toutes les sources disponibles, internet en général, et le web en particulier, constituent les princi- paux points d’accès à l’information, faisant désormais partie intégrante de ces processus de créa- tion de sens. L’évolution récente du paysage informationnel, tant du point de vue des outils que de celui des pratiques, suscite de nouveaux défis. Par leur facilité d’utilisation et leur accessibilité croissante, de nouveaux types de sources en ligne ont remis en question la façon dont les utilisa- teurs partagent, consomment et produisent du contenu.
Cette thèse examine la remise en cause des processus habituels de vigilance collective, et en particulier celle de l’adaptation, chez les spécialistes de l’information, des stratégies d’évaluation de la qualité de l’information provenant des sources en ligne. La question de recherche mobi- lise trois éléments principaux : les professionnels de la gestion de l’information, l’évaluation de la qualité de l’information et l’évolution du paysage informationnel, qu’on appelle communément le Web 2.0. Pour répondre à cette question, une enquête de terrain a été menée auprès de 53 profes- sionnels de la gestion de l’information en Belgique, entre novembre 2007 et juillet 2008. En l’ab- sence de bases théoriques stables et largement acceptées, un cadre conceptuel spécifique a été développé pour assurer l’adéquation entre les éléments de la question de recherche et le disposi- tif. Ce cadre conceptuel a permis de faire la lumière sur ces éléments. Le recours à une approche sociopsychologique a permis de les articuler, notamment par emprunt aux travaux de Karl Weick et au concept de sensemaking.
La gestion de l’information (GI), considérée comme un processus de vigilance collective, est un concept générique, comprenant les activités de surveillance, de veille ou encore d’intelligence (économique, stratégique, compétitive, etc.). Sa conceptualisation, construite par une analyse de définitions des principaux termes qui lui sont associés, a mis en évidence l’importance de son rôle de médiateur d’information dans l’organisation, qui s’articule autour des étapes récurrentes de collecte, de traitement et de distribution de l’information. Le recours au concept d’organizational learning a permis de dépasser les approches purement mécaniques, mettant en évidence sa ca- pacité à créer du de sens.
C’est au coeur de cette médiation, à l’intersection de la collecte et du traitement de l’informa-
tion, qu’intervient un autre type de sensemaking : l’évaluation de la qualité de l’information. Elle
est envisagée comme un processus de réduction de l’ambiguïté, dont l’action permet la sélection
(ou non) d’une source ou d’une information dans la suite de la médiation. La qualité de l’infor-
mation est abordée sous l’angle de l’information seeking qui permet de faire la lumière sur cette
création de sens. Elle est généralement traitée dans la littérature en termes de pertinence, de cré-
dibilité ou de fitness for use. Des études de terrain et des contributions émanant des praticiens ont
permis de mettre en évidence les attributs et les critères de la qualité qui peuvent être mobilisés
pour construire un jugement de qualité des sources en ligne. Dans le cadre de l’enquête de terrain,
une check-list composée de 72 critères renvoyant à 9 attributs a été choisie comme cadre de ré-
férence pour l’observer : les objectifs de la source, sa couverture, son autorité et sa réputation, sa précision, sa mise à jour, son accessibilité, sa présentation, sa facilité d’utilisation et sa comparai- son avec d’autres sources. Pour pouvoir mettre en évidence de manière concrète les aspects du paysage informationnel en transformation, une analyse des définitions et descriptions du Web 2.0 a permis de construire une description morphologique qui reprend ses caractéristiques princi- pales. Il peut ainsi être considéré comme un ensemble d’outils, de pratiques et de tendances. Les outils permettent d’identifier cinq types de sources qui lui sont spécifiques : les blogs, les wikis, les podcasts, les plates-formes de partage de fichiers et les sites de réseaux sociaux. Ces types de sources sont éclairés dans cette recherche sous l’angle du concept de genre et, ensemble, sont po- sitionnés en tant que répertoire, qu’il est nécessaire de comparer avec celui des genres "classiques"
de sources en ligne.
L’examen du changement des stratégies d’évaluation de la qualité de l’information a été concré- tisé à l’aide d’un questionnaire administré par téléphone, qui visait à croiser les critères de qualité de la liste choisie comme référence avec les cinq genres typiques du Web 2.0. C’est l’importance relative accordée à un critère pour évaluer une information qui a été choisie comme indicateur à observer. Les répondants ont été invités à indiquer s’ils considèrent que l’importance des critères
"change" ("6=") ou "ne change pas" ("=") quand ils évaluent un de ces genres, en comparaison de celle qu’ils accorderaient à un genre classique de source en ligne. En cas de changement, le questionnaire a prévu la possibilité de noter s’il s’agissait d’une hausse (">") ou d’une baisse ("<") d’importance. Pour compléter ce dispositif, 14 entretiens semi-dirigés en face à face ont été me- nés avec des répondants à ce questionnaire, de manière à pouvoir saisir les éléments explicatifs de leurs réponses.
L’analyse des données a montré qu’une majorité des réponses (57% de "=") indiquent que l’importance des critères d’évaluation ne change pas quand une information est mise à disposi- tion par l’intermédiaire d’un genre Web 2.0, plutôt que par celui d’un genre classique de source en ligne. Pourtant, cela implique que 43% des critères changent d’une manière ou d’une autre. C’est sur base de ce constat que cette recherche soutient l’existence d’un changement perçu qui, s’il ne remet pas fondamentalement en cause le processus de jugement de qualité, suscite néanmoins une adaptation de ce dernier par les professionnels de la GI interrogés. La lecture des données à l’aide de variables secondaires a montré notamment une forte disparité des distributions de réponses entre les répondants ; ce qui plaide en faveur du caractère subjectif, personnel et dépen- dant du contexte du processus d’évaluation. De même, elle a permis de déterminer l’existence de deux groupes d’attributs qui se différencient par le fait que le premier comporte des attributs liés au contenu de la source (les objectifs, l’autorité, la précision, etc.) alors que le second est composé d’attributs liés à la forme (présentation, facilité, etc.).
Les entretiens de la seconde phase de l’enquête ont permis d’affiner l’analyse en éclairant, d’une part, sur la nature du changement et, d’autre part, sur les raisons de celui-ci. Les répon- dants ont indiqué que fondamentalement le processus d’évaluation est identique quel que soit le répertoire envisagé. Ils admettent toutefois que les genres typiques du Web 2.0 peuvent être à l’origine d’une perte de repères. Elle s’explique par la perception d’une familiarité moins grande à l’égard des sources et se traduit par une perte de la confiance qu’ils accordent aux sources et à leur jugement. Le changement perçu se manifeste donc par une hausse d’importance de certains at- tributs, qui aide les répondants à restaurer cette confiance. L’élément explicatif de ce changement peut être considéré comme un flou dans les modalités de création de contenu. Ce flou comporte trois dimensions : la façon dont est créé le contenu (How ?), l’identité de celui qui le crée (Who ?) et sa nature (What ?). Ces dimensions peuvent être synthétisées par l’idée selon laquelle n’importe qui peut publier n’importe quoi.
Les entretiens approfondis confirment que les groupes d’attributs liés au contenu d’une part,
et ceux liés à la forme d’autre part, sont bien des éléments explicatifs de la manière dont se ma-
nifeste le changement. Dans le cas des attributs qui augmentent d’importance, les raisons in-
voquées renvoient au fait que la facilité de création de contenu à l’aide de ces genres permet à
"n’importe qui" de créer du contenu. C’est pour cette raison que l’autorité et les objectifs de la source peuvent faire l’objet d’une attention plus forte que sur les genres classiques de sources en ligne. Le fait que n’importe qui puisse publier "n’importe quoi" renvoie à la nature du contenu créé par ces genres. Il est considéré comme dynamique, personnel, indicateur de tendances, source de signaux faibles, subjectifs, etc. Cela pousse les répondants qui sont sensibles à ces questions à re- mettre plus sérieusement en cause la précision par exemple. C’est aussi en raison de la facilité de création de contenu, et du fait que les outils du Web 2.0 réduisent la responsabilité de l’auteur dans la qualité de la conception de sa source, que des attributs de forme, quand ils changent d’im- portance, voient leur niveau baisser. Le second groupe a été signalé par les répondants comme étant davantage des indicateurs de sérieux et des arbitres dans leur processus d’évaluation.
Que ce soit pour discuter des divergences de vue entre répondants ou pour déterminer les
spécificités des genres, il apparaît qu’un aspect capital de la qualité de l’information tient à sa ca-
pacité à répondre aux besoins du moment, le fitness for use. Cette notion est intimement liée à
celle de pertinence et toutes deux ont été résolument présentées comme déterminantes dans les
stratégies, à la fois du point de vue du jugement d’une information ponctuelle, que dans l’atti-
tude face à aux sources en général. Dans tous les cas, c’est d’abord les besoins d’information qui
guident le choix. Toutes observations permettent d’apporter une réponse claire, riche et nuancée
à la question de recherche.
Rendre à César. . .
Je dédie ce travail à vous tous qui avez contribué, de près ou de loin, à son achèvement. Il est le fruit de l’heureuse conjonction de rencontres, de discussions d’aide et de soutien pour lesquels je vous suis redevable. Si le travail de thèse peut être "solitaire" à bien des égards, au cours de mes années de recherche, je ne me suis jamais senti seul sur la route. . .
J
EREMYD
EPAUWDepuis le temps que je pense à l’écriture de ces remerciements, à ce que je veux y dire, le ton que je veux y mettre et les gens que j’ai peur d’oublier, je m’aperçois aujourd’hui que leur écriture est presque aussi stressante que la rédaction des chapitres eux-mêmes. Cette thèse est le fruit d’un travail de longue haleine qui a mobilisé les efforts, la patience, l’écoute et l’attention de plus d’une personne. Dans la mesure où seul mon nom figure sur la page de garde, je crois qu’il est important de prendre le temps de rendre hommage à celles et ceux sans qui il m’aurait été très difficile de mener ce travail à son terme, et de leur exprimer ma gratitude. En voici une liste non exhaustive.
Il me paraît évident de commencer par remercier François Heinderyckx, mon directeur de thèse, mon "Patron". Au cour de toutes ces années, il a n’a jamais manqué à l’appel pour m’ai- der, me guider, me motiver, me rassurer, m’écouter, me conseiller. Sa disponibilité et son attention ont été des atouts précieux qui ont grandement participé à l’aboutissement de cette recherche. Je n’oublierai pas non plus de si tôt la patience dont il a fait preuve, et en particulier lors des der- nières semaines de rédaction. J’apprécie beaucoup le fait qu’il m’ait souvent montré le chemin, mais toujours en me laissant le choix et la responsabilité de l’emprunter. Ses qualités de directeur ont permis de tirer le meilleur de moi, par un mélange subtil de rigueur, de bienveillance et de complicité. Aujourd’hui, je formule le souhait que cette thèse soit à la hauteur de ses attentes et de son investissement en temps, en talent et en coeur dans mon projet. Je considère comme une chance d’avoir été son doctorant et à la manière de Harry Potter qui a trouvé auprès de son direc- teur un guide et un mentor, je remercie François Heinderyckx d’avoir su être, en plus jeune bien sûr), mon Albus Dumbledore.
J’ai également pu compter sur le soutien inconditionnel d’une équipe de "collègues" à qui je souhaite rendre hommage. Je remercie donc de tout mon coeur Anouk Bouckaert, Yana Breindl, Vinciane Colson, Valérie Durieux, Julie Emontspool, Stéphanie Gonçalves, Margaux Hardy, Marc Vanhoolsbeek et Emilie Vossen. Sans eux, je n’aurais pas pu tenir mes délais. Je leur dois une fière chandelle. Leur amitié est précieuse et ce ne sont pas ces quelques lignes qui pourraient suffire à
"solder les comptes". J’espère avoir l’occasion de leur renvoyer l’ascenseur.
J’ai également pu bénéficier de nombreux conseils avisés. Je remercie donc Yohann Delzant, Pascal Francq, François Lambotte, Christophe Lejeune, Claire Lobet-Maris, Geoffroy Patriarche et Luc Wilkin. En n’hésitant pas à bousculer mes idées, ils m’ont permis, à maintes reprises, de remettre en question mes acquis et à garder l’esprit ouvert. Je remercie également Isabelle Boydens et Eric Delamotte qui ont bien voulu apporter leur contribution quand j’en ai eu besoin.
Je tiens à exprimer toute ma gratitude à tous ceux qui sont et resteront désormais "mes ré-
pondants". En m’accordant du temps (une des seules ressources qu’on ne peut récupérer), ils ont
contribué non seulement à la réponse à ma question de recherche, mais ils ont également été une source d’inspiration. Je n’oublie pas que c’est en consultant certains d’entre eux que j’ai pu mettre le doigt sur la problématique et poser ma question de recherche, ni que nos entretiens et nos contacts m’ont permis de garder un ancrage dans la réalité d’un terrain, que la recherche aca- démique peut parfois affaiblir. J’espère qu’à la lecture de ces pages, ils pourront juger de l’utilité de leur investissement et qu’il n’ont pas accordé leur temps en vain.
Je tiens aussi à remercier l’ensemble de l’équipe du département des Sciences de l’information et de la communication. J’adresse aussi ma gratitude aux autorités de l’ULB grâce à qui j’ai pu bénéficier de ma bourse. Ensemble, ils ont contribué à installer cette recherche (et son chercheur) dans des conditions idéales de confort matériel, intellectuel et affectif. C’est une chance, j’en suis conscient et je ne l’oublie pas.
Enfin, je ne pourrais clore ces lignes sans remercier mes proches — ma famille et mes amis — pour leur amour, leur amitié, leur soutien, leur compréhension et leur patience. Je leur dois à tous le bonheur qui est le mien, ce qui a largement contribué à ma capacité à mener cette recherche à son terme. Je terminerais peut-être en remerciant ma douce Vanessa, ma femme, pour l’aide qu’elle m’a apportée, bien qu’elle ait pu en douter. Elle m’a servi d’exemple tout au long de ces années. J’ai découvert à ses côtés des compétences et des ressources que j’ignorais jusque-là. Je lui suis reconnaissant d’avoir pu, encore une fois, tirer le meilleur de moi, en me montrant que se fixer des objectifs ambitieux et les atteindre est sans doute une des plus belles façons de rendre hommage à ceux qui vous aiment et qui croient en vous.
A tous, ainsi qu’à ceux que je n’ai pas cités mais que je n’oublie pas pour autant : Merci ! Si à l’issue de son évaluation, cette thèse peut se voir attribuer un certaine qualité, sachez que, de près ou de loin, vous y avez contribué et que je vous en suis reconnaissant. . .
J EREMY D EPAUW
12 mai 2009
Première partie
Contextualiser la question de recherche
Problèmes, questions et pistes de solution
Inscrire la question de recherche dans une problématique
D ANS UN ENVIRONNEMENT COMPLEXE , les organisations déploient des dispositifs de ges- tion de l’information sophistiqués afin de réduire l’incertitude et permettre aux diri- geants de prendre des décisions optimales, assurant ainsi la pérennité de l’organisa- tion. Parmi tous les outils disponibles, internet en général et le World Wide Web 1 en particulier, constituent les principaux point d’accès à un large choix de sources d’information de toutes sortes. Pourtant, les évolutions récentes, tant techniques que du point de vue des utilisa- tions du web, sont à l’origine de nouveaux défis pour les organisations. Par leur facilité d’utilisa- tion, les outils récents de production et de consultation de contenu en ligne, comme les blogs, les wikis, les plates-formes de partage entre utilisateurs ou les sites de réseaux sociaux, ont remis en question la façon dont les utilisateurs partagent, consomment et produisent du contenu. Les orga- nisations ne peuvent ignorer les évolutions en cours dans leur paysage informationnel et doivent, par conséquent, s’y adapter.
Bien qu’ils soient sujets à caution, les chiffres apportent un éclairage plus précis sur cette évo- lution. Au moment où sont écrites ces lignes, au printemps 2009, Google indexe plusieurs milliards de pages web. 2 Technorati 3 annonce un chiffre de 133 millions de blogs en ligne et ce nombre ne cesse de croître. 4 Wikipedia indique un nombre d’articles dans son encyclopédie collaborative en ligne s’élevant à 2,705,265. 5 Le site de réseau social Facebook comptait à l’automne 2007 plus de 50 millions d’utilisateurs et celui de Linkedin n’en compte pas moins de 30 millions au début de l’année 2009. 6 Ces chiffres interpellent. Il est peu probable qu’une organisation qui utiliserait le web comme accès à des sources d’information ne soit pas intéressée un tant soit peu par ce contenu.
Cette recherche est fondée sur le constat selon lequel les professionnels dont la tâche consiste à être "les yeux et les oreilles" de leur entreprise (veilleurs, responsables d’intelligence écono- mique, compétitive, etc.) 7 connaissent une transformation de leur paysage informationnel, ca- ractérisée notamment par l’apparition de nouveaux outils, de nouvelles pratiques et de nouveaux genres dans la production de contenu en ligne. Ce sujet de recherche mobilise trois éléments ma- jeurs :
– Les professionnels dont il est question sont les spécialistes de l’information dans les organisa- tions. Cette dénomination volontairement vague désigne les professionnels dont la mission consiste tant à surveiller l’environnement de l’entreprise, qu’à alerter les dirigeants des me- 1. (www, web)
2. Et il ne s’agit là encore que du surface web, et pas du web profond.
3. L’un des principaux moteurs de recherche de blogs
4. Source : http ://technorati.com/blogging/state-of-the-blogosphere.
5. Source : http ://en.wikipedia.org/wiki/Special :Statistics.
6. Source : http ://www.crunchbase.com/company/Facebook et http ://www.crunchbase.com/company/Linkedin.
7. Cette image a été proposée par Martinet et Marti [209].
naces et des occasions, qu’à faciliter le processus de prise de décision, voire dans certains cas, à entreprendre des actions d’influence. Cette formulation est inspirée du terme infor- mation specialist très fréquent dans la littérature anglophone[84]. La gestion de l’information (GI) a été définie et conceptualisée pour les besoins de cette recherche à partir d’une revue de la littérature. Le processus de médiation de l’information permet de mettre en place la GI et consiste en la collecte, le traitement et la distribution de l’information.
– Un aspect précis du processus de médiation est au centre de cette recherche. Il s’agit de l’évaluation de la qualité de l’information. Ce processus se situe à cheval sur les étapes de collecte et de traitement de l’information.
– C’est le contexte dans lequel ces tâches sont étudiées qui constitue l’originalité de ce travail.
Ces dernières années, l’évolution du paysage informationnel a initié une série de change- ments tant dans les outils que dans les pratiques de production de contenu en ligne. Bien que le terme ne soit pas des plus heureux, le Web 2.0 est l’étiquette qui désigne le plus com- munément cette évolution.
L’évaluation de la qualité de l’information fait partie des étapes clés qui mènent à la mise en place de dispositifs efficaces de gestion de l’information. Lorsqu’un spécialiste de l’information dans les organisations consulte une source, il déploie un ensemble de stratégies pour poser son jugement, guidé à la fois par sa formation mais aussi par son expérience, son intuition, etc. Selon le type de source qu’il consulte, il prendra soin de convoquer des compétences et des références appropriées pour s’approprier au mieux le contenu auquel il a accès. En effet, ce travail ne sera pas identique selon qu’il s’agisse de trouver des informations dans la presse, sur un site web ou par l’intermédiaire d’un salon professionnel par exemple. Le paysage informationnel de ces spé- cialistes est très large et comporte des types de sources très variés, officiels ou non, formels ou non, explicites ou non.
Dans le cadre de cette recherche, un seul type de sources est considéré : les sources en ligne.
Celles-ci sont accessibles par l’intermédiaire du web et constituent depuis quelques années une base extraordinairement riche et importante de connaissance et d’information. Le web ne pour- rait en aucun cas être ignoré par ces professionnels, tant il fait désormais partie des points d’accès incontournables à tous types d’information. Bien entendu, cette richesse et cette diversité au ni- veau de la quantité et de la qualité, comportent leur part de dangers et de dérives qu’il faut pouvoir identifier et éviter. L’évaluation de la qualité de l’information est un des processus qui exige, de la part des professionnels, une construction de filtres de vérification et de précaution nécessaires pour mobiliser utilement le web sans tomber dans ces pièges. Dès lors que le professionnel ac- cède à une information, il déploie un arsenal plus ou moins formalisé de stratégies d’évaluation de la qualité, qui lui permet de prendre une décision : l’intégration ou non de cette information dans son travail. Ici, la sélection de l’information, et avec elle celle de la source, est considérée comme l’aboutissement de ce processus d’évaluation de la qualité. Cet aspect du travail des spé- cialistes de l’information a déjà fait l’objet d’une grande attention tant dans la sphère académique que dans la sphère professionnelle. Depuis plus de 10 ans, des livres, des manuels, des articles, mais aussi des cours ou des formations, sont créés pour former et sensibiliser au mieux tout type de public aux stratégies d’évaluation de la qualité de l’information issue des sources en ligne. Ces travaux proposent un large choix de critères, de conseils et d’astuces pour guider ces démarches.
Les travaux et les connaissances sur l’évaluation de la qualité de l’information ont été déve- loppés dans un contexte et pour des genres 8 de source répondant à une série de caractéristiques techniques et d’usage spécifiques. Au moment de leur élaboration, principalement à la fin des an- nées nonante, l’objectif consistait à aider les individus à adapter leurs habitudes d’évaluation à un nouveau genre, dont les modalités de production ne leur étaient pas familières : les pages web.
Alors qu’ils travaillaient volontiers avec des supports comme les livres, les revues ou la presse, ils
8. Je reviendrai plus loin sur la notion de genre. A ce stade, notons qu’elle est préférée à la notion de format ou de
type de source.
Inscrire la question de recherche dans une problématique
accédaient à un ensemble de ressources radicalement différentes. C’est précisément pour faire face à cette nouvelle réalité que se sont développées les initiatives de formalisation des processus d’évaluation de la qualité des sources en ligne.
Peu à peu, le paysage informationnel en ligne s’est enrichi d’une part de plus en plus impor- tante de ce contenu et de ces sources d’un genre nouveau. Ce qui, au départ, n’était considéré que comme une mode (un hype) réservée aux plus assidus des utilisateurs du web, a pris une am- pleur telle qu’il n’a plus été possible de négliger cette évolution du paysage informationnel sans se priver d’une part importante de contenu critique. Tout comme dans les années nonante, lors de l’adoption initiale du web par les organisations pour accéder à des sources d’information, la transformation en cours a fini par prendre une telle ampleur qu’elle ne pourrait être négligée sans exposer les organisations à de grands risques de perte d’avantages compétitifs. 9 Cette tendance n’est pas forcément facile à nommer. Parmi les étiquettes les plus communes, citons le Web 2.0, les médias sociaux, le web collaboratif ou le web social. Dans le cadre de cette thèse c’est l’étiquette
"Web 2.0" qui est utilisée pour désigner l’apparition de ces nouveaux genres. Au fond les blogs, les wikis, les sites de réseaux sociaux etc. ne sont, en théorie, que des outils de création de contenu qui permettent à n’importe quel individu ou groupe de devenir un auteur sur le web, et ce facilement et pour des coûts très bas, contribuant ainsi aux flux d’information disponibles. Les consomma- teurs et les clients d’une organisation sont désormais en mesure de partager leurs expériences et leurs opinions, bonnes ou mauvaises, à propos de ces produits et services. A peine les sources web classiques sont-elles entrées dans les moeurs de la GI, que de nouveaux types contenus semblent venir tout bouleverser.
Dès lors qu’une part croissante du contenu qui est produit sur le web ne correspond plus aux spécificités de production sur base desquelles ont été formalisées les aides à l’élaboration de stra- tégies d’évaluation de la qualité de l’information, de nouveaux défis apparaissent [103]. Cette si- tuation différente implique-telle un changement pour les professionnels ? Les stratégies d’évalua- tion de la qualité de l’information sont-elles remises en cause ? Jusqu’à quel point peuvent elles être mobilisées pour traiter ces nouveaux types de contenu ? Dès lors qu’elles seraient remises en cause, quelle alternative pour les internautes en général et pour les professionnels de l’information en particulier ? Et plus encore, l’évolution du paysage informationnel implique-t-elle nécessaire- ment une remise en cause des stratégies d’évaluation de la qualité de l’information ?
Ce sont autant de questions qu’il semble judicieux de se poser et auxquelles cette recherche propose d’apporter des éléments de réponse. L’enjeu est de taille, tant pour les professionnels que pour les chercheurs, dans la mesure où ces genres de sources sont susceptibles de provoquer des changements jusque dans la façon dont est construite la perception du paysage informationnel.
Par cette thèse j’ai l’ambition, non pas de rétablir un quelconque équilibre dans la recherche sur ce domaine, mais plutôt de tenter d’identifier les forces en présence et leurs interactions afin de faire la lumière sur les processus. C’est en poursuivant cet objectif que j’entends participer à une compréhension fine et nuancée de cette problématique.
L’objectif de cette recherche consiste à répondre à la question suivante :
Dans quelle mesure les spécialistes de l’information dans les organisations développent-ils des stratégies spécifiques d’évaluation de qualité de l’information sur les genres de sources issus de ce qu’on appelle communément le Web 2.0, qui se distinguent des stratégies utilisées pour les genres classiques de sources en ligne ?
Je formule la question de recherche de manière volontairement générale. Les éléments clés qui la composent auraient pu être formulés de manière plus spécifique ou plus pointue. Néanmoins, comme le montreront les sections suivantes de cette introduction, ce sujet de recherche est trop complexe pour être enfermé par des formulations trop précises.
9. Bien sûr, un grand nombre d’entreprises n’est pas concerné par cette évolution des sources en lignes, néanmoins,
suffisamment le sont pour justifier l’importance de cette problématique.
Par exemple, en choisissant le terme de veilleurs, plutôt que de spécialistes de l’information, une part capitale des dimensions de la gestion de l’information, le métier au coeur de cette recherche, aurait été négligée. De même, en utilisant les termes gestionnaires d’information, ou encore profes- sionnels de la gestion de l’information, la question n’aurait pas rendu compte de la diversité des profils de professionnels concernés par la problématique et ses enjeux. La conceptualisation de la gestion de l’information, qui a guidé le recrutement des professionnels interrogés, a mis en évi- dence le fait que le profil de spécialiste de l’information n’est pas forcément cantonné aux seuls titres liés à la gestion de l’information, tels que veilleur ou responsable d’intelligence économique par exemple. On comprend donc l’utilité de ne pas limiter le champ de la recherche à un stade aussi précoce de sa présentation. Du reste, il n’est pas rare de trouver dans la littérature des re- cours à la formulation information specialists qui couvre à la fois les membres de l’organisation assignés à des tâches de gestion de l’information, des professionnels de l’information comme les documentalistes et des consultants externes à qui l’on confierait ce genre de tâches [84].
Il en va de même pour le fait de recourir à une périphrase telle que ce qu’on appelle commu- nément le Web 2.0. De la sorte, j’indique clairement au lecteur le contexte dans lequel s’inscrit la question de recherche tout en marquant des réserves sur sa dénomination. Ne pas prendre cette précaution impliquerait de poser le Web 2.0 comme un concept aux contours bien définis, ce qui est loin d’être le cas. La notion de genres permet quant à elle de ne pas entrer à un stade aussi précoce dans des considérations techniques sur les formats de sources impliqués ou encore de les lister, ce qui rendrait la question indigeste. En revanche, son utilisation, couplée avec l’idée de création de sens et celle d’un jugement de qualité, implique dès le départ une inscription de la question de recherche dans une approche mettant l’acteur de la GI au centre de l’attention.
Cette question de recherche est formulée de telle sorte qu’elle puisse guider et structurer l’en- semble de ce travail, mais de même que le choix des termes indique déjà quelques décisions de ma part. Sa formulation implique un certain nombre de présupposés. Combinés, ces derniers per- mettent de formuler la thèse que j’entends soutenir :
Les modalités de création de contenu, les outils, les pratiques et les tendances issus de ce qu’on appelle communément Web 2.0 induisent un accroissement d’ambiguïté qui entrave la création de sens et qui pousse les spécialistes de l’information dans les organisations à adapter leurs stratégies de construction de jugement de la crédibilité et de la qualité de l’information en ligne, de manière à tenir compte des spécificités du paysage informationnel en transformation.
Ces affirmations apportent une précision importante au sujet de la démarche intellectuelle qui anime cette recherche. Le Web 2.0 en tant que tel reste une notion très large. Il est donc ques- tion de l’aborder en termes de différence entre les genres. Mais cela n’exclut en rien le besoin d’en approcher les tendances de fond pour bien le comprendre. Parmi celles-ci, notons l’importance croissante que prend l’utilisateur, qui dispose désormais des outils et des ressources pour produire un contenu susceptible d’être important pour les spécialistes de l’information dans les organisa- tions. Je m’inscris dans la position de Slater qui soutient l’idée selon laquelle le user-generated content 10 constitue, pour ces professionnels, un potentiel non négligeable de redéfinir leur rôle et l’importance de celui-ci dans l’arsenal stratégique des organisations [261].
Dans le cadre de cette recherche, le problème central reste celui de l’évaluation de la qualité du contenu en ligne en tentant de déterminer si les genres typiques de ce qu’on appelle le Web 2.0 requièrent une adaptation des stratégies d’évaluation de la qualité de l’information qui ont été développées initialement pour les genres classiques des sources en ligne. 11 Poser la question de l’évaluation de la qualité du contenu issu estampillé Web 2.0, c’est nécessairement considérer qu’il existe une différence avec le contenu qui ne l’est pas. La question de recherche et la problématique sous-tendent l’idée que les stratégies d’évaluation ne sont sans doute pas identiques. D’où le re-
10. UGC : le contenu produit par les utilisateurs, les profanes.
11. On parlera dans cette thèse du web classique ou du web traditionnel. Le chapitre 3 abordera plus en détails ce
thème et notamment la raison pour laquelle on ne parle pas de Web 1.0.
Inscrire la question de recherche dans une problématique
cours à la notion de genre plutôt que celle de format. Comme je le détaillerai plus loin, ce concept emprunté aux approches cognitives implique les notions de familiarité et de différenciation entre ces genres. Combinées, ces dernières permettent d’introduire ici l’idée selon laquelle un contenu dont on ne comprend pas les modalités de production pose plus de problème pour en évaluer la qualité. Le concept de genre peut être qualifié de constructiviste. Il est d’abord construit par l’in- dividu qui s’appuie ensuite sur cette construction pour guider son rapport aux messages. De la sorte, le concept de genre permet de différencier l’interprétation de l’évaluation. Dans un premier temps, le genre est interprété afin d’être construit, et cette construction affecte dans un second temps l’évaluation. Si la thèse selon laquelle de nouveaux genres de sources en ligne nécessitent une adaptation des stratégies d’évaluation peut être soutenue, cette nuance sera très utile pour distinguer la nature du changement perçu et les raisons de ce changement. On comprend bien l’utilité de pouvoir différencier l’interprétation (qui aide à construire le genre) de l’évaluation de l’information à proprement parler.
C’est ce que j’appelle dans ma formulation l’ambiguïté. 12 Perdant une part de contrôle et du sens qu’il perçoit à propos de son paysage informationnel, l’individu est entravé dans sa capa- cité à poser un jugement. Il ne s’agit pas ici de prétendre que le contenu issu du Web 2.0 plonge les spécialistes de l’information dans un brouillard insondable mais plutôt de mettre en évidence l’in- confort que provoque cette ambiguïté et surtout la nécessité de le réduire. Dans un autre contexte et à une autre époque, Dermer pointait déjà l’intolérance des individus à l’ambiguïté [104], où l’ambiguïté est considérée comme l’incertitude quant au sens, à la situation. 13 Et il ajoute que cette ambiguïté est considérée comme une menace, ce qui les pousse à agir de manière à la ré- duire. Dès lors, si les stratégies habituelles ne conviennent plus, poser la question de recherche de cette manière présuppose le besoin d’une adaptation, d’un changement de ces stratégies pour revenir à un état de confiance, de confort par rapport à ces stratégies. Le Men parle de perte de repères en raison du fait que le processus d’évaluation est lui-même remis en cause [217] et Ed- munds et Morris parlent d’un stress provenant d’un manque de contrôle. Plus que le Web 2.0 ou l’évaluation de la qualité de l’information, c’est la réduction de cette ambiguïté (de cet inconfort) par l’adaptation des stratégies qui est au centre de cette recherche.
Néanmoins, il serait risqué de l’inscrire dans un schéma de rupture, de cassure nette, entre deux modèles, deux époques ou deux traditions. Poser cette question et soutenir cette thèse n’im- plique pas forcément de parler en termes absolus. Il n’est pas question ici de supposer la dispa- rition du contenu "classique" sur internet. Il existe des genres de sources en ligne qui ne sont pas produits selon les modalités ou avec les outils du Web 2.0. C’est pour cela que je parle de l’évolution du paysage informationnel plutôt que d’un bouleversement. Cette idée de révolution–
évolution–transformation est par exemple décrite par Loup Francart [124] qui parle d’un "déve- loppement des technologies de l’information et ses conséquences sur la société". Cette formula- tion a le mérite d’inclure les technologies de l’information et de prendre en compte leur portée sur toute la société. Olson, dans le contexte de l’évolution technologique des systèmes d’informa- tion, parle pour sa part de "processus d’évolution continu", où les innovations rendent obsolète tout nouveau système déployé [228]. Par ailleurs, Francart ajoute que ce processus s’est accen- tué avec le développement d’internet. L’important est ici de comprendre les conséquences de ces changements dûs aux technologies. Si à bien des égards, une telle approche doit être nuancée, elle s’inscrit malgré tout dans un cadre de réflexion pertinent au sujet du rôle de l’information. L’idée majeure consiste à considérer que l’environnement d’un individu, d’une entreprise ou d’un pays, dépasse largement les frontières physiques et temporelles habituelles. Ceci ouvre une perspec- tive sur la nouvelle complexité des interactions entre chaque élément et le monde qui l’entoure.
Néanmoins, il faut garder à l’esprit que c’est l’individu créateur de sens en vue de l’action qui est au centre de mon attention.
12. Cette dernière est très proche de celle d’incertitude qui est un concept central dans cette recherche.
13. Il emprunte ce concept au domaine de la psychologie cognitive.
Vers un cadre conceptuel cohérent
A partir de la description de la problématique et de la question de recherche qui précèdent, le besoin d’un cadre conceptuel se fait sentir. Les pages et les chapitres qui suivent ont pour ob- jectif de le construire méthodiquement, faisant peu à peu la lumière sur chacun des aspects qui composent l’essence de cette recherche. Cette construction est accompagnée d’illustrations qui lui donnent une vue d’ensemble à la fois sur les étapes parcourues et sur les acquis de chacune d’elles. Suivant la mise en contexte initiale de la thèse, le cadre conceptuel à construire peut être représenté comme le montre la figure 1.
SPÉCIALISTE DE L'INFORMATION DANS LES ORGANISATIONS
Cadre théorique
Partie I
GESTION DE L'INFORMATION ORGANISATION
Chapitre 1
EVALUATION DE LA QUALITÉ DE L'INFORMATION SPÉCIALISTE DE LA GI
Chapitre 2 TRANSFORMATION
DU PAYSAGE INFORMATIONNEL SOURCES EN LIGNE
Chapitre 3