• Aucun résultat trouvé

Marloweb : la logique de l’enquête collective

Dans le document Le travail scientifique Interdisciplinaire (Page 51-58)

Chapitre 1 : sociologie de l’interdisciplinarité

B. Marloweb : la logique de l’enquête collective

Expliciter les raisons pour lesquelles on pense ce que l’on pense. Cette maxime pragmatique, largement exposé par exemple par William James mais aussi par Dewey, pourrait être considéré comme un objectif du logiciel Marlowe, entité à l’origine de Marloweb. Ce « sociologue électronique », comme se plaisent à le nommer ses auteurs, utilise Prospéro pour répondre à des requêtes du chercheur rédigées en langage naturel.

L’idée des auteurs est multiple. D’une part, il s’agit de créer « une machine peut-elle coopérer en

croisant la forme particulière d’intelligence dont elle est dotée avec celle du chercheur, afin de produire des expériences de pensée intéressantes pour une démarche sociologique » (Chateauraynaud, 2003b). Pour ce faire, le programme fonctionne sur l’idée d’un dialogue qui, comme dans la tradition socratique, permet le raisonnement. Tout comme Prospéro, ce n’est donc pas un outil qui administre la preuve, mais un dispositif qui invite à faire des recoupements, qui engage la connaissance que le sociologue a pu se construire sur le dossier, les éléments contenus dans le corpus, des informations stockées dans la machine qui proviennent soit d’une « culture » que les différents chercheurs ont pu déposer sciemment, soit des dialogues antérieurs (on peut, à ce titre, parler d’une forme d’apprentissage), soit des calculs réalisés selon des algorithmes. D’autre part, l’ensemble des interrogations avec leurs échecs mais aussi avec les pistes, les bifurcations et autres perspectives est enregistré. Ainsi, la lecture d’un dialogue finit-elle par présenter une traçabilité d’un raisonnement qui répond intrinsèquement à la posture pragmatique : expliciter les raisons pour

Le résultat est souvent impressionnant, notamment en raison de la rapidité du traitement qui donne l’illusion d’un dialogue entre deux humains24. A titre d’exemple, on peut se reporter à cet échange fondé sur le corpus des programmes présidentielles en 2007 et qui avait beaucoup circulé lors des élections : http://prospero.dyndns.org:9673/prospero/echiquier_pol

C’est une version moins spectaculaire puisque la discussion se réalise par courriel. Nous avons installé sur un serveur une plateforme qui, via une interface présente l’ensemble des corpus disponibles.

Ces derniers ont été déposés par un chercheur qui considère :

- que son corpus est cohérent, c'est-à-dire qu’il est à la fois exhaustif du point de vue des critères qu’il juge pertinent, qu’il représente un espace de variation pertinent et qu’il est propre au sens informatique (les champs titre, auteur et date ont été renseignés, les caractères spéciaux ont été nettoyés…).

- qu’il a produit une série de dictionnaires et de concepts indexant correctement le corpus et adéquat à une analyse donnée qu’il s’agit d’expliciter. Cela suppose que le dépositaire d’un corpus a pu produire une série d’analyses intéressantes.

- qu’il peut intéresser les autres chercheurs qui partagent ses préoccupations.

Ce dernier point est central dans le cadre d’un travail collectif comme celui de ce projet. Contrairement à la plateforme Bach, qui consistait à échanger des textes ou des corpus « bruts », il s’agit ici d’échanger des corpus indexés et analysés.

C’est donc des raisonnements qui visent ici à être partagés soit pour rechercher des informations, soit faire des expériences sur différents corpus, soit pour systématiser une approche comparative. Illustrons notre propos concernant les possibilités d’enquêter sur un corpus distant. Une équipe de chercheurs a étudié l’ensemble les résumés de l’ACAPS25 et a publié sur cette étude (Delalandre, 2009). Sur sa machine (en fait, on préfère utiliser un autre PC pour cela car les calculs prennent beaucoup de ressources), il met à disposition son corpus à toutes les personnes du projet :

Un autre chercheur a envoyé une requête, via l’interface présentée plus haut, en spécifiant deux demandes sur un corpus qui n’est pas le sien (il s’agit ici d’un corpus sur) : l’une sur les croisements entre Psychologie et Neurosciences, l’autre sur la collection des disciplines scientifiques. Le serveur sur lequel tourne l’application a réveillé la machine sur laquelle se trouve le corpus partagé qui l’a chargé en mémoire puis interrogé via une version de Marlowe. Les résultats ont été stocké en mémoire (il s’agit en effet de garder une trace du cheminement) et envoyé à l’auteur de la requête par mail. Voici ce qu’il a reçu quelques minutes plus tard :

Ce mail contient des informations qui lui permettent de poursuivre son travail en utilisant le corpus partagé. Pas réellement de calculs. Une simple série de données, d’énoncés qui peuvent suffire à poursuivre l’enquête, soit sur son propre corpus, soit sur celui-ci en créant une nouvelle requête, soit sur d’autres corpus distants.

Mais l’on peut également s’entendre sur des raisonnements et enrichir les algorithmes des différentes instances de Marlowe comme le montre le cheminement suivant :

Nous avons signalé, dans notre revue de littérature, que le travail interdisciplinaire était particulièrement célébré chez certains auteurs, au point de soupçonner qu’il puisse être considéré comme un « bien en soi » pour reprendre le concept de Nicolas Dodier :

Une hypothèse centrale organise notre approche qui met l’accent sur l’ancrage moral du travail politique26. Nous considérons que celui-ci, pour une part, à établir des pouvoirs légitimes au carrefour des quelques biens en soi qui cristallisent l’attention des acteurs dans une période historique donnée. Les biens en soi désignent des objectifs que l’on estime dignes d’être poursuivi en tant que tels. […] Les acteurs légitiment ou mettent en cause les pouvoirs conférés aux instances au regard d’un certain nombre de biens en soi. Notion destinée à rendre compte du fait que les acteurs se sont cristallisés, dans leurs prises de position, sur un certain nombre d’objectifs auxquels ils ont en quelque sorte accordé une dignité particulière. Et nous faisons l’hypothèse qu’il est possible d’en établir la liste (Dodier, 2003, pp. 19-21)

On peut donc écrire un script qui prend en compte les contraintes posées par ce sociologue pour déterminer l’ensemble des biens en soi et voir si une figure particulière de l’activité scientifique – par exemple l’interdisciplinarité ou au contraire une discipline – vérifient l’ensemble de ces conditions.

Ci-dessus, on peut lire quelques capteurs pour saisir les entités qui tombent dans des séquences comme « espoir(s) » de X », « attachement à X »… De même, on peut expliciter les façons dont se partagent des entités. Croiser d’autres façons de recenser ce qu’il faut faire et chercher des mots d’ordre. Si cette requête n’a pas donné de résultats positifs (aucune forme de travail scientifique, aucune défense disciplinaire ne passe l’ensemble des critères), ce qui est en soi un résultat, la machine peut expliciter son algorithme en langue naturelle. Il nous semble en effet que l’on peut à la fois tenir l’exigence académique d’une description des opérations de calcul réalisées et défendre la langue :

Qu’il s’agisse de recherche de présence, de connections, de formes particulières ou de contraintes plus ou moins complexes qui engagent des calculs, l’idée est donc de pouvoir disposer des corpus des collègues qui partagent des préoccupations et des métrologies pour répondre ponctuellement à des interrogations mais aussi de systématiser une démarche comparative.

A ce jour, elle est possible manuellement. On peut sélectionner plusieurs corpus en envoyant la requête. On peut par exemple, demander le poids d’une catégorie de marqueurs déontiques et le volume du corpus pour évaluer un taux de normativité dans tous les corpus. Une perspective intéressante qui fera l’objet d’une nouvelle demande de financement par l’ANR consiste à envisager d’automatiser ces opérations en confiant à un automate le soin de travailler la nuit, pour mieux répartir la charge de calcul, et comparer systématiquement des indices sur l’ensemble des corpus partagés

Dans le document Le travail scientifique Interdisciplinaire (Page 51-58)