• Aucun résultat trouvé

TROISIEME PARTIE Evolutions possibles du DPM

4.2 Diffusion du modèle de Swanson

Nous avons montré qu’il existe un certain nombre de travaux inspirés du modèle et/ou des exemples de Don Swanson (une quinzaine d’articles dans les sciences du vivant à notre connaissance). Pratiquement tous les travaux de génération d’hypothèse dans le domaine biomédical sont basé sur la mise en lumière de structures complémentaires et disjointes par l’exploitation de la littérature [Cohen, 2005]. La croissance du volume de données, qu’elles soient bibliographiques, génomiques ou protéomiques nous laisse imaginer que d’importantes découvertes sont masquées par l’explosion de la quantité d’information. Cependant, les systèmes de KDD ne font pas encore partie des outils standards des biologistes. Cohen avance le fait que ces outils doivent être encore améliorés, tant en terme de performance (volume de données, information de natures différentes) que d’évaluation des résultats produits.

Le travail de Swanson fut accueilli de différentes manières, selon que l’on se place du côté des sciences de l’information ou du côtés des sciences du vivant. Spasser a publié une analyse des citations des travaux de Swanson afin de suivre comment ses idées ont été perçues par la communauté scientifique [Spasser,

1997]. Il a ainsi relevé 21 articles en sciences de l’information et 12 en sciences de la vie.

En sciences de l’information, les auteurs considèrent la méthode et les techniques employées, les hypothèses médicales générées étant pour eux des illustrations de sa méthode. Ils ne discutent pas l’existence du savoir public caché, c’est pour eux un fait établi. Tout comme la possibilité de générer de nouvelles connaissances par l’usage ingénieux de systèmes d’information. Le savoir implicite soutenu par des informations disjointe est une réalité – que tout professionnel de l’information pratiquant la recherche non booléenne connaît. Certains auteurs mettent en avant le rôle du professionnel de l’information spécialisé dans le domaine biomédical et le qualifient de fondamental dans la création de nouvelles connaissances [Schell, 1992]. Le documentaliste biomédical – medical librarian – est dans une position unique pour identifier les connections logiques entre des littératures non interactives. Ils peuvent jouer un rôle dynamique dans l’exploration de la littérature et donc influencer l’orientation des recherches dans le cadre de la découverte de connaissance. Dans les sciences de la vie, Spasser montre que, de manière attendue, les auteurs s’intéressent aux hypothèses formulées plutôt qu’à la méthode. Leurs discours à l’égard des hypothèses est plutôt négatif et condescendant, bien qu’ils s’en servent pour étayer leurs argumentaires. Dans ce cas, les hypothèses de Swanson sont en attente de vraies validations scientifiques. Selon Spasser les normes de la recherche biomédicale traditionnelle sont en désaccord avec la recherche basée sur la littérature proposé par Swanson. Le but de la recherche scientifique est de prédire et de contrôler, pas de comprendre le fruit de découvertes inattendues ; elle est orientée vers la vérification plutôt que vers la découverte ; son approche est concentrée sur les particularités au lieu d’être ouverte sur une appréhension globale des problèmes ou des questions. Spasser termine ainsi : "… finally, its ethos is originality and priority, not synthesis and bridge-building". Il ne voit rien d’étonnant à ce que les chercheurs des sciences de la vie soient peu disposés à considérer une méthode exploratoire qui ne peut être testée de manière empirique ou quantitative.

Dans quelques cas, les travaux de Swanson ne font pas l’objet d’une rhétorique négative : les auteurs utilisent alors les articles de Swanson pour mentionner une relation ou un fait établi de manière empirique.

En conclusion de son papier Spasser souligne que bien qu’utile à la recherche biomédicale et particulièrement intéressant, le concept de savoir public caché ainsi que la méthode pour le mettre en lumière demeurent largement inconnu des chercheurs. En conséquence, il représente lui-même un savoir public caché.

Depuis 1997, date à laquelle fut publié l’article de Spasser, quelques papiers associant spécialistes des "deux bords" - sciences de l’information et sciences du vivant – ont été publiés49 : outre Swanson et Smalheiser, citons Weeber et Molema [Weeber, 2003], Persidis et Deftereos [Persidis, 2004], Wren et Bekeredjian [Wren, 2004b], sans oublier notre propre contribution [Pierret, 2005].

Pour l’anecdote, un papier paru en 2004 mentionne l’article de Spasser [Spasser, 1997], le décrivant comme une analyse de l’exploitation des littératures disjointes afin d’en faire émerger le savoir public caché, sans mentionner le nom de Swanson dans ce contexte [Abbott, 2004]

49 Par simplification pour chaque article cité, nous mentionnons le premier auteur en science

l’information, puis le premier auteur en sciences du vivant.

0 5 10 15 20 25 30 35 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 Nb de c itations

Figure 19 : Suivi des citations des articles publiés par Swanson sur sa méthode ou sur ses hypothèses

La figure 19 illustre l’évolution des citations au cours du temps des articles publiés par Don Swanson sur sa méthode ou sur ses hypothèses. Il a été réalisé le 21 septembre 2005 a partir de l’interrogation de SciSearch et de Social SciSearch sur le serveur DataStar, en éliminant les autocitations provenant de Swanson ou de Smalheiser. La tendance générale est que ses écrits suscitent de plus en plus l’attention des chercheurs.

L’interrogation a été conduite à partir des citations des 16 articles suivants : [Swanson, 1990a], [Swanson, 1990b], [Swanson, 1989b], [Swanson, 1989a], [Swanson, 1988], [Swanson, 1986a], [Swanson, 1987], [Swanson, 1986b], [Swanson, 1997], [Swanson, 1999], [Swanson, 2001b], [Smalheiser, 1998a], [Smalheiser, 1998b], [Smalheiser, 1996b], [Smalheiser, 1996a] et [Smalheiser, 1994].