1.4 La simplification de textes
2.1.2 Sources
2.1.2.1 CISMeF
CISMeF
1(Darmoni et al., 1999) signifie Catalogue et Index des Sites Médicaux de langue
Française. Ce projet a été lancé en 1995, par le Centre Hospitalier-Universitaire (CHU) de
Rouen.
Fig. 2.1 – Page d’accueil du CISMeF : formulaire de requêtes
Comme son nom l’indique, ce portail indexe les sites et documents médicaux français à partir
du lexique que propose le thésaurus MeSH (NLM, 2001). Le but du CISMeF, tel que spécifié
sur sa page d’accueil, est de « faciliter l’accès à l’information de santé pour les professionnels,
mais aussi les patients et le grand public, en recensant les sites et documents médicaux présents
sur l’Internet répondant à certains critères de qualité ». Cette phrase
2qui décrit la mission du
CISMeF met en évidence quelques éléments de base qui rejoignent les principes établis pour la
conception de notre corpus, à savoir une typologie ou catégorisation des textes axée sur le type
d’audience visée, la thématique abordée par les différents textes, notamment la médecine, et la
fiabilité des informations diffusées. En effet, la phrase ci-dessus stipule clairement que les sites
et textes proposés par le CISMeF touchent différentes audiences, en l’occurrence les experts
et le grand public ; qu’ils concernent le domaine médical, et qu’ils sont soumis à une étape
de validation qui permet d’évaluer la qualité de l’information diffusée, ainsi que leur degré de
fiabilité. Darmoniet al. (1999) l’attestent en ces termes : « CISMeF respecte le référentiel des
critères de qualité de l’information de santé sur l’Internet (Net Scoring), élaboré en collaboration
avec Centrale santé et APUI-Santé ».
La typologie des textes du CISMeF et surtout la rigueur du processus de sélection des sites et
textes à indexer favorisent leur utilisation, non seulement par les publics visés, mais également
par les chercheurs (Grabaret al., 2002, 2003 ; Chebilet al., 2014 ; Névéol et al., 2014 ; Cabot
et al., 2016), et bien évidemment motivent notre choix de nous servir du portail CISMeF.
Le portail CISMeF classifie les pages Web et les documents indexés selon trois axes :
1. « la médecine factuelle » : cet axe concerne les professionnels de la santé et propose des
recommandations pour la bonne pratique clinique, ainsi que des conférences de consensus.
2. « les ressources concernant l’enseignement » : elles contiennent des documents à caractère
didactique, ainsi que des épreuves classantes nationales.
3. « les documents spécialement adressés aux patients et au grand public », dont le but est
de favoriser l’amélioration de l’éducation sanitaire dans les pays francophones.
Tel qu’on peut l’observer à travers les zones mises en évidences sur le formulaire de requête
de la page d’accueil du portail CISMeF (cf. figure 2.1), les requêtes peuvent se faire par ordre
alphabétique
3. La base de données CISMeF peut également être interrogée par thématiques
(pathologies, traitement, médicaments, etc.). Ces thématiques permettent de recupérer des
textes qui touchent différentes spécialités
4de la médecine : cardiologie, pédiatrie, chirurgie,
dermatologie, gynécologie, médecine générale, médecine palliative, etc. C’est de cette manière
que nous avons procédé lors de la collection des textes que comportent les différents corpus.
Les requêtes formulées avaient pour mots-clés les noms des différents axes ou catégories de
2. http ://www.chu-rouen.fr/cismef/Aide/
3. Index consultable via le lien suivant : http ://www.chu-rouen.fr/page/index/
4. CISMeF couvre une longue liste de spécialités, liste consultable via le lien suivant : http ://www.chu-rouen.fr/ssf/santspe.html
la terminologie médicale Snomed International (cf. section 2.2.2) utilisée dans ce travail. En
procédant de cette façon, nous voulions nous assurer que les thématiques couvertes par notre
corpus étaient autant que possible en accord avec les termes de la ressource Snomed, ceci dans
le but de favoriser l’obtention de résultats positifs lors de l’appariement entre le corpus et la
ressource médicale (cf. chapitre 3, section 3.2.2). L’éventail de thématiques considéré nous
permettra d’avoir une couverture relativement large du domaine médical.
Les requêtes peuvent être affinées par le choix du type de public que visent les textes souhaités ;
trois options sont proposées : recommandations professionnelles, documents d’enseignement,
documents grand public. Il en ressort que la constitution de notre corpus n’était pas focalisée sur
des spécialités ou domaines médicaux particuliers mais d’avance autour de certaines thématiques
comme celles mentionnées ci-dessus. Les requêtes faites sur CISMeF ne visaient pas une liste
de thématiques particulières.
Les différentes propriétés du portail CISMeF ici décrites nous ont permis d’acceder aisément
aux textes qui constituent les trois premières parties du corpus : corpus des experts, corpus des
étudiants et corpus des patients.
2.1.2.2 Les forums médicaux : Doctissimo
Doctissimo.fr
5est une plateforme médicale qui appartient au groupe Lagardère Active
6. Elle a
été créée en mai 2000, et est dédiée au bien-être et à la santé. Doctissimo est un réseau social
ouvert au grand public, à qui il offre divers services et ressources médicales : une encyclopédie
médicale, un dictionnaire médical, un atlas du corps humain, un guide des médicaments, un
guide des examens de laboratoire, des forums de discussion. La figure 2.2 présente quelques
sujets abordés sur les forums de Doctissimo.
Fig. 2.2– Quelques sujets abordés sur les forums doctissimo.
Les forums de discussion Doctissimo se veulent un espace d’écoute et de dialogue, où les
5. http ://www.doctissimo.fr/
participants peuvent s’exprimer anonymement et en toute confiance, afin de bénéficier en retour
de l’expérience des autres internautes sur les questions qui les intéressent. Les thématiques
abordées sur ces plateformes tournent autour du domaine de la santé et touchent différentes
spécialités de la médecine : médicament, maladie, procédure médicale, grossesse, nutrition,
sexualité, enfant, psychologie, et bien d’autres. Ces thèmes rejoignent ceux que contiennent
les corpus collectés à travers le portail CISMeF, ce qui nous offre la possibilité de croiser les
données qui seront extraites de part et d’autre.
Dans le document
Analyse contrastive des verbes dans des corpus médicaux et création d’une ressource verbale de simplification de textes
(Page 66-69)