• Aucun résultat trouvé

1. Les applications du text-mining

1.3. Les applications du text mining en psychiatrie

1.3.2. Les applications du text mining à la psychiatrie

L analyse manuelle du contenu des documents permet de les regrouper par type de donnée. Cette analyse est complémentaire à l analyse automatique du contenu des résumés portant un point de vue différent sur les données suite à la lecture de l intégralité des articles.

Quatre thèmes principaux ont été identifiés dans les 38 études inclues :

(1) Psychopathologie (à savoir l'étude des troubles mentaux ou détresse mentale) ;

(2) la perspective du patient (sentiments et comportements),

(3) Les dossiers médicaux (questions de sécurité, la qualité des soins, la description des

traitements) ;

(4) Littérature médicale (ontologie - termes de cartographie avec concepts spécifiques

à un domaine, ou biomarqueurs ; déterminer la ligne principale de chaque scientifique de l enquête ; découvrir des thèmes cachés pour les divisions thématiques dans le domaine).

Le détail de ces quatre applications inclue l objectif de chaque étude, les informations extraites (maladies, symptômes, mots) et la source analysée (entrevues, Internet,

enregistrements médicaux, littérature) en Appendices A1 - A6 .

1.3.2.1. La perspective du patient durant des entrevues

Dans ces documents, le contenu analysé comprend des observations écrites et des

récits des patients. Les réponses des participants ont été recueillies à partir des entrevues et

des questionnaires d'autoévaluation.

Six études ont utilisé le TM pour identifier les caractéristiques sémantiques spécifiques

à un état psychologique et à une maladie (Table A3). Deux études ont comparé les caractéristiques linguistiques lors d entretiens entre les sujets normaux et les patients atteints

30 de troubles du spectre autistique en utilisant des méthodes statistiques supervisées et non supervisées (21,22). L influence de l état d anxiété a été examinée sur le statut de maladie, sur les émotions exprimées et les comportements lors d entrevues suite à un évènement stressant (examens). Les inquiétudes et les angoisses relatives à la condition du patient ont

été extraites en utilisant des modèles de classification. Les facteurs prédictifs de risque de

suicide en Chine ont été explorés à partir de l analyse des mots utilisés dans les notes de suicide (23). Enfin, l'impact de l'emprisonnement sur l'état psychologique des détenus a été étudié en France en utilisant des modèles de classification à partir d entretiens (24).

Les caractéristiques sémantiques spécifiques à l autisme, l anxiété, ou encore l impact de l emprisonnement, et les mots choisis par des personnes suicidaires ont été étudiées pour extraire des facteurs relatifs à l état psychologique des patients à travers le langage.

1.3.2.2. Le ressenti du patient exprimé sur Internet

Ce thème concerne les pensées, les sentiments et les comportements des patients

décrits sur Internet. Les réseaux sociaux, forums, blogs contiennent des informations portant

sur le ressenti des patients vis-à-vis de leur condition (25). Un nombre croissant de patients

interagissent en ligne et partagent leur expérience sur la maladie et les thérapies (26). Les

patients envoient des messages à des groupes de discussion sur les sites Web et réseaux

sociaux. Le contenu de ces messages est analysé, représentant le point de vue du patient.

Huit études ont exploré les expériences exprimées par les patients dans leurs

messages au sujet de leur rétablissement, des événements négatifs de la vie, des symptômes

et le comportement addictif (Table A4 . Trois études ont évalué les événements négatifs,

stressants de la vie décrite par les internautes sur un site en ligne dédié à la santé mentale.

31 associations entre les événements et les épisodes dépressifs (27). Deux études ont mené une

enquête plus approfondie pour détecter automatiquement les symptômes dépressifs à partir

du contenu des questions abordées par les internautes sur Mentalhelp.net et PsychPark.org

(28,29). De plus, le rétablissement des victimes de désordres alimentaires a été examiné à

partir des mots utilisés pour décrire le ressenti au cours des étapes du processus (30). La

détection du langage naturel à travers les textes est complexe sur Internet. En effet, la langue

est fragmentaire, avec des erreurs typographiques, sans ponctuation, et parfois incohérente

(31).

Lanalyse des messages sur Internet permet d étudier les inquiétudes des patients dépressifs, les évènements négatifs et stressants impactant l état psychologique ainsi que les mots de soutien utilisés dans le processus de rétablissement des personnes souffrants de

troubles alimentaires.

1.3.2.3. Le contenu des dossiers médicaux

L'information des patients est de plus en plus capturée sous forme de dossiers médicaux

en électronique par les professionnels de santé (32). Les dossiers comprennent différentes

informations telles que les antécédents médicaux, les traitements, et les données de tests de

laboratoire (33).

Treize études ont étudié l utilisation du TM pour explorer les dossiers médicaux afin d extraire des informations sur des effets indésirables, symptômes, comorbidités et sous-groupes de patients (Appendice Table A5). Le TM a été utilisé pour capturer l historique des médicaments pris par les patients et la réponse aux médicaments. Des modèles supervisés

appliqués aux dossiers médicaux électroniques ont permis d'identifier des effets secondaires

32 parcours de traitement. Le TM a permis de relier des comorbidités présentes chez des

patients ayant des gènes communs en utilisant des modèles d'apprentissage non supervisés. De plus, l utilisation du TM sur le contenu des dossiers de l'hôpital psychiatrique a permis l'identification de corrélations entre les maladies à partir des symptômes mentionnés (34). L analyse des conclusions et diagnostics transcrits dans les dossiers médicaux a aidé à distinguer les concepts relatifs à la schizophrénie par rapport aux troubles de l'humeur, ainsi

que les patients dépressifs et ceux maniaques (7). Les informations détenues dans les

champs non-structurés (stockées sous forme de texte) complètent les informations déjà

disponibles (structurées et identifiées dans la base de données) tels que le tabagisme, les

résultats des examens, le nombre de séances de psychothérapie.

Dans ce cadre, le text mining est utile pour extraire les données de façon automatique

apportant une structuration de l information complétant la connaissance des antécédents, effets secondaires des médicaments, résistances aux traitements, symptômes, et schémas

thérapeutiques parcourus.

1.3.2.4. Les thèmes dans la littérature médicale

La littérature biomédicale est actuellement en expansion à un rythme de plusieurs

milliers d'articles par semaine et difficile à analyser manuellement (35). L'exploration de cette

source est réalisable en utilisant des procédés automatiques du TM.

Onze publications fournissent des exemples pratiques de données issues de la

littérature biomédicale (Appendice Table A6 ). Trois études ont listé les termes cliniques

relatifs à des concepts spécifiques dans la dépression, la phobie et l'autisme en utilisant

l'analyse de l'association des mots. De plus, le TM a permis d identifier les gènes cités fréquemment dans les articles scientifiques (dans PubMed) portant sur le syndrome de

Smith-33 Magenis, l'autisme et la maladie d'Alzheimer. Les bases de données bibliographiques ont aussi été analysées via le TM afin d identifier les chercheurs spécialisés dans un domaine scientifique et de mettre à jour des analyses systématiques de la littérature. L analyse textuelle de la littérature via le TM a servi d étape préliminaire d analyse du contenu d un grand nombre d articles scientifiques.