! !
!
!
A!quoi!peuvent!bien!penser!les!patients!?!!
Extraction!de!connaissances!dans!les!forums!de!santé!
!
Patient's)mind!
!
!
!
BILAN!ANNEE!2!
!
!
A!–!IDENTIFICATION!
1!–!Maisons!des!Sciences!de!l’Homme!impliquées!dans!le!projet!
MSH!coordinatrice!du!projet!:!! MSH9M!Montpellier!
Autres!MSH!impliquées!:!! MESHS,!MSH9Toulouse!
!
2!–!Unités!de!Recherche!impliquées!dans!le!projet!
Montpellier!:!! LIRMM!(UMR!5506),!I3M!(UMR!5149),!PRAXILING!(UMR!5267)!!
Lille!:!! MESHS9STL!LILLE!3!CNRS!(UMR!8163)!
Toulouse!:!! UPS9IRIT!(UMR!5505),!CLLE!(UMR!5263)!!
!
3!–!Partenaire(s)!étranger(s)!impliqué(s)!dans!le!projet!!
Canada!:!AICML,!University!of!Alberta!
!
4!–!Coordinatrice!
Nom$
Prénom! Discipline! Grade! Laboratoire! MSH! Établissement(s)! Quotité>
(%)! Adresse>Mèl!
S.!
Bringay! Informatique! MCF! LIRMM! MSH9M! Université!
Montpellier!3! 40%! bringay@lirmm.fr!
!
!
! !
5!–!Autres!chercheurs!et!personnels!de!l’équipe!projet!
NomR
Prénom! Discipline! Grade
*! Laboratoi
re! MSH! Établissement
(s)! Quotit
é!(%)! Adresse!Mèl!
N.!Grabar! Chercheurs!
en!SHS! CR! STL! MESHS! Univ.!!
Lille!1&3! 40%! natalia.grabar@univ9lille3.fr!
P.!Poncelet! Informatiqu
e! PR! LIRMM! MSH9M! Univ.!!
Montpellier!2!
15%! poncelet@lirmm.fr!!
J.!Azé! Informatiqu e!
PR! LIRMM! MSH9M! Univ.!Univ.!
Montpellier!2!
15%! aze@lirmm.fr!!
C.!Lavergne! Mathématiq
ue! PR! I3M! MSH9M! Université!
Montpellier!3! 15%! Christian.Lavergne@univ9 montp3.fr!!
C.!Joutard!!
Mathématiq
ue! MCF! I3M! MSH9M! Univ.!!
Montpellier!3! 15%! cyrille.joutard@univ9 montp3.fr!!
A.!
Steuckardt!! Linguistique! PR! PRAXILIN
G! MSH9M! Univ.!
Montpellier!3!
15%! agnes.steuckardt@univ9 montp3.fr!!
G.!Luxardo!! Linguistique! IR! PRAXILIN
G! MSH9M! Univ.!!
Montpellier!3! 15%! giancarlo.luxardo@gmail.com!!
N.!Souf! Informatiqu
e! MCF! IRIT! MSH9
Toulous e!
UPS! 15%!
nathalie.souf@irit.fr!!
M.!Mojahid!! Informatiqu e!
MCF! IRIT! MSH9
Toulous e!
UPS! 15%! Mustapha.Mojahid@irit.fr!!
L.RM.!HoR
Dac!! Linguistique! MCF! CLLE! MSH9
Toulous e!
Univ.de!
Toulouse9le!
Mirail!
15!%!
hodac@univ9tlse2.fr!
P.!Sabot! Philosophie! PR! STL!
MESHS! Univ.!Lille!3! 15%! Philippe.Sabot@univ9lille3.fr!
P.!
ChauveauR Thoumelin!
Linguistique! MS! STL! MESHS! Univ.!Lille!3! 15%! p.chauveau.thoumelin@gmail .com!
!
! !
PARTIE!B!R!BILAN!SCIENTIFIQUE!DU!PROGRAMME!
!
B.1!–!PRÉSENTATION!COURTE!DU!PROGRAMME!
!
Notre! étude! porte! sur! les! forums! issus! du! domaine! médical! qui! permettent! à! des! internautes!
d'échanger! à! propos! de! leur! santé.! Intermédiaires! entre! discours! oral! et! écrit,! les! forums! de!
discussion! sont! des! espaces! d’échanges! asynchrones! de! messages! textuels.! Ce! nouveau! mode! de!
communication! est! très! prisé! des! patients! car! associé! à! une! grande! liberté! du! discours! due!
notamment! à! l'anonymat.! Dans! ce! contexte! éminemment! subjectif,! la! caractérisation! et! la!
compréhension!des!perceptions!que!les!patients!ont!de!leur!maladie!et!du!suivi!médical!est!difficile,!
mais! néanmoins! particulièrement! intéressante! pour! les! professionnels! de! santé.! De! nombreux!
verrous!sont!associés!à!l’analyse!semi9automatique!de!ces!forums,!en!particulier!la!volumétrie!des!
textes!et!leur!hétérogénéité.!L’objectif!de!ce!projet!est!de!proposer!des!méthodes!dédiées!à!cette!
tâche! difficile,! qui! nécessitent! la! mise! en! commun! de! compétences! issues! de! trois! disciplines!
différentes!:!informatique,!statistiques!et!linguistique.!
!
MOTSRCLÉS!:!forum,!fouille!de!textes!et!du!web,!informatique!médicale!et!santé!publique!
!
B.2!9!DESCRIPTION!SCIENTIFIQUE!!
!
4!axes!thématiques!prometteurs!ont!été!développés!au!cours!de!cette!deuxième!année.!Nous!nous!
sommes!intéressés!essentiellement!à!l’enrichissement!de!messages!:!De!quoi!parlent9il!?!Comment!
parlent9ils!?!Qui!parle!?!Quand!parlent9ils!?!Nous!décrivons!ci9après!ces!différents!axes.!
)
Axe!1!–!Analyse!thématique!des!messages!
Sous/Axe)1.1)–)Recherche)d’informations) Responsables)scientifiques):!T.!Opitz!
Autres)participants):!C.!Mollevi,!C.!Lavergne,!C.!Joutard,!J.!Azé!
Objectifs):! L'objectif! de! cet! axe! a! été!de! développer! une! méthode! permettant! d’identifier! des!
messages!à!partir!d’une!liste!de!mots!clés!suite!à!une!expansion!automatique!par!des!synonymes.!Les!
expansions!sont!désambiguïsées!suite!à!une!recherche!web.!
Productions):!!
• Etat!de!l’art!;!
• Proposition! d’une! méthode! d’expansion! et! de! validation! des! expansions! automatiques! via! le!
web!;!
• Implémentation!du!modèle!et!évaluation!sur!un!forum.!
!
Sous/Axe)1.2)–)Classification)supervisée)de)thèmes) Responsables)scientifiques):!A.!Abdaoui!
Autres)participants):!S.!Bringay,!J.!Azé,!P.!Poncelet!
Objectifs):! À! partir! d’un! site! permettant! à! des! internautes! de! poser! des! questions,! nous! avons!
proposé!une!classification!automatique!selon!des!catégories.!
Productions):!!
• Etat!de!l’art!;!
• Proposition!d’un!classifieur!;!
• Evaluation!sur!un!jeu!de!données!réel.!
Sous/Axe)1.3)–)Classification)non)supervisée)de)thèmes) Responsables)scientifiques):!T.!Opitz!
Autres)participants):!C.!Mollevi,!C.!Lavergne,!C.!Joutard,!J.!Azé!
Objectifs):!Nous!avons!appliqué!la!méthode!LDA!pour!extraire!automatiquement!les!thèmes!discutés!
par!les!patients.!
Productions):!!
• Etat!de!l’art!;!
• Application!de!la!méthode!LDA!;!
• Paramétrage!en!collaboration!avec!des!oncologues!;!
• Liste!des!thèmes!d’intérêt!pondérés!selon!leur!importance.!
!
Sous/Axe)1.4)–)Acquisition)d’un)vocabulaire)patient) Responsables)scientifiques):!S.!Bringay!
Autres)participants):!T.Opitz,!J.!Azé,!C.!Jonquet!
Stage)M2)Recherche):)Cet!axe!a!donné!lieu!au!stage!de!Y.!Motie.!
Objectifs):! Pour! améliorer! les! résultats! issus! des! 3! sous! axes! précédents,! nous! avons! besoin! de!
capturer!le!vocabulaire!des!patients!très!différents!de!celui!des!professionnels!de!santé.!L'objectif!de!
cet!axe!a!été!:!!
• Identifier!des!termes!médicaux!candidats!employés!par!les!patients!mais!pas!par!les!médecins!;!
• Mettre! en! relation! ces! candidats! avec! des! termes! présents! dans! les! ressources! médicales!
existantes.!
Productions):!!
• Plusieurs! algorithmes! d’extraction! de! candidats! (adaptation! de! l’algorithme! de! Porter,! de!
Leveinstein,!application!de!mesures!tels!que!le!TF9Idf)!;!
• Un!algorithme!de!mise!en!relation!des!termes!(basé!sur!l’API!Wikipédia).!
!
Axe!2!–!Analyse!de!la!manière!dont!s’expriment!les!patients!
Sous/Axe)2.1)–)Analyse)de)citations)et)des)énumérations)dans)les)forums)de)santé)) Responsables)scientifiques):!N.!Souf!
Autres)participants):!L.M.9!Ho9Dac,!M.!Mojahi.!
Stage)M2)Recherche):)Cet!axe!a!donné!lieu!au!stage!de!M.!Caperon.!
Objectifs):!L'objectif!de!cet!axe!a!été!:!!
• étudier!l’utilisation*des*citations*:*en*effet*les*internautes*se*citent*et*se*répondent*beaucoup*au*
fil$des$discussions$et$visualiser$ces$interconnections$dans$le$fil$de$discussions$nous$permettraient$
peut%être%d’en%avoir%une%compréhension%élargie%;!
• connaitre" les" énumérations" dans" les" fils" de" discussions" (quels" indices" discursifs" et" de" mise" en"
forme&matérielle&peut9!on$repérer$et$qu’en$déduire$?)!
• analyser( en( utilisant( les( terminologies( médicales( existantes,( les( proximités( sémantiques( entre(
les$différents!post!de!discussion!dans!un!fil.!
Sous/Axe)2)/)Évolution)et)visualisation)des)émotions) Responsable)scientifique):!N.!Grabar!
Stage)M2)Recherche):)Cet!axe!a!donné!lieu!au!stage!de!L.!Dumonet.!
Objectifs):!L'objectif!de!cet!axe!a!été!:!
• travailler!avec!les!documents!provenant!de!différents!genres!médicaux!(cliniques,!scientifiques,!
forum,!etc.)!
• exploiter!et!améliorer!les!annotations!des!documents!avec!différents!niveaux!de!spécificité!
• proposer! une! visualisation! de! l'évolution! des! émotions! et! une! représentation! adéquate! des!
données!
Productions):!Les!productions!sont!de!différents!types!:!
1. Un!état!de!l’art!;!
2. Ressources!:! un! corpus! constitué! de! trois! discours! médicaux! couvrant! le! domaine! de!
rhumatologie!;!
3. Méthodes!:!
a. Différentes!mesures!de!l’évolution!;!
b. Différentes!visualisation!de!cette!évolution.!
!
Sous/Axe)3)–)Portée)des)émotions)et)des)sentiments) Responsable)scientifique):!S.!Bringay!
Autres)participants):)P.!Poncelet,!P.!Pompidor,!J.!Maizi,!E.!Kergosien.!
Objectifs):! L'objectif! de! cet! axe! a! été!d’identifier! des! phrases! contenant! des! émotions! et! de! les!
analyser!pour!identifier!qui!exprime!cette!émotion!et!à!propos!de!quoi.!
Productions):!Les!productions!sont!de!différents!types!:!
1. Un!état!de!l’art!;!
2. Une!méthode!automatique!basée!sur!l’analyse!des!rôles!sémantiques.!
!
Sous/Axe)4)–)Génération)d’un)lexique)pour)les)émotions)en)français) Responsable)scientifique):!A.!Abdaoui!
Autres)participants):)S.!Bringay!et!J.!Azé.!
Objectifs):!L'objectif!de!cet!axe!a!été!de!créer!une!ressource!dédiée!au!français!pour!l’identification!
d’émotions! dans! les! textes.! Cette! ressource! a! été! obtenue! après! la! traduction! automatique! d’une!
ressource!anglaise!puis!validation!par!une!stagiaire!de!master!2!du!master!de!traduction!de!l’UM3.!
Productions):!!
1. Plus!de!14000!termes!français!polarisés!et!annotés!par!une!des!6!émotions.!
!
Axe!3!–!Analyse!des!auteurs!
SousRAxe!3.1!–!Identification!de!rôles!(patient!ou!professionnels!de!la!santé)!
Responsables)scientifiques):!A.!Abdaoui!!
Autres)participants):!S.!Bringay,!J.!Azé!
Objectifs):!L'objectif!a!été!de!distinguer!automatiquement!les!posts!rédigés!par!des!patients!ou!des!
professionnels!de!la!santé.!!!
Productions):!!
• Etat!de!l’art!;!
• Proposition!d’un!classifieur!;!
• Evaluation!sur!2!forums!réels!
SousRAxe!3.2!–!Prise!en!compte!des!émotions!pour!un!modèle!de!confiance!
Responsables)scientifiques):!S.!Bringay!
Autres)participants):!A.!Abdaoui,!J.!Azé!
Stage)M2)Recherche):)Cet!axe!a!donné!lieu!au!stage!de!O.!Nkaira.!
Objectifs):!L'objectif!de!cet!axe!a!été!de!proposer!une!mesure!permettant!d’identifier!des!internautes!
de!qualité!:!
• Basée!sur!les!interactions!;!
• Basée!sur!les!émotions.!!
Productions):!!
• Etat!de!l’art!;!
• Proposition!d’un!modèle!;!
• Implémentation!du!modèle!et!évaluation!sur!un!forum.!
!
Axe!4!–!Analyse!temporelles!des!messages!
Responsables)scientifiques):!T.!Opitz!
Autres)participants):!C.!Mollevi,!C.!Lavergne,!C.!Joutard,!J.!Azé!
Objectifs):!Dans!le!cadre!de!l’étude!de!la!qualité!de!vie!chez!les!patientes!atteintes!d’un!cancer!du!
sein,!l’objectif!a!été!de!mettre!en!œuvre!une!classification!temporelle!supervisée!(les!posts!ont!ils!été!
écrits!avant,!pendant!ou!après!la!chirurgie!?).!
Productions):!!
• Etat!de!l’art!;!
• Annotations!des!messages!avec!différents!marqueurs!temporels!;!
• Elaboration!d’un!classifieur!automatique!;!
• Evaluation!du!classifieur.!
! !
!
B.2!–!AUTRES!INDICATEURS!DE!LA!RECHERCHE!
!
3!journées!d’études!
• Le) 22) Avril) 2014) :) Journée) du) projet) Patients') Mind.)Cette! journée! a! réuni! les! membres! du!
projet! !(12! participants)! et! a! permis!aux!stagiaires! financés! dans! le! cadre!du! projet! d’exposer!
leurs!premiers!résultats.)
• Le)04)juin)2014)Université)d'été)de)Castres.)Cet!atelier!de!1h!a!permis!de!présenter!le!projet!et!
de! se! confronter! à! des! professionnels! de! la! santé! de! l’ICM! et! une! association! Vivre! Sans!
Thyroïde)(cf.!programme!en!annexe).!Une!trentaine!de!participants!ont!assisté!à!cet!atelier.)
• Le) 06) Novembre) 2014):) Journée) du) projet) Patients') Mind.)Cette! demi9journée! a! réuni! les!
membres! du! projet! ! (12! participants)! pour! assister! en! autre! à! un! exposé! de! A.! Tagarelli! Pasi,!
chercheur!invité!dans!le!cadre!du!programme!(cf.!programme!en!annexe).) )
4!stages!M2!
• Analyse! des! citations! et! des! énumérations! dans! les! fora! de! santé! M.! Caperon,!
IRIT/Toulouse/Castre!
• Évolution!et!visualisation!des!émotions!L.!Dumonet!STL/Lille!
• Acquisition!de!vocabulaire!patient!(Financement!via!l'ANR!SFIR)!Y.!Motie!LIRMM/Montpellier!
• Emotion!pour!la!construction!de!modèle!de!confiance!:!forum!de!santé!O.!Nkaira!(début!janvier!
2014)!(Financement!par!le!groupe!AMIS!de!l'UM3)!!LIRMM/Montpellier!
Sujets!:!https://www.lirmm.fr/patient9mind/pmwiki/pmwiki.php?n=Site.OffresDeStage!
Rapports!:!https://www.lirmm.fr/patient9mind/pmwiki/pmwiki.php?n=Site.Publications!!
4!Dépôts!de!projet!et!1!en!cours!:!Appel)Inter)MSH)et)Appel)ANR)générique) 1. Projet)H2020)2015)(soumission!en!avril!2015))
2. ANR)Internationale)2015)(soumis!en!novembre!2014)) 3. ANR)2015)(soumis!en!octobre!2014))
4. Appel)Ligue)Cancer)(soumis!en!juin!2014!–!non!retenu)) 5. PEPS_Humain_2014)(soumis!en!janvier!2014!–!non!retenu))
)
10!Publications!et!3!rapports!de!stage!en!2014!:!!
)
Conférence)internationale)
1. T.!Opitz,!S.!Bringay,!J.!Azé,!C.!Joutard,!C.!Lavergne!and!C.!Mollevi.!Breast!cancer!and!quality!of!
life:! medical! information! extraction! from! health! forums.! Proceedings! of! Medical! Informatics!
Europe,!Istanbul,!2014.!pp.!107091074.!!
2. Amine! Abdaoui,! Jérôme! Azé,! Sandra! Bringay,! Pascal! Poncelet! et! Natalia! Grabar.! Predicting!
Medical!Roles!in!Online!Health!Fora.!SLSP!2014.!(To!appear).!!
3. Amine!Abdaoui,!Jérôme!Azé,!Sandra!Bringay,!Pascal!Poncelet!et!Natalia!Grabar.!Analysis!of!Posts!
Written!by!Patients!and!by!Health!Professionals.!MIE!2014!(poster).!!
4. S.!Bringay,!E.!Kergosien,!P.!Pompidor!and!P.!Poncelet.!Emotions!target!in!health!forums!CICLING!
2014.!!
5. Soumia! Melzi,! Amine! Abdaoui,! Jérôme! Azé,! Sandra! Bringay,! Pascal! Poncelet! and! Florence!
Galtier.!Patient's!rationale:!Patient!Knowledge!retrieval!from!health!forums'.!ETELEMED!2014.!
Barcelona,!Spain.!!!
)
) )
Conférence)nationale)
1. T.!Opitz,!S.!Bringay,!J.!Azé,!C.!Joutard,!C.!Lavergne!and!C.!Mollevi.!Paroles!de!patients!dans!les!
forums! de! santé:! une! perspective! originale! sur! la! qualité! de! la! vie.! Actes! des! 25es! Journées!
francophones! d'Ingénierie! des! Connaissances,! Atelier! IA! &! Santé,! Clermond9Ferrand,! 2014.! 5!
pages.!.!
2. Amine! Abdaoui,! Jérôme! Azé,! Sandra! Bringay,! Pascal! Poncelet! et! Natalia! Grabar.! Analyse! des!
messages!des!patients!et!des!médecins!dans!les!fora!de!santé.!IC&Santé!2014.!.!
3. S.!Bringay,!E.!Kergosien,!P.!Pompidor!and!P.!Poncelet.!Emotions!target!in!health!forums.!IC!2014.!
4. Soumia! Melzi,! Amine! Abdaoui,! Jérôme! Azé,! Sandra! Bringay,! Pascal! Poncelet! and! Florence!
Galtier.!Que!ressentent!les!patients!?!EGC!2014:!Rennes,!France.!!
5. Pierre! Chauveau9Thoumelin,! Natalia! Grabar.! La! subjectivité! dans! le! discours! médical! :! sur! les!
traces!de!l'incertitude!et!des!émotions.!EGC!2014:!Rennes,!France.!!!
!
Rapports!de!stage!
1. Otmane!NKaira.!Prise!en!compte!des!émotions!pour!la!construction!de!modèles!de!confiance!:!
Application!aux!forums!de!santé.!Stage!de!M2R!réalisé!au!LIRMM.!!
2. Yassine!Motie.!Vocabulaire!Patient.!Stage!de!M2R!réalisé!au!LIRMM.!!
3. Magali!Caperon.!Analyse!des!citations!dans!les!forums!de!santé.!Stage!de!M2R!réalisé!à!l'IRIT.!!
!
3!Chercheurs!invités!
1. Osmar) Zaiane)(Professor! at! University! of! Alberta,! Scientific! Director! of! AICML)! a! séjourné! au!
LIRMM!du!3!au!9!octobre!2013!(biographie!en!annexe)!financé!par!le!LIRMM.!Dans!le!cadre!de!
sa! visite,! il! a! réalisé! un! séminaire! au! LIRMM! sur! les! applications! menées! en! santé! dans! son!
groupe!de!recherche!(résumé!en!annexe).!)
2. Gabriella)Pasi!(Associate!Professor!at!University!of!Milano!Bicocca,!Department!of!Informatics,!
Systems!and!Communication)!a!séjourné!au!LIRMM!du!20!au!25!octobre!2013!financée!par!la!
MSH9M.! Sa! biographie! est! disponible! en! annexe.! Dans! le! cadre! de! sa! visite,! elle! a! réalisé! un!
séminaire! au! LIRMM! sur! ses! travaux! en! recherche! d’information.! Elle! a! réalisé! une! interview!
filmée.!Elle!a!donné!un!cours!au!master!2!DECOL!de!l’UM2.!Elle!a!également!donné!un!séminaire!
dans!le!cadre!de!la!journée!Parlons!de!nous!du!25!Octobre.!)
3. Andrea) Tagarelli) (Assistant! Professor! of! computer! engineering,! University! of! Calabria)! a!
séjourné! au! LIRMM! du! 03! au! 07! novembre! 2014! financé! par! la! MSH9M.! Sa! biographie! est!
disponible! en! annexe.! Dans! le! cadre! de! sa! visite,! il! a! réalisé! un! séminaire! au! LIRMM! sur! ses!
travaux! analyse! de! réseaux! sociaux.! Il! a! réalisé! une! interview! filmée.! Il! a! donné! un! cours! au!
master!2!DECOL!de!l’UM2.!Il!a!également!donné!un!séminaire!dans!le!cadre!de!la!Patients!Mind!
du!06!Novembre!et!un!séminaire!au!LIRMM!le!07!Novembre.!)
!
2!Visites!!
1. Sandra)Bringay)et)Amine)Abdaoui)chez!!Osmar)Zaiane)(University!of!Alberta,!AICML)!pour!le!
montage!de!l’ANR!internationale)
2. Sandra)Bringay)et)Amine)Abdaoui)chez!!Diana)Inkpen)(University!of!Ottawa)!pour!le!montage!
de!l’ANR!internationale)
B.3!–!BILANS!FINANCIERS!!
!
BUDGET!REEL! Part!demandée!au!
Réseau!MSH! LIRMM! STL! IRIT! ICM/I3M!
Missions!
!1!mission!nationale!
Montpellier!
M.Chahbandarian!avril!
2014!86,00!€!
1!mission!nationale!
Conférence!EGC!Renne!de!A.!
Abdaoui!janvier!2014!1500€!
1!mission!nationale!Conférence!
EGC!Rennes,!France!de!N.!
Grabar!janvier!2014!1000€!
2!missions!nationales!Atelier!IC!et!
Santé!Clermont!Ferrand!de!N.!Souf,!
G.!Chahbandarian!avril!2014!1000€!
1!mission!nationale!
Montpellier!N!Castres!de!
Bringay!(Atelier!forum!de!
santé!Castre),!100€!
!1!mission!nationale!
Toulouse!NNN!
Montpellier!Mme!HoN NNDac!avril!2014!327,00!
€!
1!mission!internationale!
Conférence!ETelemed!
Barcelonne!de!A.!Abdaoui!
mars!2014!2000€!
1!mission!internationale!MIE!
Istambul,!Turquie!de!N.!Grabar!
août!2014!1800€!
!! !!
1! mission! nationale!
Montpellier! Mme!
Capeyron! avril! 2014!
86,00!€!
1!mission!nationale!Atelier!
IC!et!Santé!Clermont!Ferrand!
de!A.!Abdaoui,!S.!Bringay!et!
T.!Opitz!avril!2014!2000€!
1!mission!internationale!
COMPUTERM@COLING!Dublin,!
Irlande!août!N!Grabar!avril!
2014!1800€!
!! !!
1! mission! nationale!
Paris! NNN! Montpellier!
Mme! Grabar! avril!
2014!320,00!€!!
1!mission!internationale!MIE!
Istambul!de!A.!Abdaoui!et!T.!
Opitz!avril!2014!4000€!
1!mission!internationale!EACL!
Goteborg,!Suède!de!N.!Grabar!
avril!2014!1800€! !! !!
1! mission! nationale!
Castres!NNN!Montpellier!
Mme! Souf! avril! 2014!
123,52!€!!
1!mission!nationale!SLSP!
Grenoble!de!A.!Abdaoui!avril!
2014!1000€!
!! !! !!
1! mission! nationale!
Castres!NNN!Montpellier!
Mme! Souf! novembre!
2014!123,52!€!
1!mission!nationale!Castres!
de!Bringay!(Atelier!forum!de!
santé!!juin!100€!
!! !! !!
!!
1!mission!Canada!!de!S.!
Bringay!et!A.!Abdaoui!N!
montage!ANR!
internationnale!(3N9!
Octobre)!5000€!
!! !! !!
TOTAL!1066€! TOTAL!15600€! TOTAL!6!400!€! TOTAL1000!!€! TOTAL!100€!
Matériel! !! Protable!T.!Opitz!2000€! Portable!O!Wandji!1200€! !! !!
! ProtableA.!Abdaoui!2000€! !! !! !!
TOTAL!€! TOTAL!4000€! TOTAL!1!200!€! TOTAL!€! TOTAL!€!
Réception!
Déjeuner!18!
personnes!22/04!
319,20!€!
Déjeuner(13(
personnes!06/11!
249,70!€!!
TOTAL!569€!
TOTAL!€! TOTAL!€! TOTAL!€! TOTAL!€!
Salaire!
Stage!Mme!Capeyron!
07/04!au!30/09/14!2!
542,50!€!
Stage!M.Dumonet!
05/05!au!14/10/14!2!
347,95!€!
Frais!de!gestion!stages!
LIRMM!425,26!€!
TOTAL!5!315,71!€!
2! masters! pendant! 6! mois!
TOTAL!6000€! TOTAL!€! TOTAL!€! Salaire!de!T.!Opitz!PostN
doctorant!TOTAL!40000€!
Total! TOTAL!6!950,65€! TOTAL!25600€! TOTAL!7!600!€! TOTAL!1000€! TOTAL!40100!€!
!
!
!
!
PARTIE!C!–!PERSPECTIVES!ANNEE!3!
!
Suite! à! la! première! année! de! ce! projet,! nous! avons! identifié! les! perspectives! suivantes! pour! la!
deuxième!année!:!!
!
Axe!1!1!Extraction!d’émotions!!
Cet! axe! sera! porté! par! le! LIRMM.! Ces! perspectives! seront! mises! en! œuvre! dans! le! cadre! de! deux!
thèses!et!de!stages!si!ceux!ci!sont!choisis!par!les!étudiants.!
• Analyse(de(la(qualité(de(vie(dans(les(forums(de(santé!:!les!patients!expriment!dans!les!forums!
des! éléments! qu’ils! ne! donnent! pas! toujours! à! leurs! médecins,! notamment! quand! il! s’agit! de!
leur!qualité!de!vie!(e.g.!vie!sexuelle!dans!le!cas!d’un!cancer!du!sein).!Dans!le!cadre!de!Mike!TapiJ Nzali,!nous!comparerons!le!contenu!de!QCMs!remplis!par!les!patients!pour!les!professionnels!de!
santé! et! les! messages! évoquant! ces! thèmes! dans! les! forums.! Cette! thèse! est! financé! par!
l’université!de!Montpellier!2!et!coJencadré!entre!le!LIRMM,!l’I3M!et!l’ICM.!
• Recommandation(de(messages(et(d’amis!:!lorsqu’une!personne!interagit!avec!un!forum,!il!est!
possible! de! lui! recommander! des! discussions! proches! de! ses! centres! d’intérêts! ou! même! des!
auteurs!partageant!ces!centres!d’intérêts.!Nous!combinerons!ces!rapprochements!thématiques!
avec!les!informations!issues!de!notre!modèle!de!confiance.!!
• Visualisation( d’indicateurs( de( la( qualité( des( messages! :! il! s’agira! de! mettre! en! place! une!
interface!permettant!de!visualiser!des!indicateurs!sous!la!forme!de!tableau!de!bord!de!la!qualité!
des!messages!(présence!d’insultes,!de!fautes!d’orthographe,!temps!de!réponse…).!!
Axe!2!1!Extraction!d’incertitude!!
Cet!axe!sera!porté!par!le!STL.!Dans!cet!axe,!nous!avons!deux!types!de!perspectives.!
• Traitement!de!l'incertitude!:!
a. approfondir! les! différents! aspects! liés! au! traitement! de! l'incertitude! et! leurs! relations!
avec!les!notions!médicales!et!les!émotions!
b. généraliser!l'approche!à!d'autres!textes!provenant!d'autres!domaines!médicaux!
c. réaliser! d'autres! expériences! avec! les! annotations! effectuées! pour! l'apprentissage!
supervisé!
d. évolution!des!émotions!dans!les!forums!
e. évolution!des!incertitudes!dans!les!textes!cliniques!et!les!forums!
Sur!ces!deux!derniers!points,!un!stage!pourra!être!proposé.!
• Parallélisation!pour!plusieurs!langues,!corpus!et!vocabulaire.!Ce!travail!sera!réalisé!en!commun!
avec!l'équipe!de!Montpellier!:!
a. travaux!parallèles!ou!comparables!sur!le!français!et!l'anglais!
b. exploitation!des!modèles!d'apprentissage!générés!pour!traiter!d'autres!tâches!!
c. d'autres!exploitations!de!l'annotation!sémantique!riche!
d. travail!sur!le!lexique!médical!des!patients!(souvent!hors!de!terminologies!standards)!
!
Axe!3!–!Représentation!schématique!des!discussions!:!!
Cet! axe! sera! porté! par! l’IRIT.! Les! fils! de! discussions! dans! les! forums! contiennent! de! nombreuses!
digressions,! des! apartés,! des! messages! affectueux! ou! agressifs! précisément! ciblés! vers! quelques!
participants,! ils! reprennent! ou! non! des! thématiques! médicales,! émanent! d’habitués! des! fils! de!
discussions!ou!sont!lancés!par!des!béotiens!de!tels!forums,!les!contenus!sont!sensibles!au!niveau!de!
modération! des! forums.! La! forme! de! chacun! des! messages! échangés! traduit! une! ambiance! dans!
laquelle! la! discussion! prend! place.! Aborder! le! contenu! des! forums! et! en! anticiper! l’importance!
informative! passe! aussi! par! le! fait! de! révéler! le! contexte! des! échanges! et! la! structure! de! tels!
messages.! Nous! souhaitons! proposer! des! méthodes! de! captation! (ontologies! de! contexte,!
explicitation! de! la! structure! formelle! du! document)! et! de! visualisation! de! tels! traits! sur! ces! fils! de!
discussion,! afin! d’anticiper! le! caractère! informatif! du! fil! avant! même! que! d’en! initier! une! lecture!
approfondie.!!
!
Actions!envisagées!de!diffusion!et!de!valorisation!des!résultats!!
!
Dans! le! cadre! du! projet! Patients’! Mind,! nous! proposerons! des! communications! dans! des!
colloques/revues!d'informatique!(TALN,!COLING),!de!santé!(Patient!Education!and!Counseling!(PEC)),!
d'informatique! médicale! (AMIA,! MEDINFO,! MIE).! Ces! publications! auront! prioritairement! une!
orientation!internationale.!
!
Par!ailleurs,!si!nous!passons!la!première!étape!des!appels!génériques!nous!finaliserons!le!montage!
du!projet!ANR!déposé!en!octobre!2014.!Afin!de!communiquer!autour!de!ce!projet,!nous!envisageons!
de! présenter! nos! différents! travaux! dans! les! colloques! généralistes! tel! que! EGC! (Conférence!
"Extraction! et! la! Gestion! des! Connaissances")! ou! plus! spécialisés! tel! que! JFIM! (Journées! Française!
d'Informatique!Médicale).!
!
!
! !
!
PARTIE!D!1!ANNEXES!
!
!
1. Programme!de!la!journée!du!22!Avril!2014!!
2. Programme!de!l'atelier!du!!04!juin!2014!Université!d'été!de!Castres.!!
3. Programme!de!la!journée!du!!06!Novembre!2014!!
4. Appel!à!participation!pour!le!séminaire!d’Osmar!Zaiane!du!08/10/2013!
5. Appel!à!participation!pour!le!séminaire!de!Gabriella!Pasi!du!21/10/2013!!
6. Appel!à!participation!pour!le!séminaire!de!Andrea!Tagarelli!du!07/11/2014!!
!
!
!
!
!
! !
Programme de la première journée d'études du projet Patients' Mind
22 avril 2014
• 10:00 Introduction de la journée. Sandra Bringay (LIRMM)
• 10:15 Tour de table.
• 10:30 Presentation des jeux de données. Amine Abdaoui (LIRMM)
• 10:45 Présentation de la ressource des émotions. Sandra Bringay (LIRMM)
• 11:00 Expression de la probabilité (des risques et des chances) dans le forum Doctissimo. Mai Ho Dac (CLLE)
• 11:30 Diagnostic de la difficulte et acquisition de paraphrases pour les termes medicaux techniques.
Natalia Grabar (STL)
• 12:00 Discours des patients et professionnels de santé. Amine Abdaoui (LIRMM)
• 12:30 Repas
• 13:45 Analyse des forums de santé traitant du cancer du sein. Thomas Optiz (LIRMM)
• 14:15 Cible des émotions. Sandra Bringay (LIRMM)
• 14:45 Synthèse contextuelle d'informations médicales. Ghazar Chahbandarian (IRIT)
• 15:00 Analyse des citations et des énumérations dans les fora de santé. Magali Capeyron (IRIT)
• 15:15 Évolution et visualisation des émotions. Natalia Grabar (STL)
• 15:30 Prise en compte des émotions dans un modèle de confiance des messages dans les forums.
Otmane Nkaira (LIRMM)
• 15:45 Détecter le vocabulaire des patients et des medecins dans les forums de santé. Yassine Motie (LIRMM)
• 16:00 Discussions sur la suite.
• 17:00 Cloture
! !
FORUMS DE SANTE : QUAND LE
PATIENT PREND LE POUVOIR SUR SA SANTE
04 juin 2014
Programme
Atelier'organisé'avec'l'IRIT'de'Toulouse'
Les forums de santé sont des lieux où les patients échangent de nombreux points de vue, conseils, où ils s’interrogent et discutent, et ce dans un contexte bien différent du colloque singulier médecin-patient. Le relatif anonymat des échanges, l’implication récurrente de certains dans les forums, les questions débattues peuvent être révélatrices de points de vue, de connaissances ou méconnaissances d’informations médicales, d’alertes, en provenance du grand public.
Programme'
1. Nathalie SOUF, Maître de conférences, Institut de Recherche en Informatique de Toulouse, plateforme e-santé Castres
2. Sandra BRINGAY, Maître de conférences, LIRMM, Université de Montpellier 3 3. Caroline MOLLEVI, Biostatisticienne, PhD, Institut du Cancer de Montpellier (ICM)
4. Emmanuelle BENAIM, Avocate de formation et bénévole pour l'Association Renaloo, forum de santé en ligne
5. Beate BARTES, Présidente de l’association "Vivre sans thyroïde", place du patient "éclairé"
!
! !
Séminaire!Pôle!Données!Connaissances!1!Osmar!Zaiane!1!08/10/2013!à!10h00!1!salle!des!séminaires!
au!LIRMM!
! Title!:!Application!of!Text!Mining!for!Healthcare!
!
Abstract!:!Healthcare!informatics!encompasses!many!disciplines!and!deals!with!large!volume!of!data.!
In!many!cases!this!data!is!text!in!the!form!of!narrative!documents.!This!natural!language!text!requires!
sophisticated!analysis!techniques!to!extract!the!needed!knowledge.!In!this!talk,!I!will!present!work!in!
progress!in!three!health!related!applications!in!which!text!mining!plays!a!significant!role,!from!
sentiment!analysis!and!interrogation!identification!to!automatic!word!sense!disambiguation!and!
contrastive!argument!summarization.!
!
Bio!:!Osmar!R.!Zaiane!is!a!Professor!in!Computing!Science!at!the!University!of!Alberta,!Canada,!and!
Scientific!Director!of!the!Alberta!Innovates!Centre!for!Machinre!Learning!(AICML).!Dr.!Zaiane!joined!
the!University!of!Alberta!in!July!of!1999.!He!obtained!a!Master's!degree!(DEA)!in!Electronics!at!the!
University!of!Paris,!France,!in!1989!and!a!Master's!degree!in!Computer!Science!at!Laval!University,!
Canada,!in!1992.!He!obtained!his!Ph.D.!from!Simon!Fraser!University,!Canada,!in!1999!under!the!
supervision!of!Dr.!Jiawei!Han.!His!Ph.D.!thesis!work!focused!on!web!mining!and!multimedia!data!
mining.!He!has!research!interests!in!novel!data!mining!algorithms,!web!mining,!text!mining,!image!
mining,!social!network!analysis,!and!health!informatics.!He!has!published!more!than!150!papers!in!
refereed!international!conferences!and!journals,!and!taught!on!all!six!continents.!Osmar!Zaiane!was!
the!SecretaryJTreasurer!of!the!ACM!SIGKDD!(Special!Interest!Group!on!Data!Mining)!and!treasurer!of!
ACM!SIGHIT!(Special!Interest!group!on!Health!Informatics).!He!was!the!Associate!Editor!and!Editor!in!
Chief!of!the!ACM!SIGKDD!Explorations!from!2003!to!2010.!He!is!also!Associate!Editor!of!the!
Knowledge!and!Information!Systems,!an!International!Journal,!by!Springer,!and!of!the!journal!Data!
Mining!and!Knowledge!Discovery!by!Springer,!as!well!as!the!International!Journal!of!Internet!
Technology!and!Secured!Transactions.!He!was!the!General!Chair!of!the!IEEE!International!Conference!
on!Data!Mining!ICDM!2011.!Osmar!Zaiane!received!the!ICDM!Outstanding!Service!Award!in!2009!and!
the!2010!ACM!SIGKDD!Service!Award.!
Bonjour,!
! !
Séminaire!Pôle!Données!Connaissances!–!Gabriella!Pasi!1!21/10/2013!à!14h30!1!salle!du!conseil!au!
LIRMM!
!
!
Title!:!The!role!of!context!in!information!retrieval!
!
Abstract!:!To!overcome!the!“one!size!fits!all”!behaviour!of!most!search!engines,!in!recent!years!a!
great!deal!of!research!has!addressed!the!problem!of!defining!techniques!aimed!at!tailoring!the!
search!outcome!to!the!user!context!in!order!to!improve!the!quality!of!search.!The!main!idea!is!to!
produce!contextJdependent!and!userJtailored!search!results.!Search!tasks!are!subjective!and!often!
complex.!The!userJsystem!interaction,!based!on!keywordJbased!querying!and!on!the!presentation!of!
search!results!as!a!list!of!web!pages!ordered!according!to!their!estimated!relevance,!is!often!
unsatisfactory.!This!lecture!will!present!an!overview!of!the!main!issues!related!to!contextual!search.!
!
Bio!:!Gabriella!Pasi!received!a!PhD!in!Computer!Science!at!the!Université!de!Rennes,!France.!She!has!
been!working!at!the!National!Council!of!Research!in!Italy!till!2005.!Actually!she!is!Associate!Professor!
at!the!University!of!Milano!Bicocca,!Milano,!Italy,!where!she!leads!the!Information!Retrieval!Research!
Laboratory.!Her!research!mainly!focuses!on!modelling!and!development!of!techniques!for!flexible!
and!personalised/contextual!access!to!information,!and!on!the!problem!of!aggregation!in!search.!She!
served!as!the!Program!Chair!of!several!international!conferences!and!workshops!related!to!her!
research!areas,!and!she!has!been!the!chair!or!coJchair!of!several!International!events!among!which!
the!IEEE!/!WIC!/!ACM!Intenational!Joint!Conference!on!Web!Intelligence!and!Intelligent!Agent!
Technology,!15J18!September!2009,!Milano,!the!PhD!School!on!Web!Information!Retrieval!(WebBar!
2007),!the!Seventh!International!Conference!on!Flexible!Query!Answering!Systems!(FQAS!2006),!the!
European!Summer!school!in!Information!Retrieval!(ESSIR!2000),!and!the!annual!track!“Information!
Access!and!Retrieval”!within!the!ACM!Symposium!on!Applied!Computing.!She!has!published!more!
than!180!papers!on!International!Journals!and!Books,!and!on!the!Proceeding!of!International!
Conferences,!and!she!is!member!of!the!Editorial!Board!of!the!several!International!Journals.!Since!
September!2013!she!is!the!president!of!the!European!Association!of!Fuzzy!Logic!and!Technologies.!
! !
M2!
!
Prise!en!compte!des!émotions!pour!la!construction!de!modèles!de!confiance!:!
applications!aux!forums!de!santé!
!
A.#Abdaoui,#J.#Azé,#S.#Bringay,#P.#Poncelet#
!
Contexte!:! Nous! assistons! à! une! explosion! du! «!web! de! la! santé!».! En! effet,! en! parallèle! des! sites!
institutionnels! comme! celui! de! l’assurance! maladie! ou! de! la! Haute! Autorité! de! Santé! (HAS),! des!
centaines! de! sites! proposent! des! informations! médicales,! plus! ou! moins! objectives! et! bien!
référencées.!Elles!ne!sont!pas!toujours!authentifiées!par!des!médecins!qualifiés!et!pour!certaines!peu!
mises! à! jour.! Même! lorsque! les! sites! et! les! articles! sont! de! qualité,! les! outils! communautaires!
intégrés! dans! ces! sites! (tweet,! facebook,! commentaires! en! ligne…)! permettent! aux! internautes! de!
partager!des!commentaires!appropriés!ou!non.!Pendant!un!temps,!l’HAS!a!proposé!une!certification!
HON!Health# on# the# Net#pour! garantir! la! qualité! de! ces! sites! mais! celleJci! est! restée! relativement!
inconnue!des!patients!et!des!sites!très!fréquentés!comme!Doctissimo#n’ont!pas!souhaité!continuer!à!
être!certifié.!
Dans!le!cas!des!forums!de!santé,!la!question!de!la!confiance!est!très!importante.!Pour!un!internaute!
recherchant!de!l’information!au!travers!de!ces!messages,!il!est!très!difficile!de!se!faire!une!opinion!
sur! les! auteurs! des! messages.! Certains! sites! calculent! des! indicateurs! généralement! basés! sur! le!
nombre!de!messages!postés,!le!nombre!de!réponses!générées!par!les!messages!d’un!internaute,!sur!
les! délais! entre! les! réponses,! sur! les! «!j’aime!»! associés! aux! réponses…! La! génération! de! ces!
indicateurs!fonctionne!comme!une!boite!noire!et!ces!derniers!restent!peu!utilisés!par!les!internautes.!
De!plus,!les!indicateurs!ne!prennent!notamment!pas!en!compte!les!réactions!des!internautes.!
Objectif!:! dans! le! cadre! de! ce! stage! de! master,! l’étudiant! devra! proposer! un! nouveau! modèle! de!
confiance!(trust!model),!spécifique!aux!forums!de!santé!et!intégrant!les!émotions!des!internautes.!
Ces! modèles! sont! très! importants! pour! les! modérateurs! et! les! internautes! confrontés! aux! très!
nombreux!messages.!
Méthodologie!:!!
1. Réalisation!d’un!état!de!l’art!des!modèles!de!confiance!en!comparant!ceux!utilisés!dans!les!
applications!de!eJcommerce!et!ceux!utilisés!dans!les!réseaux!sociaux.!L’étudiant!proposera!
une!synthèse!des!critères!à!prendre!en!compte!dans!le!cas!des!forums!de!santé.!
2. Evolution!du!modèle!initial!pour!prendre!en!compte!les!émotions!des!internautes.!Il!faudra!
pour! cela! étudier! les! méthodes! de! fouille! de! textes! permettant! de! détecter! les! messages!
générant! des! réactions! vives! (e.g.! colère! vs.! joie…)! pouvant! aller! jusqu’à! des! échanges! de!
messages!spécifiques!(insultes!vs.!remerciements).!
3. Implémentation!du!modèle!sur!un!jeu!de!messages!réels!déjà!collectés.!L’étudiant!proposera!
et!appliquera!un!protocole!d’évaluation!rigoureux!de!son!modèle.!!
Durée!:!5!mois!
Gratification!:!436,05!€!mensuel!
Références!:!
Winster,!S.G.,!Swamynathan,!S.!Blog!Trust!Model!for!Blog!Readers.!Recent!Trends!in!Information,!
Telecommunication!and!Computing!(ITC),!2010.!
Paul!Dwye.!Building!Trust!with!Corporate!Blogs.!ICWSMJ13.!http://icwsm.org/papers/2JJDwyer.pdf!
D.!Harrison!McKnight,!Vivek!Choudhury,!Charles!Kacmar.!Developing!and!Validating!Trust!Measures!
for!eJCommerce:!An!Integrative!Typology.!Information!System!Research.!Volume!13!Issue!3,!
September!2002!!
Cynthia!L.!Corritore,!Beverly!Kracher,!Susan!Wiedenbeck.!OnJline!trust:!concepts,!evolving!themes,!a!
model.!Int.!J.!HumanJComputer!Studies!58!(2003)!737–758!
Jianqiang!Shi,!Gregor!v.!Bochmann,!Carlisle!Adams!A!trust!model!with!statistical!foundation.!Formal!
Aspects!in!Security!and!Trust.!IFIP!International!Federation!for!Information!Processing!Volume!173,!
2005,!pp!145J158!!http://www.site.uottawa.ca/~cadams/papers/TrustStat.pdf!
!
! !
M2!
!
Acquisition!de!vocabulaire!patient!
!
S.#Bringay,#J.#Azé,#G.#Pasi,#T.#Opitz,#P.#Poncelet#
!
Contexte!:! Nous! assistons! à! une! explosion! du! «!web! de! la! santé!».! En! effet,! en! parallèle! des! sites!
institutionnels! comme! celui! de! l’assurance! maladie! ou! de! la! Haute! Autorité! de! Santé! (HAS),! des!
centaines! de! sites! proposent! des! informations! médicales,! plus! ou! moins! objectives! et! bien!
référencées.!Elles!ne!sont!pas!toujours!authentifiées!par!des!médecins!qualifiés!et!pour!certaines!peu!
mises! à! jour.! Même! lorsque! les! sites! et! les! articles! sont! de! qualité,! les! outils! communautaires!
intégrés! dans! ces! sites! (tweet,! facebook,! commentaires! en! ligne…)! permettent! aux! internautes! de!
partager!des!commentaires!appropriés!ou!non.!Pour!un!internaute!recherchant!de!l’information!au!
travers!de!ces!sites,!professionnels!de!santé!ou!non,!il!est!très!difficile!de!ne!pas!se!noyer!sous!cette!
grande!masse!d’informations!médicales.!!
Les! méthodes! issues! de! la! fouille! de! texte,! permettant! d’exploiter! ce! type! de! ressources! semiJ automatiquement!sont!difficiles!à!mettre!en!place.!En!effet,!les!textes!sont!écrits!par!les!patients,!de!
manière!peu!rigoureuse!et!sont!difficiles!à!mettre!en!relation!avec!ceux!des!professionnels!de!santé.!
Ils! sont! de! taille! variable! (entre! une! centaine! de! caractères! et! un! millier).! Ils! contiennent! des!
structures! grammaticales! non! conformes,! de! nombreuses! fautes! d’orthographe,! des! abréviations,!
des!expressions!porteuses!de!sentiments!comme!des!mots!d’émotions!(j’aime!ou!je!déteste...),!des!
mises! en! forme! particulières! (lettres! capitales! PLUS,! répétées! ASSSSEEEZ,! suite! de! ponctuation!
répétées! !! !! !! !),! des! mots! d’argot! spécifiques! ou! non! aux! thèmes! des! forums! (LOL,! FIV)! et! des!
émoticons!(:J)).!!
Objectif!:! L’étudiant! mettra! en! place! une! méthode! originale! pour! acquérir! un! vocabulaire!
patient/médecin! qui! pourra! être! utilisé! dans! les! méthodes! semiJautomatiques! de! fouille! de! textes!
issus! des! messages.! Par! exemple,! dans! les! ressources! médicales! des! professionnels! de! santé! (e.g.!
ontologie! médicale! de! type! MESH1),! on! trouvera! le! mot!céphalée,! alors! que! dans! les! textes! des!
patients,! on! trouvera! plutôt!mal# de# tête.! Identifier! des! liens! entre! ces! deux! expressions! sera! donc!
l’objet!de!ce!stage.!
Méthodologie!:!Dans!un!premier!temps,!à!partir!d’un!site!de!questions!réponses!patient/médecin!de!
type! http://www.ledocteur.fr/! ou!
http://www.passeportsante.net/fr/communaute/reponsesexpert/index.aspx,! l’étudiant! mettra! en!
place!une!chaine!de!traitements!du!type!:!
1. Indentification!des!termes!candidats!à!mettre!en!relation!dans!les!questions!et!les!réponses!à!
partir! d’un! ensemble! de! traitements! (nettoyage! orthographique! et! grammatical,!
lemmatisation,!filtrage!des!mots!outils,!recherche!des!entités!nommées...)!;!
2. Construction! d’un! graphe! biJparti! associant! les! termes! candidats! dans! les! réponses! et! les!
termes! candidats! dans! les! questions! et! génération! de! couples! de! candidats! selon! leur!
fréquence!;!
3. Validation!des!associations!entre!termes!candidats!en!utilisant!des!méthodes!basées!sur!des!
Dans!un!second!temps,!les!associations!questions/réponses!seront!organisées!par!thème.!Une!chaine!
similaire! sera! mise! en! place! et! intégrera! un! modèle! de! langue2.! Un! tel! modèle! est! basé! sur! une!
distribution! de! probabilités! qui! représente! l’utilisation! des! mots! dans! le! langage! et! qui! permet! de!
prendre!en!compte!le!contexte!entourant!les!termes!(termes!proches).!!
Durée!:!5!mois!
Gratification!:!436,05!€!mensuel!
Références!:!
M.! Roche,! V.! Prince.! AcroDef:! a! quality! measure! for! discriminating! expansions! of! ambiguous!
acronyms.! Proceeding! CONTEXT'07! Proceedings! of! the! 6th! international! and! interdisciplinary!
conference!on!Modeling!and!using!context,!Pages!411J424,!SpringerJVerlag!Berlin,!Heidelberg,!2007.!
M.! Boughanem.! Modèle! de! langue! pour! la! recherche! d’informations.!
http://www.iro.umontreal.ca/~nie/IFT6255/modele_langue.pdf!
J.!Majdoubi,!H.!Loukil,!M.!Tmar,!and!F.!Gargouri.!Medical!CaseJbased!Retrieval!by!Using!a!Language!
Model:!MIRACL!at!ImageCLEF!2012.!CLEF!Online!Working!Notes/Labs/Workshop,!(2012)!
L.! Maisonnasse,! ! E.! Gaussier,! JP.! Chevallet.! Modélisation! de! relations! dans! l'approche! modèle! de!
langue!en!recherche!d'information.!COnférence!en!Recherche!d'Infomations!et!Applications!J!CORIA!
2008,!5th!French!Information!Retrieval!Conference,!2008.!Pages:!305J319!
AL! Rector,! S.! Bechhofer,! CA.! Goble,! I.! Horrocks,! WA.! Nowlan,! WD.! Solomon.! The! GRAIL! concept!
modelling!language!for!medical!terminology.!Artif!Intell!Med.!1997!Feb;9(2):139J71.!
! !
!
Stage'
Titre':'Analyse(des(citations(et(des(énumérations(dans(les(fora(de(santé.
Lieu':'Laboratoire(IRIT((Institut(de(Recherche(en(Informatique(de(Toulouse),(Université(Paul(
Sabatier,(Equipe(ELIPSE((Etude(de(L’Interaction(Personne(SystèmE).
Contexte'et'problématique
Ce(sujet(du(stage(se(situe(dans(le(cadre(d’un(projet(national(«(Parlons(de(nous(»(
(http://www.mshNNNm.fr/programmes/programmesNNN2013/parlonsNNNdeNNNnous)(où(l’on(étudie(
des(fora(de(santé(pour(tenter(de(répondre(à(la(question(«(à(quoi(pensent(les(patients(?(»(et(du(
projet(interMSH(qui(lui(fait(suite.
Les(forums(de(santé(sont(des(lieux(où(les(patients(échangent(de(nombreux(points(de(vues,(
conseils,(où(ils(s’interrogent(et(discutent,(et(ce(dans(un(contexte(bien(différent(des(têtes(à(têtes(
menées(avec(les(professionnels(de(santé,(qui(ont(lieu(dans(une(durée(et(un(lieu(contraint.(Le(
relatif(anonymat(des(échanges,(l’implication(récurrente(de(certains(dans(les(forums,(les(
questions(débattues(peuvent(être(révélatrices(de(points(de(vue,(de(connaissances(ou(
méconnaissances(d’informations(médicales,(d’alertes,(en(provenance(du(grand(public.(Dans(ce(
contexte(éminemment(subjectif,(la(caractérisation(et(la(compréhension(des(perceptions(dans(les(
fils(de(discussions(des(forums(est(difficile,(mais(aussi(particulièrement(intéressante(et(instructive(
dans(une(perspective(d’amélioration(des(programmes(de(santé(publique.
Objectif'du'projet
Un(des(objectifs(du(projet(est(de(développer(une(plateforme(pour(aider(des(chercheurs(
(linguistes,(sociologues(et(psychologues)(et(des(médecins(à(observer(certains(comportements(
dans(les(fils(de(discussions(dans(des(fora(de(santé.(Dans(le(cadre(d’un(travail(de(thèse(en(
informatique(lancé(cette(année(sur(le(sujet(du(contexte(et(des(informations(médicales,(nous(
avons(initié(cette(plateforme.
La(plateforme(vise(à(proposer(une(interface(qui(permet(de(représenter(et(visualiser(
schématiquement(les(fils(discussions((ou(extraits(de(ces(fils(de(discussions)(de(forums(au(travers(
de(traits(et(critères(que(les(chercheurs(vont(choisir.(On(espère(ainsi(pouvoir(associer(à(certains(
schémas(de(discussions(une(qualité(informationnelle(du(fil(étudié((exemple(:(une(discussion(qui(
diverge(du(thème(initial(et(se(recentre(entre(2(personnes(habituées(devient(peut(être(un(aparté(
hors(sujet).(Les(critères(actuellement(pris(en(compte(sont(de(nature(contextuelle((les(profils(des(
utilisateurs((âge,(sexe),(le(temps,(nombres(d’interventions,(la(longueur(des(échanges,(les(microNNN échanges...).(Nous(souhaitons(travailler(sur(l’exploration(d’autres(critères(qui(prendront(en(
considération(des(traitements(linguistiques(des(discussions(afin(de(disposer(d’un(jeu(de(vues(sur(
les(discussions.(Nous(souhaitons(évaluer(si(ces(informations(permettent(de(répondre(à(notre(
hypothèse(de(caractérisation(des(fils(de(discussion.
Objectif'du'stage
–(analyser(en(utilisant(les(terminologies(médicales(existantes,(les(proximités(sémantiques(entre(
les(différents(post(de(discussion(dans(un(fil.
2.(élaborer(des(stratégies(pour(coupler(les(indices(de(l'architecture(de(texte(et(ceux(liés(au(
contexte((profil(de(l'usager,(thématique(abordée,(statut(du(message(dans(la(discussion,(etc.).(Ce(
travail(se(fera(en(collaboration(avec(le(doctorant.
Nous(souhaitons(en(effet(dans(cette(plateforme,(en(manipulant(des(jauges(constituées(par(ces(
critères,(observer(et(pouvoir(caractériser(comment(se(construisent(les(réponses(?(EstNNNce(que(
les(réponses(sont(fournies(par(des(habitués(ou(des(béotiens(?(PeutNNNon(écarter(certaines(
discussions((vulgarité,(éparpillement...),(ou(au(contraire(anticiper(sur(des(contenus(plutôt(
informatifs(voire(cruciaux(?(Quels(rebondissements(?(Quels(recentrages(?...(Nous(nous(
focaliserons(sur(un(sousNNNensemble(de(ces(besoins.
La(plateNNNforme(«(configurable(»(envisagée(doit(permettre(aux(chercheurs(/(médecins(de(
pouvoir(observer(des(comportements(et(des(«histoires(de(discussion(»(stéréotypés.
Perspectives
Deux(thèses(possibles(dans(la(continuité(de(ce(sujet(de(master((1.(sur(l'étude(des(énumérations(
dans(les(manuels(scolaires(d'histoire(géographie(2.(sur(l'amélioration(de(l’accessibilité(textuelle(
pour(des(personnes(nonNNNvoyantes).
Modalités'du'stage
Encadrants(:(LydiaNNNMai(HoNNNDac,(CLLENNNERSS,(Université(Toulouse(le(Mirail(Nathalie(Souf,(
IRITNNNELIPSE,(Université(Paul(Sabatier(et(ISIS(Castres(Mustapha(Mojahid,(IRITNNNELIPSE,(
Université(Paul(Sabatier
Durée(:(5NNN6(mois.(Rémunération(:(celle(prévue(par(la(règlementation(à(savoir(436,05(€(par(
mois.(Début(:(à(partir(de(MarsNNNAvril(2014.
Profil'du'candidat
Le(candidat(devra(être(inscrit(dans(un(Master(2(en(traitement(automatique(des(langues.
Compétences'demandées
–(compétences(en(traitement(automatique(des(langues(et/ou(en(linguistique(de(corpus.
–(compétences(de(base(en(informatique(et(idéalement(maîtrise(d’outils(pour(l’analyse(de(corpus(
et/ou(de(langages(de(programmation(de(type(perl(et(python.
Comment'candidater'?
Envoyer(un(CV((avec(le(détail(des(cours(et(notes(des(deux(années(de(Master)(et(une(lettre(de(
motivation(à(:(Mustapha.Mojahid@irit.fr
! !
Évolution'et'visualisation'des'émotions'
contact : natalia.grabar@univ-lille3.fr
Les forums issus du domaine médical permettent à des internautes d'échanger à propos de leur santé.
Intermédiaires entre discours oral et écrit, les forums de discussion sont des espaces d’échanges asynchrones de messages textuels. Ce nouveau mode de communication est très prisé des patients car associé à une grande liberté du discours due notamment à l'anonymat. Dans ce contexte éminemment subjectif, la caractérisation et la compréhension des perceptions que les patients ont de leur maladie et du suivi médical est difficile, mais néanmoins particulièrement intéressante pour les professionnels de santé. De nombreux verrous sont associés à l’analyse semi-automatique de ces forums, en particulier la volumétrie des textes et leur hétérogénéité.
Dans le cadre du projet ANR TecSan Ravel et du projet MSHM Parlons de nous, nous proposons un stage de Master 2.
Ce stage fait suite aux travaux déjà réalisés dans l'équipe sur la détection et l'annotation de la subjectivité (incertitude, émotions...) dans les documents biomédicaux (Grabar & Hamon, 2009; Périnet et al, 2011;
Chauveau-Thoumelin & Grabar, 2014).
Plus particulièrement, le stage aura pour objectif de :
• travailler avec les documents provenant de différents genres médicaux (cliniques, scientifiques, forum, etc.)
• exploiter et améliorer les annotations des documents avec différents niveaux de spécificité
• proposer une visualisation de l'évolution des émotions et une représentation adéquate des données L'ensemble du travail sera effectué en collaboration avec les chercheurs en traitement automatique de langues (TAL), en linguistique (syntaxe et sémantique) et en informatique.
Le stagiaire sera amené à utiliser des outils TAL existants et à développer ses propres programmes pour mieux analyser et visualiser les données.
Prérequis:
• connaissances en TAL et en linguistique
• manipulation et test des outils de TAL
• habitude de Linux
• capacité de travailler en équipe et individuellement
• lecture et analyse de la littérature scientifique Le stage est rémunéré.
Selon les résultats du stage, une poursuite en thèse pourrait être envisagée.
Références:
• Amandine Périnet, Natalia Grabar, Thierry Hamon. Identification des assertions dans les textes médicaux : application à la relation {patient, problème médical}. TAL 52(1): 97-132.
Patient’s mind : Plus de fiabilité dans l’information des patients via les forums de santé ?
1–PERTINENCE ET CARACTERE STRATEGIQUE DU PROJET
Selon!une!enquête!réalisée!en!2011!par!la!fondation!HON3,!Internet!est!devenu!la!seconde!source!
d’informations!des!patients!après!les!consultations!chez!le!médecin.!24%!des!personnes!interrogées!
consultent!Internet!pour!rechercher!des!informations!sur!leur!santé!au!moins!une!fois!par!jour!(et!jusqu’à!
6!fois!par!jour)!et!25%!au!moins!plusieurs!fois!par!semaine.!Ces!e9patients!sont!motivés!entre!autres!par!
une!accessibilité!aisée!à!Internet!depuis!la!maison,!le!manque!général!de!temps!pour!des!consultations!
plus!classiques,!la!recherche!de!support!humain!(pour!les!maladies!chroniques!notamment),!le!besoin!de!
connaître!les!expériences!des!autres,!de!même!que!l’envie!d’avoir!plus!d’informations!avant!ou!après!une!
consultation.!Si!plus!de!90%!des!eJpatients!utilisent!des!moteurs!de!recherche!pour!initier!leurs!requêtes,!
la!plupart!des!liens!retournés!les!dirigent!vers!des!forums!qui!sont!à!l’heure!actuelle!utilisés!par!plus!de!
50%!des!eJpatients1.!Ces!forums!sont!des!espaces!d’échanges!où!les!patients,!sous!couvert!d’anonymat,!
relatent!librement!leurs!expériences!personnelles!et!s’informent!sur!leur!santé.!Citons,!par!exemple,!le!
forum!très!actif!Doctissimo4!qui!permet!à!des!eJpatients!d’échanger!à!propos!de!leur!santé.!Bien!
qu’accessible!et!aisée,!l'utilisation!d’Internet!pose!aussi!des!problèmes!éthique!et!sociétaux,!comme!par!
exemple!la!fiabilité(des(informations!et!la!sécurité(des(patients!abordées!dans!ce!projet!
Le!premier!résultat!de!ce!projet!vise!les!e9patients,!avec!une!attention!particulière!orientée!sur!la!
présentation!des!informations!(organisation!des!informations!hétérogènes!et!leur!visualisation)!basées!
entre!autres!sur!une!typologie!fine!des!constructions!argumentatives!et!menant!aussi!vers!des!
recommandations!de!sujets,!messages!ou!patients!pertinents.!Un!deuxième!besoin!porte!sur!la!fiabilité!
des!informations!rencontrées!par!les!patients.!En!effet,!il!apparaît!que!plus!de!46%!des!eJpatients!dans!12!
pays!utilisent!Internet!pour!l’autoJdiagnostique5.!Il!existe,!en!effet,!chez!ces!patients!un!fort!désir!de!
s’instruire,!d’être!capables!d’identifier!et!de!comprendre!leurs!propres!symptômes,!d’avoir!un!accès!
partagé!au!savoir!médical!et!à!la!décision!médicale!qui!les!concerne.!Ces!besoins!sont!d’autant!plus!forts!
dans!les!pays!où!l’accès!aux!soins!est!inégal!et!coûteux.!Les!conséquences!d’un!autoJdiagnostique!erroné!
sont!difficiles!à!estimer!si!des!mesures!sont!prises!sans!consultation!d’un!médecin6.!Or,!si!la!plupart!des!eJ patients!affirment!rencontrer!des!!problèmes!de!pertinence!et!de!fiabilité!visJàJvis!des!informations!
médicales!rencontrées!sur!Internet1,!seuls!21%!demandent!confirmation!à!leur!médecin!suite!à!une!
recherche.!Il!est!difficile!d’empêcher!les!eJpatients!de!consulter!des!informations!non!pertinentes!ou!non!
fiables!dans!les!forums!de!santé,!en!revanche!il!est!possible!de!concevoir!des!outils!pour!mettre(en(
évidence(des(informations(de(qualité(dans(ces(forums.!
Les!résultats!attendus!de!ce!projet!concernent!également!les!responsables(de(sites(hébergeant(des(
forums.!Ces!derniers!et!notamment!les!associations!de!bénévoles,!rencontrent!de!nombreuses!difficultés!
pour!modérer!les!flux!massifs!de!messages!et!maintenir!une!certaine!fiabilité!dans!les!informations!
échangées!et!la!sécurité!des!patients.!Quels#sont#les#messages#à#relire#en#priorité,#à#modérer#?#Quels#sont#
les#bons#(resp.#mauvais)#contributeurs#à#valoriser#(resp.#à#exclure)#?!Comment#maintenir#la#cohérence#des#
fils#de#discussion#?!Notre!projet!a!pour!vocation!d’aider!à!répondre!à!ces!problématiques.!
Nous!nous!adresserons!également!aux!professionnels(de(santé!pour!qui!les!forums!fournissent!des!
informations!importantes,!en!particulier!pour!accéder!à!des!informations!sur!les!patients!relatives!à!la!
qualité!de!vie!que!ces!derniers!ont!des!difficultés!à!partager!directement.!Par!exemple,!on!retrouve!dans!
les!forums!traitant!du!cancer!du!sein,!beaucoup!de!références!à!la!sexualité!alors!que!c’est!un!sujet!très!
peu!abordé!par!les!patientes!avec!les!médecins.!En!effet,!selon!Hancock7,!la!communication!et!l’anonymat!
derrière!un!ordinateur!facilitent!l’expression!d’états!affectifs!comme!les!émotions,!opinions,!doutes,!ou!
évocations!de!risques,!qui!sont!généralement!réprimés!lors!de!communications!plus!traditionnelles!
(interviews!en!face!à!face,!réponses!à!des!enquêtes...).!Nous!nous!placerons!dans!un!contexte!particulier,!
celui!de!l’analyse!de!la!qualité!de!vie!pour!les!patientes!atteintes!d’un!cancer!du!sein,!afin!d’aider!les!
3!HON!(Health!On!the!Net)!How#Do#General#Public#Search#Online#Health#Information?#Avril!2011!
http://www.hon.ch/Global/pdf/Khresmoi/KRESMOI_internet_health_search_information_HON.pdf!!
4!www.doctissimo.fr/#!
5!HS.!Wald,!CE.!Dube,!DC.!Anthony.!Online#Health:#untangling#the#web,!Patient!Educ!Couns;68(3),!pp.!218J24,!2007.!!
6!http://www.academieJmedecine.fr/wpJcontent/uploads/2013/03/2007.8.pdf!!
7!J.T.!Hancock,!C.!Toma,!N.!Ellison,!The#truth#about#lying#in#online#dating#profiles,!ACM!Conf.!Human!Factors!in!Computing!Systems,!pp.!
449–452,!2007.!
oncologues!à!mieux!comprendre!les!besoins!et!ressentis!des!patientes!dans!l’objectif!de!développer!des!
supports!d’informations!fiables!et!correspondant!aux!attentes!des!patients.!
Dans!ce!projet,!nous!proposerons!des(outils(semi9automatiques(aux!eJpatients,!associations!et!
professionnels!de!santé(pour(exploiter(les(données(de(plus(en(plus(massives(issues(des(forums(de(santé,(
afin(d’y(permettre(la(découverte(dynamique(et(interactive(de(la(connaissance.!
Cependant,!d’un!point!de!vue!technologique,!l’analyse!!des!forums!reste!difficile.!Le!verrou!principal!est!
que!la!plupart!des!méthodes!semiJautomatiques!utilisées sur!des!textes!issus!du!domaine!de!la!santé!ont!
été!appliquées!sur!des!publications,!des!comptes!rendus!d’hospitalisation,!etc.!Concevoir!des!méthodes!
destinées!aux!textes!issus!des!médias!sociaux!comme!les!forums!est!loin!d’être!trivial8!et!présente!un!vrai!
défi!technologique,!et!ceci!pour!différentes!raisons!:!les!messages!sont!écrits!par!les!eJpatients!de!
manière!peu!rigoureuse!;!ils!sont!de!taille!variable!(entre!une!centaine!et!un!millier!de!caractères)!;!ils!
contiennent!des!structures!grammaticales!non!conformes,!de!nombreuses!fautes!d’orthographe,!des!
abréviations,!des!expressions!porteuses!de!sentiments!comme!des!mots!d’émotions!(j’aime!ou!je!
déteste),!des!mises!en!forme!particulières!(lettres!capitales!PLUS,!répétées!ASSSSEEEZ,!suite!de!
ponctuation!répétées!!!!!),!des!mots!d’argot!spécifiques!ou!non!aux!thèmes!des!forums!(LOL,!FIV)!et!des!
émoticons!(:J))!;!le!volume!des!messages!est!généralement!très!important!(dans!le!forum!réservé!au!
cancer!du!sein!du!site!Doctissimo,!on!trouve!plus!de!3!300!discussions!dont!certaines!contiennent!plus!de!
2!000!réponses!!).!Pour!ces!différentes!raisons,!traiter(les(forums(de(santé(avec(des(méthodes(semi9 automatiques(nécessite(des(adaptations(importantes(et(complexes(de(méthodes(et(outils.!
Ce!projet!d’ANR,!intitulé!Patient’s#mind,!fait!suite!au!projet!Parlons#de#nous9,!financé!par!la!MSHJM!
(Maison!des!Sciences!et!des!Hommes!de!Montpellier)!à!hauteur!de!10!000€!pour!12!mois!en!2013!puis!
par!le!réseau!interJMSH!national!à!hauteur!de!10!000€!pour!12!mois!en!2014.!Le!premier!travail!autour!du!
sujet!a!été!très!productif!(2!thèses,!1!postJdoctorat,!5!stages!de!Master!2,!10!publications10,!organisation!
en!2013!d’une!première!journée!d’étude!financée!par!le!GDR!STIC!Santé!et!la!MSHJM!qui!a!regroupé!de!
nombreux!intervenants!J!médecins,!chercheurs!dans!le!domaine!de!la!fouille,!de!la!linguistique!et!
industriels,!organisation!en!2014!d’un!atelier!lors!des!journées!de!la!eJsanté!à!Castres11!durant!lequel!les!
besoins!très!forts!des!associations!gérant!des!forums!de!santé!ont!été!identifiés.!Dans!le!cadre!de!ces!
premiers!travaux,!des!données!issues!de!différents!sites!ont!déjà!été!récoltées!et!seront!exploitées!dès!le!
démarrage!du!projet.!Une!thèse!Averroès!est!actuellement!en!cours!sur!les!thèmes!de!ce!projet!et!une!
autre!financée!par!l’Université!de!Montpellier!2!débute!sur!la!thématique!de!la!qualité!de!vie,!suite!à!un!
an!de!postJdoctorat!financé!sur!un!projet!Iresp.!Ces(différents(résultats(et(actions(soulignent(le(
dynamisme(des(équipes(impliquées(et(l’intérêt(de(la(communauté(pour(les(outils(proposés.!
Ce!projet!se!positionne!dans!le!défi!Société!de!l’information!et!de!la!communication!SIC!à!la!frontière!du!
défi!Vie,!Santé!et!Bien1être!VSBE.!L’instrument!de!financement!visé!correspond!aux!projets!de!recherche!
collaborative!PRC.!!
Dans!le!cadre!du!défi!SIC,!nous!nous!intéresserons!essentiellement!à!l’Axe!7!(Interactions!humain!J!
machine,!objets!connectés,!contenus!numériques,!données!massives!et!connaissance)!puisque!nos!
applications!visent!la!découverte!dynamique!et!interactive!de!connaissances!dans!des!données!de!plus!en!
plus!massives.!En!effet,!nous!assistons!à!une!explosion!du!«!web!de!la!santé!».!En!parallèle!des!sites!
institutionnels!comme!celui!de!l’assurance!maladie!ou!de!la!Haute!Autorité!de!Santé!(HAS),!une!multitude!
de!sites!proposent!des!informations!médicales!plus!ou!moins!objectives,!fiables!et!bien!référencées.!Les!
forums!de!santé!participent!à!cette!explosion!qui!justifie!le!besoin!d’outils!semiJautomatiques!destinés!à!
différents!utilisateurs!(eJpatients,!associations!et!professionnels!de!santé).!Nous!entrons!complètement!
dans!la!problématique!du!Big!data!spécifique!à!la!Santé!qui!ne!concerne!pas!que!les!grands!sites!comme!
Doctissimo!(5!974!843!membres!et!291!401!399!messages!en!septembre!2014)!mais!également!les!