• Aucun résultat trouvé

Regroupement de processus

L’informatique médicale (Health Informatics en anglais) est un domaine en pleine expansion qui s’intéresse à l’application de l’informatique et des technologies de l’information pour ex- ploiter et explorer les données médicales et de santé (Coiera, 2015). En effet, les systèmes d’information occupent une place prépondérante dans le domaine médicale. Ces systèmes contiennent une énorme quantité d’information liées aux activités médicales et aux patients. Cette quantité d’informations ne cessent d’augmenter à cause de l’intense activités dans le do- maine médicale. Par exemple, dans la province de Québec, entre 80 et 86 millions de services médicaux sont fournis en moyenne à la population par année. Pour 2005-2006, il y avait près

de 714 000 soins de courte durée et plus de 465 000 interventions chirurgicales d’une journée, pour lesquelles des renseignements détaillés ont été recueillis (MSSS, 2007).

D’un autre côté, au cours des deux dernières décennies, le concept de processus et leur mo- délisation présentent un grand intérêt dans la gestion, l’organisation et l’optimisation des activités. Ceci s’est suscité par le fait qu’elles deviennent plus complexes et nécessitent l’inter- action entre plusieurs personnes et différents départements. Une des approches utilisées est de définir les « entités » , qui représentent les activités pour un processus donné, et de déterminer les interactions entre elles. Par conséquent, le processus d’affaire (business process en anglais) a apparu comme concept qui représente un ensemble des activités et leurs interactions pour atteindre un objectif défini. De plus, grâce à leurs systèmes d’informations, les entreprises sont capables d’enregistrer les activités réalisées. Ces enregistrements représentent alors le journal des événements (event log en anglais). Un prétraitement de ces enregistrements permet de construire les traces d’un processus donné en termes des activités et leurs interactions, ce qui représente les instances de ce processus sur le champ réel. Ce journal contient les détails sur chaque événement et pour quelle instance il avait été exécuté. En conséquence, il permet de construire les instances de processus appelées aussi les cas de processus. Par ailleurs, dans plusieurs cas, en particulier pour les petites et moyennes entreprises, plusieurs processus de travail ne sont pas présentés sous une forme formelle ou explicite. Cependant, bien que le modèle pour un processus donné pourrait ne pas être disponible, les activités de ce processus sont toujours enregistrées. Ainsi, l’extraction et le forage d’un modèle de processus à partir des instances enregistrées de l’exécution de ce processus dans la « vraie vie » présente un défi. Cet intérêt a donné l’émergence d’un champ de recherche connu sous le nom de forage de processus (process mining en anglais). Il vise à développer des techniques pour déterminer un processus et ceci à partir des enregistrements de ses exécutions dans la « vraie vie » construite suite au prétraitement du journal des événements. Cette approche est basée sur l’hypothèse que chaque exécution est une instance du processus. Les techniques d’extraction de processus visent à déterminer ce processus en se basant uniquement sur les informations contenues dans le journal d’événements. Il y a d’autres champs de recherche avec des objectifs différents tels que la vérification de la conformité des processus qui a pour but de déterminer la conformité des enregistrements à un modèle de processus formel déjà défini.

Le système médical actuel quant à lui est un système plus complexe que celui des entreprises à cause du nombre croissant de départements spécialisés, de services et de disciplines médicales. Ce système médical nécessite plusieurs interactions, coopérations et des coordinations entre différents acteurs. L’exécution de la prestation des services dans le système médical engendre des processus médicaux ayant différents objectifs tels que les diagnostiques, le traitement ou la prévention. Ces processus utilisent plusieurs ressources et font appel à plusieurs départements, spécialités et disciplines. Ceci rend ces processus très dynamiques, complexes et ad hoc. Dans cet ordre d’idées, il est judicieux de faire la distinction entre les processus organisationnels

et le processus de traitement médical. Comme mentionné par Lenz et Reichert (2007), les processus organisationnels aident à coordonner les professionnels de la santé et les unités or- ganisationnelles. De son côté, le processus de traitement médical est un processus spécifique au patient et dépend des décisions spécifiques qui diffèrent selon les cas. Les décisions sont prises en analysant les données spécifiques aux patients en fonction des connaissances médicales. Ce processus décisionnel est très complexe car il englobe les connaissances médicales, les lignes directrices médicales et l’expérience individuelle des médecins. L’exécution de ces processus engendre une énorme quantité des données disponible dans les bases de données du système de santé et représente une source d’informations précieuses qui nécessitent d’être traitée et exploiter afin de l’utiliser pour améliorer ce système et mieux contrôler la hausse du coût des soins de santé. Les bases de données administratives de leur côté contiennent les informations sur les soins donnés aux patients. Conséquemment, elles dévoilent les contraintes de la réalité et permettent de capturer les éléments décrivant la grande variété de situations réelles de soins médicaux. Pourtant, il existe un manque d’outils d’analyse efficaces pour explorer et extraire les informations potentielles qui peuvent être apportées par l’analyse de ces banques de données. L’exploration des banques de données à leur plein potentiel représente un défi car il nécessite des étapes complexes de prétraitement et une méthodologie adéquate qui répond à un problème bien défini. De ce fait, il y a une réelle préoccupation à cause de «l’absence d’un réel progrès pour appliquer les progrès des technologies de l’information pour améliorer les processus administratifs et cliniques» (Institute of Medicine (US), 2001).

À cet effet, le forage de processus dans le domaine médical fait le pont entre le forage de don- nées et l’informatique médicale. Il vise principalement à combler ce manque de méthodes et à concevoir et à utiliser des algorithmes spécialisés de forage de données afin de les appliquer aux ensembles de données contenus dans les bases de données médicales. Ceci permettra d’iden- tifier d’identifier les tendances, les modèles et les détails contenus dans le système médical. Le forage de processus vise ainsi à améliorer la détection et la compréhension des processus médicaux. La possibilité d’utiliser des techniques pour découvrir des modèles de processus offre de précieuses opportunités pour tirer parti des informations stockées dans les systèmes d’information médical. L’utilisation de techniques de forage de processus pour les processus dans le domaine médicale permet non seulement de s’assurer que ces processus peuvent être bien compris, mais peut également générer des avantages associés à l’efficacité du processus. Toutefois, le développement et l’application de forage de processus dans le domaine médical est un domaine relativement inexploré, avec seulement quelques travaux effectués dans la dernière décennie (Rebuge et Ferreira, 2012).

Toutefois, les techniques de forage de données fonctionnent bien sur des processus structurés, elles présentent des limites lors de l’application pour des processus moins structurés que l’on retrouve dans le système médical, où des déviations sont permises pour faire face à l’évolu- tion et à la complexité des circonstances (Song et collab., 2008). En effet, les processus dans

le système de santé sont des processus complexes qui peuvent varier à cause de plusieurs conditions et circonstances liés aux patients et aux ressources. Tel que mentionné par Rebuge et Ferreira (2012), la plupart des techniques et des algorithmes proposés pour le forage de processus ne sont pas utiles pour gérer le caractère complexe et ad hoc des processus médi- caux. Ces processus posent des défis liés à l’existence des plusieurs variantes de processus, au bruit et aux variantes exceptionnelles qui doivent être capturées et non négligées. Pour répondre à cette problématique, un autre champ de forage de processus vient d’apparaître comme une discipline de recherche relativement jeune qui est le regroupement de processus (process clustering en anglais). L’objectif est de partitionner les instances construites à partir des journaux d’événements pour générer des modèles de processus plus simples et plus struc- turés. Ces dernières années, quelques travaux récents ont été développés pour le regroupement des processus médicaux. Ferreira et collab. (2007) ont proposé le regroupement des séquences comme une approche pour traiter les processus. Ils estiment que leur approche représente un bon candidat pour le regroupement des processus. En effet, le regroupement de séquences consiste à développer des techniques capables de partitionner un certain nombre de séquences en groupes homogènes. Pour atteindre cet objectif, ils ont utilisé un algorithme de regroupe- ment basé sur des chaînes de Markov de premier ordre. Par la suite, des études basées sur l’utilisation de cette approche ont été proposées pour regrouper les processus médicaux. Par exemple, Rebuge et Ferreira (2012) ont proposé une méthodologie, également basée sur des chaînes de Markov de premier ordre, pour regrouper les processus composés des événements de soins qui sont fournis dans le service d’urgence d’un hôpital. Ils s’intéressaient au flux de travail de la radiologie en urgence, représenté comme un processus organisationnel de soins de santé. Les événements utilisés dans leurs études comprennent douze tâches différentes : demande d’examen et les onze états possibles de l’examen. De plus, Elghazel et collab. (2007) considèrent que les trajectoires des patients est une séquence de séjours hospitaliers et que chaque séjour hospitalier est représenté par deux éléments qualitatifs. Par conséquent, ils ont utilisé une approche basée sur la distance pour calculer les dissimilarités entre les trajectoires des patients et ils ont utilisé ces dissimilarités pour construire un graphe entre les trajectoires et utiliser une méthode basée sur la coloration de graphe pour regrouper ces trajectoires. Ils ont ensuite considéré que le comportement de chaque groupe de trajectoire est régi par un modèle de chaîne de Markov de premier ordre.

Huang et collab. (2013, 2014) ont appliqué l’allocation latente de Dirichlet (LDA) pour dé- couvrir des modèles latents comme une combinaison probabiliste d’activités cliniques. Ils ont supposé qu’une trajectoire clinique du patient est représentée par un mélange de patrons de traitement. Ils ont appliqué la LDA pour deux journaux de flux de soins spécifiques concernant l’hémorragie intracrânienne et l’infarctus cérébral. Ces journaux sont extraits d’un système d’information hospitalier. Le modèle donne l’estimation de la densité d’activité clinique pour chaque modèle, à partir de laquelle l’association probabiliste entre une activité et un patron peut être déterminé.

Toutes ces études s’appuient sur des processus composés d’événements relativement simples et bien définis. En outre, chacun d’eux était concerné par un aspect spécifique de la trajectoire d’un patient, mais non par une vue globale de l’ensemble des soins fournis. Rebuge et Ferreira (2012) ont travaillé sur les processus organisationnels, mais pas sur les processus de traite- ment médical. Huang et collab. (2013, 2014) et Elghazel et collab. (2007) ont travaillé sur le regroupement des processus de traitement médical. Huang et collab. (2013, 2014) étaient intéressés par la trajectoire de traitement du patient dans les séjours à l’hôpital qui donne une micro vue locale dans un site spécifique. Elghazel et collab. (2007) étaient intéressés par une succession de séjours hospitaliers. Ce travail fournit une vue plus globale et macro mais n’implique pas le processus de traitement médical complet puisqu’il y a des services autres que les séjours hospitaliers. De plus, la méthode utilisée par Elghazel et collab. (2007) n’est pas applicable à des données de grands volumes puisqu’elle utilise la dissimilarité par paire qui doit être calculée comme entrée pour construire et faire la détermination des groupes par une méthode heuristique de coloration de graphe. D’autre part, la méthode LDA peut donner un modèle qui n’est pas très informatif en raison de faibles valeurs de probabilité d’activité qui ne différencient pas clairement un patron d’un autre.

Les modèles de Markov cachés (HMM) sont une méthode stochastique qui ont connu un suc- cès pour la modélisation de données séquentielles et ont été prouvés efficaces et réussis dans de nombreuses tâches telles que la reconnaissance vocale (Rabiner, 1989). En se basant sur ces travaux, nous proposons donc d’utiliser cette méthode pour modéliser le comportement de chaque groupe de trajectoire sous la forme d’un modèle régi par un HMM. À notre connais- sance, le travail décrit ici est la première application du regroupement en utilisant les HMM pour regrouper les trajectoires de traitement médical.

Documents relatifs