Les nouveaux modes de paiement nécessitent le développement et le test de modèles d’ajustement au risque et

PARTIE 2 – PROPOSITIONS POUR L’ONDAM 2019 ET LE RESPECT DES OBJECTIFS – LES

3. N OUVEAUX MODES DE PAIEMENT

3.4. Les nouveaux modes de paiement nécessitent le développement et le test de modèles d’ajustement au risque et

complexes

Les nouveaux modes de rémunération visent à dépasser les limites des modes de financement classiques, en particulier ceux liés au volume d’activité produite. En contrepartie de ces effets positifs attendus, on s’expose à la survenue d’effets non désirés. Ainsi, un forfait qui ne tiendrait pas compte de la diversité de profils de patientèle entre les médecins (par exemple un forfait unique, dépendant seulement du nombre de patients et non de la diversité de leur état clinique) serait injuste pour les médecins ayant la patientèle la plus lourde (et par voie de conséquences pour leurs patient), rémunérés au même niveau que les autres et pourrait les inciter à la sélection des patients pour « optimiser » la lourdeur des prises en charge en regard du niveau de paiement. La mise en place de paiements liés à la valeur, estimée par l’amélioration d’indicateurs de résultats chez un patient ou un groupe de patients, comporte également des risques d’effets non désirés. Il faut par exemple s’assurer que la variation de l’indicateur correspond bien à une amélioration du résultat des soins, et non à l’effet d’un facteur extérieur, ou tout simplement du hasard.

Ces deux exemples illustrent l’importance de pouvoir moduler ou ajuster les modes de paiement pour tenir compte de ces effets indésirables et tenter de les neutraliser. Cela repose sur la définition et l’usage de modèles statistiques parfois complexes, appelés modèles de risque, d’ajustement ou encore modèles prédictifs. Ils sont appelés à devenir des outils incontournables dans les modes de paiement, mais aussi plus largement dans la prise en charge des patients dans une médecine dite personnalisée.

Le niveau de complexité mathématique de ces modèles et leur caractère souvent opaque, en font toutefois des outils dont l’application pratique peut poser des difficultés aux acteurs de terrain. L’un des enjeux autour de la mise en place de ces nouveaux modes de paiement est donc de trouver un juste équilibre entre la pertinence mathématique des modèles et leur faisabilité en pratique courante.

Deux exemples de ce type de travaux sont présentés ci-dessous : l’élaboration de deux indices de morbidité adaptés à la population générale française et la prédiction du risque d’hospitalisation après passage par les urgences. Ils illustrent à la fois le potentiel d’utilisation et les limites de ce type de travaux.

3.4.1 Ajustement sur le risque et modèles prédictifs : de quoi parle-t-on?

L’ajustement sur le risque désigne les méthodes statistiques qui permettent de tenir compte de niveaux de risques différents entre deux populations pour les rendre comparable. Il repose sur la modélisation du risque et l’identification de facteurs qui augmentent ou diminuent ce risque. Par exemple, le risque de survenue de certaines pathologies dépend de l’âge des personnes concernées. Si on compare la fréquence de ces pathologies dans deux populations ayant une structure d’âge différente, toute différence dans cette fréquence

Le SNDS, de par la richesse de l’information qu’il contient, offre de nombreuses possibilités en modélisation prédictive.

Encadré 1 : Le vocabulaire de la modélisation prédictive

La modélisation prédictive consiste à analyser des faits présents et passés, qualifiés de « prédicteurs », pour estimer la probabilité de survenue d’un évènement futur, appelé « évènement à prédire » ou « outcome ».

Objectif

En santé, les modèles de prédiction peuvent couvrir différents objectifs comme ajuster sur l’état de santé de populations à comparer, comparer des offreurs de soins, élaborer des modèles de paiements ou identifier des populations à risques.

Evènement à prédire et perspective temporelle

Selon l’objectif principal, l’évènement à prédire peut être une variable de type binaire (survenue d’un évènement) ou de type continue (dépenses pour des modèles de paiement par exemple). Il est important de préciser la perspective temporelle de la prédiction : les modèles de prédiction du risque de mortalité à un an ou à trente jours, par exemple, ne seront pas identiques.

Prédicteurs

Les prédicteurs utilisés dans le modèle varient selon l’objectif de l’étude. Il peut s’agir de variables sociodémographiques, de données relatives à l’état de santé, d’informations sur le recours aux soins ou encore de l’antécédent de l’évènement à prédire.

Population

La population d’étude est divisée en une population pour élaborer le modèle prédictif et une population pour mesurer et valider les performances prédictives. Ainsi, les performances prédictives reflétées par la concordance entre les prédictions et les observations, sont évaluées sur des individus n’ayant pas contribué à l’élaboration du modèle.

Modélisation

La stratégie de modélisation et le modèle statistique utilisés dépendent des objectifs de l’étude et de la nature de l’évènement à prédire. Pour des évènements de type binaire ou de type continu, les modèles de la classe des modèles linéaires généralisés (GLM) sont utilisés. Avec l’essor des méthodes spécifiques de traitement des données massives, ou « Big data », et l’augmentation des puissances de calcul, des méthodes performantes d’apprentissage statistiques sont apparues (réseau de neurone, méthodes à noyau, forêts aléatoires…). Ces modèles, encore peu utilisés en santé, permettent une plus grande robustesse des estimations ainsi que des performances prédictives plus importantes que les modèles de type GLM mais pèchent par une plus grande complexité d’interprétation.

Score

Les modèles permettent d’estimer un score par patient, reflétant le risque de survenu de l’évènement à prédire. Ce score est une prédiction par exemple du risque de mortalité, des dépenses de soins attendues ou de la probabilité de survenue d’un l’évènement d’intérêt.

Performance prédictive globale

La performance globale du modèle est mesurée par l’écart entre les prédictions du modèle et les résultats constatés dans la réalité. Pour un évènement à prédire de type binaire, la C-statistique permet de mesurer la concordance entre prédictions et réalisations observées de l’évènement pour l’ensemble de la population étudiée, appelée discrimination. Cette mesure varie de 0.5 (le modèle ne prédit pas mieux que le hasard) à 1 (le modèle prédit parfaitement l’évènement). On considère généralement que la performance devient acceptable à partir d’une valeur de 0.7. Pour un évènement à prédire de nature continue, la performance globale peut être mesurée par la part de la variance totale qui est expliquée par le modèle, le coefficient de détermination, noté R2.

Performance prédictive et critères de décision

Pour utiliser les prédictions du modèle comme une aide à la décision en santé, il est nécessaire de fixer un « seuil de score » au-dessus duquel les individus seront considérés comme « à risque élevé de réalisation de l’évènement ». A partir de ce seuil, les performances prédictives du modèle peuvent être évaluées par des mesures comme la sensibilité, la spécificité, la valeur prédictive positive et négative. La variation de la sensibilité et la spécificité en fonction du seuil est représentée graphiquement par la courbe ROC (Receiver Operating Characteristic) et la valeur de l’aire sous la courbe ROC équivaut à la valeur de la C-statistique du modèle. Dans le cadre d’un modèle visant à identifier des personnes à risque, la fixation du seuil de score doit résulter d’un compromis entre précision du modèle et ciblage d’un maximum de patients.

3.4.2 Ajustement sur l’état de santé : présentation de deux indices de morbidité élaborés à partir des données de la cartographie

Dans ce travail, deux indices de morbidité ont été développés, l’un prédictif de la mortalité à deux ans⁵⁷, l’autre prédictif des dépenses totales de soins, hospitalière comme ambulatoires, à deux ans⁵⁸, en fonction du profil de pathologie des individus, apprécié par les donnée de la cartographie médicalisée des dépenses pour les années 2013 à 2015. La population cible est celle de personnes âgées de 65 ans ou plus non sélectionnée sur une pathologie particulière ni à partir d’une hospitalisation et de ce fait représentative de l’ensemble des consommants⁵⁹ de la cartographie à l’échelle nationale.

Tous les consommants du Régime Général, vivants et âgés de 65 ans ou plus au 31/12/2013 (7 672 111 individus) ont été aléatoirement répartis en deux populations : une population de développement (3 836 056 individus) pour l’élaboration des indices et une population de validation (3 836 055 individus) pour mesurer leurs performances prédictives sur des observations différentes (Encadré 1).

Au total, 16 pathologies ont été sélectionnées pour contribuer au calcul de l’indice prédictif de mortalité et 19 pathologies au calcul de l’indice prédictif de dépenses totales. Le Tableau 44 présente, pour les deux indices, la liste de ces pathologies avec leur poids correspondants.

Tableau 44 : Synthèse des prédicteurs et des poids correspondants pour le calcul de chacun des deux indices de morbidité, l’indice prédictif de mortalité et l’indice prédictif de dépenses

Prédicteurs Indice de mortalité

(MRMI)

Indice de dépenses (ERMI) Sexe

masculin 1 /

Age Un poids de « 1 » correspond à l’effet de 5 années

supplémentaires d’âge

65-69 0 0

70-74 1 1

75-79 2 2

80-84 3 3

85-89 4 4

90-94 5 5

95-99 6 6

>=100 7 7

Pathologies

Maladie coronaire 0 2

Accident Vasculaire Cérébral 1 3

Insuffisance cardiaque ou Troubles du rythme ou maladie valvulaire 1 3

Artériopathie oblitérante du membre inférieur 1 3

Diabète 1 4

Cancer actif 3 7

Cancer sous surveillance 0 2

Troubles psychotiques 1 6

Dépression et troubles bipolaires 1 5

Troubles addictifs 2 5

Démences (dont maladie d'Alzheimer) 2 2

Maladie de Parkinson 1 5

Sclérose en plaque ou Paraplégie 2 9

Epilepsie 1 3

Maladies respiratoires chroniques 1 3

Les résultats de l’application de ces deux indices (MRMI et ERMI) à la population de validation, comparativement à des méthodes d’ajustement de référence (ajustement âge et sexe, indices de Charlson adaptés) permet de tirer deux enseignements principaux sur leur performance (Tableau 45).

Le premier enseignement est que l’utilisation d’indices prenant en compte la morbidité et l’âge est plus performante que les techniques d'ajustement de références. Ainsi pour la méthode la plus performante est le MRMI pour la morbidité et l’ERMI pour les dépenses. Le second enseignement est que un score est performant relativement à l’objectif pour lequel il a été créé. Ainsi, alors que le MRMI est le plus performant pour décrire la mortalité il ne l’est pas pour décrire les dépenses. A l’inverse, l’ERMI est performant en matière de dépenses et l’est beaucoup moins pour la mortalité.

Utilisés tels que nous les avons présentés, les deux indices de morbidité élaborés à partir de la cartographie peuvent servir de variables d’ajustement ou de stratification sur l’état de santé dans des études utilisant les données du SNDS. Il est aussi possible d’utiliser ces indices pour prendre en compte l’état de santé dans des modèles destinés, à l’ajustement sur le risque ou à l’identification de populations à risque, y compris dans des modèles de paiement.

Ces résultats ont d’importantes implications opérationnelles dans une perspective de l’utilisation de méthodes d’ajustement au risque pour des financements prospectifs : il apparait ainsi indispensable de développer des méthodes d’ajustement spécifiques pour ces modèles de paiement et non de reprendre des modèles développés à d’autres fins.

Tableau 45 : Performance pour la prédiction de la mortalité et des dépenses totales de soins, des indices MRMI et ERMI et de différentes versions de l’indice de Charlson

Indices de

(équivalent à l’aire sous la courbe ROC)

Part de la variance totale expliquée Modèle sans indice de morbidité

Age et sexe 0.761 [0.760-0.762] 3.4%

Indices prédictif de mortalité

Indice de Charlson princeps 0.674 [0.673-0.675] 12.4%

Indice de Charlson avec âge 0.800 [0.799-0.801] 14.4%

MRMI 0.825 [0.824-0.826] 15.4%

Indices prédictifs de dépenses

Indice de Charlson adapté aux coûts 0.681 [0.680-0.682] 13.0%

ERMI 0.797 [0.796-0.798] 21.8%

Note de lecture : La performance pour prédire la mortalité et pour prédire les dépenses totales a été mesurée pour chaque modèle. Des modèles incluant uniquement l’âge et le sexe, ou uniquement un indice de morbidité, ont été évalués. Les indices Mortality-Related Morbidity Index (MRMI) et Expenditure-Related Morbidity Index (ERMI) sont les deux indices élaborés à partir de la cartographie, prédictifs de la mortalité et des dépenses totales, respectivement.

3.4.3 Exemple de modélisation prédictive : identification d’une population à risque d’hospitalisation après passage par les urgences

Le recours aux urgences est un phénomène complexe à analyser, combinant différents facteurs tels que les besoins de soins d’une population, sa structure d’âge, mais aussi des situations de précarité, les habitudes de consommation de soins ou la structure de l’offre ambulatoire sur le territoire. Parmi ces recours, ceux qui sont suivis d’hospitalisation correspondent à des situations qui pourraient dans certains cas être anticipés par une meilleure connaissance des parcours de santé de ces populations et ainsi permettre de cibler des actions d’amélioration de leur prise en charge en ville.

Dans cet objectif, la modélisation prédictive du risque d’hospitalisation après passage aux urgences chez les personnes âgées de 60 ans ou plus a été étudiée à l’aide des données du SNDS. L’événement à prédire était le passage aux urgences suivi d’une hospitalisation complète (au moins 1 jour) au cours de l’année 2014. Un ensemble de près de 200 variables extraites du SNDS et de la cartographie des pathologies et des dépenses a été testé pour sélectionner une liste réduite de prédicteurs à inclure dans le modèle. Au final, 23 variables ont été retenues dans le modèle prédictif. Ces variables correspondent à des caractéristiques mesurées fin 2013, pour prédire le risque d’hospitalisation au cours de l’année 2014. Elles sont classées selon le type d’information qu’elles apportent, dans le Tableau 46.

Tableau 46 : Variables utilisées pour prédire le risque d’hospitalisation après passage aux urgences chez les personnes âgées de 60 ans ou plus en France

Type d’information

(nombre de variables) Variables utilisées Déterminants démographiques

. Indice de défavorisation de la commune de résidence Etat de santé

(1 variable)

. Indice synthétique de morbidité prédictif des dépenses (indice ERMI), calculé sans attribuer de poids pour l’âge (étant donné que l’âge est pris en compte dans le modèle par ailleurs)

Recours aux soins au cours de l’année précédant l’évènement à prédire

(13 variables)

. Dépenses remboursées pour les postes suivants, reflétant l’intensité du recours aux soins de ville : médecins généralistes, médecins spécialistes, infirmier·e·s, kinésithérapeutes, Médicaments, Biologie, Transport, LPP

(classes de montants adaptées à chacune des 8 variables) . Passage aux urgences sans hospitalisation au cours de chacun des 4 trimestres de l’année 2013 (oui/non)

. Admission en EHPAD au cours de l’année 2013 (oui/non) Antécédent de l’évènement à prédire

(4 variables)

. Hospitalisation après passage aux urgences au cours de chacun des 4 trimestres de l’année 2013 (oui/non)

Conformément à la méthode classique en modélisation prédictive, le modèle a été élaboré sur une partie de la population d’étude (2/3 des observations) et sa performance prédictive a été mesurée sur des observations différentes (1/3 de la population d’étude).

Le résultat de ces tests de performance prédictive est présenté dans le Tableau 47. De manière attendue, la performance prédictive du modèle varie selon le type d’information qui y sont inclues. Ainsi certaines informations comme l’âge, le sexe et les autres-déterminants sociodémographiques présents dans le SNDS⁶⁰ offrent des performances médiocres, même combinées, pour prédire le risque d’hospitalisation. A l’inverse, l’état de santé et plus encore la consommation de soins l’année précédente ont une plus grande performance prédictive. Le modèle le plus performant était celui qui associait l’ensemble des données disponibles.

Dans la pratique, on pourrait envisager d’utiliser un tel score afin d’identifier des populations à risque d’hospitalisation, dans l’objectif de leur proposer des services adaptés pour prévenir la survenue de ces évènements. De manière moins proactive, une autre utilisation possible serait de mettre cette information à disposition d’un médecin traitant pour chacun de ses patients, lui permettant au moment de la consultation d’identifier les patients les plus à risque afin d’adapter leur prise en charge en conséquence.

En fonction de la finalité de son usage, les caractéristiques du score de risque peuvent varier : - Quel est un niveau acceptable de performance (une probabilité de 76 % est-elle suffisante) ?

- Le gain de performance associé à l’ajout de nouvelles variables contrebalance-t-il la perte de lisibilité et l’augmentation de complexité du score ?

Tableau 47 : Performance pour la prédiction du risque d’hospitalisation après passage aux urgences chez les personnes âgées de 60 ans ou plus, en fonction du type d’information utilisée

Type d’information utilisée pour la prédiction

Performance prédictive (C-statistique, équivalent à l’aire sous la courbe ROC) 1 seul bloc

précédant l’évènement à prédire 0.721 Antécédent de l’évènement à

prédire 0.589

ERMI* 0.724

* La variable « état de santé » correspond à l’indice ERMI calculé sans attribuer de poids pour l’âge. L’indice ERMI utilisé seul, combine l’équivalent des deux blocs « âge et sexe » et « état de santé ».

Note de lecture : Plus la valeur de la c-statistique augmente en se rapprochant de 1, plus la prédiction est performante. L’information qui contribue le plus à la performance du modèle complet est le recours aux soins l’année précédant l’évènement à prédire. L’indice prédictif des dépenses ERMI qui combine état de santé et âge a aussi une bonne performance prédictive.

3.5. Références

1 Pross C, Geissler A, Busse R. Measuring, Reporting, and Rewarding Quality of Care in 5 Nations: 5 Policy Levers to Enhance Hospital Quality Accountability. Milbank Q 2017;95:136–

83. doi:10.1111/1468-0009.12248

2 Cheryl Cashin, Y-Ling Chi, Peter Smith, Micheal Borowitz, Sarah Thomson. Paying for Performance in Health Care. European Observatory on Health Systems and Policies-OCDE.

3 Eckhardt H, Smith P, Quentin W. Pay for Quality. In: Improving Quality of Care in Europe: A systematic overview of quality strategies. Busse R, Klazinga N, Panteli D, Quentin W (forthcoming).

4 Zuckerman RB, Joynt Maddox KE, Sheingold SH, et al. Effect of a Hospital-wide Measure on the Readmissions Reduction Program. N Engl J Med 2017;377:1551–8. doi:10.1056/NEJMsa1701791 5 OECD. Better Ways to Pay for Health Care. OECD Publishing 2016.

doi:10.1787/9789264258211-en

6 Dummit LA, Kahvecioglu D, Marrufo G, et al. Association Between Hospital Participation in a Medicare Bundled Payment Initiative

and Payments and Quality Outcomes for Lower Extremity Joint Replacement Episodes. JAMA 2016;316:1267.

doi:10.1001/jama.2016.12717

7 Wohlin J, Stalberg H, Ström O, et al. Effects of introducing bundled payment and patients’ choice of provider for elective hip and knee replacements in Stockholm. Stockholm: 2017.

http://www.sll.se/PageFiles/1783843077/Nytt%20ers%C3%A4ttn

ingssystem%20och%20v%C3%A5rdval%20h%C3%B6ft-

%20och%20kn%C3%A4proteskirurgi%20-%20uppf%C3%B6ljningsrapport_ISBN.pdf (accessed 11 Aug 2017).

8 Charlesworth A, Davis A, Dixon J. Reforming payment for health care in Europe to achieve better value. London: : Nuffield Trust 2012. http://www.nuffieldtrust.org.uk/publications/reforming-payment-health-care (accessed 25 Mar 2016).

Propositions sur nouveaux modes de paiement

Proposition 19 : Mieux prendre en compte la qualité et la pertinence dans le financement des soins en renforçant les dispositifs existants et en expérimentant des modalités nouvelles dans le cadre de l’article 51 de la LFSS 2018

La prise en compte de la qualité et de la pertinence dans les modes de financement des soins peut prendre différentes formes opérationnelles. Les dispositifs actuellement mis en œuvre en France méritent d’évoluer et d’être renforcés, y compris financièrement, pour dépasser leurs limites et avoir un impact plus important. Par ailleurs, sur la base de la littérature académique et des expériences étrangères, on peut identifier différents modèles de financement qui pourraient être expérimentés en France, certains permettant d’avoir une approche construite autour des parcours des soins.

L’Assurance Maladie propose de faire évoluer les dispositifs de financement à la performance de droit commun, pour donner un poids plus important à la qualité et la pertinence des soins, en tenant compte des enseignements des expériences étrangères, sur les dimensions suivantes :

- Améliorer leur lisibilité pour les rendre plus accessibles aux professionnels de santé ; - Ajuster les indicateurs à la complexité de la patientèle ou de la population considérée ;

- Mobiliser un nombre et une diversité d’indicateurs suffisants pour rendre compte de la diversité des parcours et des situations cliniques, sans que ce nombre ne soit trop important ;

- Choisir des indicateurs légitimes aux yeux des professionnels et en faire évoluer régulièrement la liste ; - Dans la mesure du possible, dans le cas des établissements de santé, adresser les paiements à l’échelle

des pôles ou des services, plutôt qu’à l’établissement ; - Favoriser des intéressements sous forme de bonus.

L’Assurance Maladie propose que soient menées de manière complémentaire, dans le cadre de l’article 51 de la LFSS 2018, des expérimentations de modes de tarification des soins prenant en compte la qualité ou le résultat des soins. Ces expérimentations auront pour objet de valoriser des démarches de parcours et cibleront des situations de non-qualité particulièrement inacceptables ou très évitables. Ces expérimentations pourront être portées localement ou faire l’objet d’appels à manifestation d’intérêt nationaux. En particulier, les modes de financement suivants pourront être testés :

- Valorisation des meilleurs pratiques dans les tarifs (« best practice tariff » anglais),

Dans le document Améliorer la qualité du système de santé et maîtriser les dépenses - Propositions de l’Assurance Maladie pour 2019 - APHP DAJDP (Page 185-0)