Thesis
Reference
Comparaison de deux modèles de prédiction de la mortalité précoce des patients après un traumatisme cranio-cérébral sévère
KRAIEM BEN RACHED, Mohamed Aymen
Abstract
Les traumatismes cranio-cérébraux (TCC) représentent une cause majeure de décès et de handicap. Le but de cette étude est de comparer, chez des patients victimes de TCC sévères (Abbreviated Injury Score de la région de la tête : HAIS≥3), la performance pronostique (discrimination, calibration et validation) d'un modèle de prédiction basé sur le HAIS, la réactivité pupillaire et l'âge, avec le modèle de prédiction de référence incluant la composante motrice du Glasgow Coma Scale (msGCS), la réactivité pupillaire et l'âge. Nous avons réalisé une analyse secondaire d'une étude prospective observationnelle sur une cohorte de 808 patients victimes de TCC sévères en Suisse avec un suivi de la mortalité jusqu'au 14ème jour après le traumatisme. Une approche de non infériorité a été réalisée. La performance de prédiction de la mortalité à court terme (J14) du modèle basé sur le HAIS était non inférieure comparée à celle du modèle utilisé comme référence.
KRAIEM BEN RACHED, Mohamed Aymen. Comparaison de deux modèles de prédiction de la mortalité précoce des patients après un traumatisme cranio-cérébral sévère. Thèse de doctorat : Univ. Genève, 2019, no. Méd. 10943
DOI : 10.13097/archive-ouverte/unige:119061 URN : urn:nbn:ch:unige-1190611
Section de Médecine Clinique
Département APSI
Service d’Anesthésiologie
Thèse préparée sous la direction du Professeur Bernhard Walder
Comparaison de deux modèles de prédiction de la mortalité précoce des patients après un traumatisme cranio-‐cérébral sévère
Thèse
présentée à la Faculté de Médecine de l'Université de Genève
pour obtenir le grade de Docteur en médecine par
Mohamed Aymen KRAIEM BEN RACHED
de
Monastir (Tunisie)
Thèse n°10943
Table des matières
1. SYNOPSIS ... 4
2. PUBLICATION ... 5
3. REMERCIEMENTS ... 6
4. DECLARATION DE CONFLITS D’INTERET ET FINANCEMENT ... 7
5. GLOSSAIRE ... 8
6. RESUME STRUCTURE ... 9
7. INTRODUCTION ... 10
8. EPIDEMIOLOGIE ... 11
9. EVALUATION DE LA GRAVITE DES TRAUMATISMES CRANIO-‐CEREBRAUX ... 12
9.1. LE GLASGOW COMA SCALE (GCS) ... 12
9.2. L’ABBREVIATED INJURY SCORE (AIS) ... 14
10. MODELES DE PREDICTION CLINIQUE ... 17
10.1. GENERALITES ... 17
10. 2. INTERETS D’UN MODELE DE PREDICTION PRONOSTIC DANS LE CADRE DES TCC ... 17
10.3. LIMITES D’UN MODELE DE PREDICTION PRONOSTIC DANS LE CADRE DES TCC ... 18
10.4. MODELE IMPACT : ... 18
11. OBJECTIFS DE CETTE THESE : ... 19
12. ARTICLE (IN ENGLISH) ... 20
12.1. MATERIALS AND METHODS ... 20
12.1.1. Source of data ... 20
12.1.2 Study population and inclusion criteria ... 20
12.1.3. Outcomes and predictors ... 20
12.1.4. Sample size and missing data ... 21
12.1.5. Statistical analysis ... 21
12.2. RESULTS ... 23
12.2.1 Baseline characteristics ... 23
12.2.2. Model development ... 24
12.2.3. Models’ discrimination and comparison of model’s AUROCs ... 24
12.2.4. Calibration of the prediction models ... 24
12.2.5 Validation of the HAIS-‐based prediction model ... 24
12.3 DISCUSSION ... 25
12.3.1 Key findings ... 25
12.3.2 Interpretation of the results and implications ... 25
12.3.3 Comparison with previous studies ... 26
12.3.4 Limitations ... 26
12.3.5 Future implications ... 27
14.6 FIGURE 4B ... 30
14.7 TABLE 1 ... 30
14.8 TABLE 2 ... 30
14.9 TABLE 3 ... 30
15. REFERENCES ... 40
1. SYNOPSIS
Les lésions cranio-‐cérébrales d’origine traumatique ou traumatismes cranio-‐cérébraux (TCC) représentent une cause majeure de décès et de handicap. En Suisse, le taux de mortalité précoce (14 jours) après TCC sévère est de 24.5% chez l’adulte (16-‐65 ans), ce taux s’élève à 40.9 % chez les personnes âgées (≥ 65ans). Les survivants sont souvent confrontés à des séquelles qui peuvent être invalidantes à vie. Une meilleure prédiction du pronostic vital et fonctionnel après TCC est essentielle pour une utilisation rationnelle des ressources disponibles et une optimisation de la stratégie thérapeutique. Grace aux progrès de la modélisation statistique et la disponibilité de grandes bases de données, des modèles de prédiction robustes et généralisables ont été développés. Ils ont montré que la plus grande information pronostique pour un devenir non-‐favorable est contenue dans un ensemble de trois prédicteurs: l'âge, le score de Glasgow (en particulier la composante motrice : msGCS) et la réactivité pupillaire. L’Abbreviated Injury Score de la région de la tête (HAIS) est un score anatomique moins affecté par les facteurs externes que le GCS. Il permet d’évaluer à la fois l’étendue et la gravité des lésions. Le but de notre étude est de comparer, chez des patients victimes de TCC sévères (HAIS≥3), la performance pronostique d'un modèle de prédiction basé sur le HAIS, la réactivité pupillaire et l'âge, avec un modèle de prédiction utilisé comme référence incluant le msGCS, la réactivité pupillaire et l'âge. Nous avons réalisé une large étude de cohorte multicentrique en Suisse sur la période allant du 1er mai 2007 au 30 avril 2010.
808 patients victimes de TCC sévères admis dans les 11 trauma-‐centers participants ont été inclus avec un suivi de la mortalité jusqu’au 14ème jour après la survenue du traumatisme. Une approche de non-‐infériorité avec un seuil prédéfini pour l'absence de différence a été réalisée. Les résultats obtenus montrent que la précision de la discrimination ainsi que la calibration observées étaient similaires pour les deux modèles de prédiction. La validation interne du modèle de prédiction basé sur le HAIS était élevée. Ainsi notre étude a montré que la performance de prédiction de la mortalité à court terme (J14) du modèle basé sur le HAIS était non inférieure comparée au modèle de référence incluant le msGCS. Une validation externe de nos résultats est nécessaire pour confirmer ce résultat.
2. PUBLICATION
Le chapitre 12 a servi comme base à la publication d’un article dans un journal à politique éditoriale : Injury
Rached MAKB, Gaudet JG, Delhumeau C, Walder B : Comparaison oft two simple models for prediction of short term mortality in patients after severe traumatic brain injury
https://doi.org/10.1016/j.injury.2018.08.022
3. REMERCIEMENTS
Je tiens particulièrement à remercier mon directeur de thèse, le Professeur Bernhard Walder pour le soutien qu’il m’a apporté, pour sa patience et ses encouragements.
Je remercie également Madame Cécile Delhumeau, statisticienne, pour son aide précieuse.
Je remercie aussi ma femme Domitille et mes enfants Alexandre et Camille pour leur amour. Ils ont toujours été pour moi une source de force et de sérénité.
A mes parents qui seraient sans doute très fiers de moi.
4. DECLARATION DE CONFLITS D’INTERET ET FINANCEMENT
Ce travail de thèse n’a été financé par aucune source, privée ou publique.
L’auteur ne déclare aucun conflit d’intérêt en rapport avec la rédaction cette thèse.
5. GLOSSAIRE
TCC : Traumatisme cranio-‐cérébral CDC : Center of Desease Control GCS : Glasgow Coma Scale
msGCS : composante motrice du Glasgow Coma Scale AIS : Abbreviated Injury Score
HAIS : Abbreviated Injury Score de la région de la tête
IMPACT : The International Mission on Prognosis Analysis of Clinical trials TBI : Traumatic brain injury
ED : Emergency Department CT : Computed Tomography
AUROC: Area under the receiver-‐ operating curve, l'aire sous la courbe récepteur-‐opérateur IQR : inter-‐quartile range
EIQ : écart inter-‐quartile
95% CI: 95% confidence interval, intervalle de confiance à 95%
6. RESUME STRUCTURE
Introduction :
Les traumatismes cranio-‐cérébraux (TCC) représentent une cause majeure de décès et de handicap.
La composante motrice du Glasgow Coma Scale (msGCS) et l’Abbreviated Injury Score de la région de la tête (HAIS) sont des échelles pronostiques validées après TCC. Le but de cette étude est de comparer, chez des patients victimes de TCC sévères (HAIS≥3), la performance pronostique d'un modèle de prédiction basé sur le HAIS, la réactivité pupillaire et l'âge, avec un modèle de prédiction utilisé comme référence incluant le msGCS, la réactivité pupillaire et l'âge.
Matériels et méthodes :
Nous avons réalisé une analyse secondaire d’une étude prospective observationnelle sur une cohorte de 808 patients victimes de TCC sévères en Suisse avec un suivi de la mortalité jusqu’au 14ème jour après la survenue du traumatisme. La performance de la prédiction, basée sur la précision de la discrimination [aire sous la courbe du récepteur-‐opérateur (AUROC)], la calibration (test de Hosmer-‐
Lemeshow) et la validation (reéchantillonnage avec 2000 répétitions) pour l’optimisme des deux modèles de prédiction ont été analysées. Une approche de non-‐infériorité avec un seuil prédéfini pour l'absence de différence a été réalisée.
Résultats :
La cohorte incluait 808 patients avec un âge médian à 56 ans {écart inter-‐quartile=EIQ 33–71}, la médiane du msGCS observée à l’admission aux services des urgences était à 1 (EIQ 1–6), la réactivité des pupilles était anormale dans 29,0% des cas. Le taux de mortalité était de 29,7% à 14 jours. La précision de la discrimination était similaire (modèle de prévision basé sur le HAIS AUROC: 0,839;
modèle de prévision basé sur le msGCS AUROC: 0,826, différence entre les deux AUROC 0,013 (Intervalle de confiance (CI) à 95% :-‐ 0,007 à 0,037). Une calibration similaire a été observée pour les deux modèles (Hosmer-‐Lemeshow X2 11,64, p. = 0,168 vs. Hosmer-‐Lemeshow X2 8,66, p = 0,372). La
7. INTRODUCTION
Les lésions cranio-‐cérébrales d’origine traumatique ou traumatismes cranio-‐cérébraux (TCC) représentent un problème médical et socio-‐économique majeur à l’échelle mondiale [1]. Ils ont été qualifiés « d’épidémie silencieuse » du fait de la méconnaissance par la grande majorité des sociétés de leur impact dévastateur sur la vie quotidienne des patients et sur celles de leurs proches [2, 3]. Ce retard de prise de conscience est expliqué d’une part par la sous-‐estimation de l’incidence réelle des TCC et d’autre part par la non visibilité immédiate de leurs conséquences socio-‐économiques. Devant ce constat, certains pays comme les Etats Unis d’Amérique ont mis en place par le biais du Center of Desease Control (CDC), un registre national permettant un monitorage épidémiologique continu des patients victimes de TCC et ainsi de publier à intervalles réguliers des recommandations en matière de prévention et de prise en charge thérapeutique [4]. Il est important de noter que l’incidence des TCC est en augmentation à travers le monde et que la situation est particulièrement problématique dans les pays à moyens et faibles revenus. Compte tenu de ce contexte de santé publique, des outils de prédiction pronostic fiables faciliteraient non seulement la prise en charge clinique, mais permettraient également une répartition rationnelle des ressources en santé.
Ce travail de thèse est structuré en différents chapitres. Tout d’abord, une description des données épidémiologiques récentes des TCC. Ensuite, nous détaillons l’historique et les limites des principaux scores utilisés pour l’évaluation neurologique à la phase initiale après le traumatisme. Puis, nous abordons l’intérêt ainsi que les conditions nécessaires pour développer des modèles de prédiction pronostique dans le contexte particulier des TCC. Cette première partie de la thèse est rédigée en français. La partie suivante est une étude de cohorte observationnelle comparant deux modèles de prédiction pour la mortalité précoce (14 jours) après un TCC sévère : un modèle incluant le HAIS, l’âge et la réactivité pupillaire versus un modèle de référence basée sur le msGCS, l’âge et la réactivité pupillaire. Cette partie est rédigée en anglais ; elle correspond au texte d’une récente publication dans un journal à politique éditoriale. Une synthèse, de nouveau rédigée en français, clôture cette thèse.
8. EPIDEMIOLOGIE
Environ dix millions de personnes sont victime de TCC chaque année à travers le monde [5]. En Europe (737 millions d'habitants), 2.1 millions de personnes ont été hospitalisées et 82 000 sont décédées dans les suites d’un TCC en 2012. Les hommes ont été plus touchés que les femmes avec une incidence respective de 61% et 39%. Environ 37% des décès liés aux traumatismes toutes causes confondues ont été imputées aux TCC. Le taux de mortalité ajusté à l’âge a été de 12 pour 100 000 habitants avec des disparités importantes entre les pays européens. La Suisse est le pays d’Europe où le taux de mortalité (rapporté au nombre d’habitants) a été parmi le plus élevé puisque la même année (2012), 1620 personnes sont décédés dans les suites d’un TCC ce qui correspond à taux de mortalité de 22 pour 100000 habitants [6]. La mortalité à court terme (14 jours) reste élevée avec un taux de 24.5% chez l’adulte (16-‐65 ans), ce taux s’élève à 40.9 % chez les personnes âgées (≥ 65ans) [7] . Aux USA les chiffres sont tout aussi importants, en 2004, il était estimé que 5.3 millions de résidents américains souffraient de séquelles plus ou moins graves liés à un TCC [2, 8].
Les TCC représentent une cause majeure de mortalité et de morbidité surtout chez l’adulte jeune [4, 9] mais ces dernières années nous avons assisté à une augmentation progressive de leur incidence chez les personnes âgées (≥ 65ans) surtout dans les pays à hauts revenus [7, 10]. Les survivants sont souvent confrontés à des séquelles qui peuvent être invalidantes tel que des déficits neurocognitifs (trouble de l’attention, ralentissement de l’apprentissage verbal) ou des troubles neuropsychiatriques tel que des épisodes dépressifs (30 à 70% des survivants de TCC) ou encore des comportements agressifs. Ces troubles des comportements peuvent affecter les relations interpersonnelles des patients victimes de TCC entrainant leur isolement social voir leur institutionnalisation à long terme [2, 11, 12] sans oublier les couts considérables qui en découlent à charge de la société [13].
Les principales causes des TCC sont représentées par les accidents de voiture et toutes les causes liées au transport (p. ex., accidents de vélo, collisions avec des piétons), les chutes (en particulier chez la personne âgée et le jeune enfant), les agressions et les activités sportives.
9. EVALUATION DE LA GRAVITE DES TRAUMATISMES CRANIO-‐CEREBRAUX
9.1. Le Glasgow Coma Scale (GCS)
L'évaluation neurologique est particulièrement importante à la phase initiale après le traumatisme car elle va conditionner la stratégie diagnostique et thérapeutique. Plusieurs scores ont été proposés pour évaluer la gravité des TCC dès le début de leur prise en charge. Le score de Glasgow (GCS) reste le score le plus utilisé, il permet, à un instant donné, d’évaluer le niveau de conscience des patients victimes de TCC (tableau 1). Il a largement contribué à la standardisation des protocoles d’évaluation précoce des patients cérébrolésés à travers le monde [14]. Simple d’utilisation, le GCS a été introduit pour la première fois par Teasdale et Jennett en 1974 [15], il évalue les réponses à l’ouverture des yeux (de 1 à 4 points), les réponses verbales (de 1 à 5 points) et les réponses motrices à la commande et à la stimulation nociceptive (de 1 à 6 points). Un état comateux avec GCS ≤ 8 définit un TCC sévère et est associé à un pronostic défavorable [16]. Cependant, la corrélation, initialement retrouvée dans les études de validation entre le GCS et le devenir des patients, est de plus en plus remise en cause dans la littérature [17, 18]. Des études ont montré une grande variabilité dans l’estimation du GCS en fonction du niveau d’expérience de l’examinateur ou de la nature du stimulus utilisé [19, 20]. Par ailleurs, l’utilisation du GCS n’est pas validé en cas de traumatisme de la face, de prise de stupéfiants ou d’alcool ou encore en cas de stress psychologique important [21]. La prise en charge pré hospitalière précoce des patients atteints de TCC sévère nécessite une sédation et une intubation trachéale rendant ainsi l’évaluation des réponses oculaires et verbales du GCS non pertinentes. Plus encore, une étude récente a montré que le GCS ne permettait pas de prédire le recours à une intervention neurochirurgicale dans les suites d’un TCC [22]. Les limites de ce score ont poussé de nombreux auteurs à proposer des échelles d’évaluation neurologique simplifiées qui n’évaluent que la composante motrice du Glasgow (msGCS) chez les patients les plus graves [23-‐25].
Des études montrent que le msGCS et le GCS total sont équivalents dans la prédiction du devenir des TCC soulignant ainsi le caractère hautement discriminant de la composante motrice dans le GCS [23, 26, 27].
Tableau 1 : Score de Glasgow
Ouverture des yeux : Y Réponse verbale : V Réponse motrice : M
6 -‐ Exécution des ordres simples
5 -‐ Cohérente, orientée Adaptée, orientée à la douleur
4 Spontanée Confuse En flexion (évitement)
3 Sur ordre Inappropriée Décortication
2 A la stimulation
douloureuse Incompréhensible Décérébration
1 Absente Absente Absente
9.2. L’Abbreviated Injury Score (AIS)
D’autres auteurs ont proposé l’utilisation de l’Abbreviated Injury Score (AIS) (tableau 2) qui représente un catalogue précis de plus de 2.000 lésions, cotées de 1 (mineure) à 6 (constamment mortelle), par ordre de gravité, concernant neuf territoires du corps humain (tête, face, cou, thorax, abdomen, rachis, membres supérieurs, membres inférieurs, surface externe) [28, 29]. L’AIS été créé en 1974 par l’American Medical Association’s Commitee on Medical Aspects of Automative Safety avec pour but de standardiser les données concernant la fréquence et la gravité des blessures des victimes d'accidents de la route. Ce comité multidisciplinaire était constitué de spécialistes en ingénierie automobile, médecine, anatomie/physiologie et accidentologie. L’AIS représente un score anatomique, (par opposition au GCS qui est un score physiologique) et une imagerie diagnostique est nécessaire dans la plupart des cas pour obtenir une notation précise. Très utilisé en traumatologie, l’AIS a l’avantage d’être moins affecté par les facteurs externes comme la sédation, l’intubation trachéale, la consommation d’alcool ou encore le traumatisme facial. Mais à l’instar du GCS il fait l’objet de plusieurs critiques, en effet, l’AIS ne décrit qu’une seule lésion par territoire et il existe une variabilité entre les examinateurs dans l’évaluation de la gravité des lésions [30]. Toutefois, le Head Abbreviated Injury Scale (HAIS) ou l’AIS qui concerne la région de la tête (tableau 3) constitue une échelle pronostique validée pour les patients victimes de TCC [31]. En combinant les signes fonctionnels (ex : céphalées, amnésie, perte de connaissance) et les signes physiques retrouvés à l’examen neurologique (ex : réponse motrice), le HAIS permet d’évaluer à la fois l’étendue et la gravité des lésions cérébrales [32] . Le TCC est qualifié de « sévère » lorsque le score HAIS est ≥ 3.
Les rares études qui ont comparé le GCS initial et le HAIS ont montré une faible corrélation entre ces 2 scores ainsi que des résultats différents en terme de prédiction de mortalité dans le contexte des TCC [33-‐37].
Tableau 2 : Score AIS (Abbreviated Injury Scale)
Score AIS Sévérité des lésions
1 Mineures
2 Modérées
3 Sérieuses
4 Sévères
5 Critiques
6 Probablement mortelles
Tableau 3: Score HAIS (Abbreviated Injury Scale for Head Injury)
Score AIS Exemples de traumatismes cranio-‐cérébraux
1 : Mineures Lésions mineurs du scalp
2 : Modérées
Perte de connaissance <1h Amnésie post-‐traumatique Lésion d’un nerf crânien Fracture calvariale simple
3 : Sérieuses
Lésions vasculaires cérébrales Fractures de la base du crane Fracture calvariale comminutive Petites contusions parenchymateuses Hémorragie sous arachnoïdienne traumatique
Perte de connaissance de 1 à 6 heures
4 : Sévères
Hématomes
Fractures plus sévères de la base du crane Perte de connaissance de 6 à 24 heures
5 : Critiques
Hématomes plus sévères
Lésions vasculaires cérébrales plus sévères Perte de connaissance > 24 heures
6 :
Probablement mortelles
Lésions par écrasement (Crush injury)
10. MODELES DE PREDICTION CLINIQUE
10.1. Généralités
L’établissement d’un diagnostic ou d’un pronostic par un clinicien se fait à la suite d’une combinaison intuitive entre les données cliniques (anamnèse, examen clinique), para-‐cliniques (biologique et radiologique) et enfin l’expérience clinique du praticien. Ce raisonnement appelé aussi « sens clinique » aussi performant soit-‐il peut avoir des limites. Par opposition à l’expertise clinique, les modèles de prédiction prennent en compte des facteurs multiples et variés et quantifient leur contribution individuelle au diagnostic ou au pronostic. Il s’agit de modèles mathématiques et statistiques développés à partir de populations spécifiques. Une validation externe est nécessaire pour déterminer la capacité du modèle à prédire de manière fiable le pronostic dans des populations différentes du contexte de leur développement. Pendant longtemps, les prédictions n'étaient rien de plus que des prophéties [38]. L’évolution des processus de prise de décision clinique, les progrès de la modélisation statistique et la disponibilité de grandes bases de données ont permis l’évolution de la recherche pronostique en partant de description d'associations univariées et multivariées pour aboutir à des quantifications de la valeur prédictive ajoutée et au développement de modèles pronostiques.
10.2. Intérêts d’un modèle de prédiction pronostic dans le cadre des TCC
Une prédiction du pronostic vital et fonctionnel après TCC est essentielle pour une meilleure utilisation des ressources disponibles et une optimisation de la stratégie thérapeutique. En effet, la prise en charge des TCC sévères dans un centre de neuro-‐réanimation spécialisé permet d’améliorer leur pronostic [39, 40]. Il est important de noter que ces modèles sont conçus pour prédire le pronostic de groupes d’individus et non pas de façon individuelle pour un patient. Néanmoins, les informations fournies par ces modèles peuvent éclairer la prise de décision clinique. Lorsque leurs prédictions pronostiques sont placées dans un contexte approprié et discutées par des experts cliniques, ces données peuvent proportionner les attentes réalistes des familles des patients et fournir une base rationnelle pour les décisions concernant le projet thérapeutique. De plus,
10.3. Limites d’un modèle de prédiction pronostic dans le cadre des TCC
Le développement de modèles de prédiction pronostique pour les TCC est une tâche difficile en raison de l'hétérogénéité au sein de la population de patients, des différences substantielles dans le risque pronostique de base, et la complexité des critères de jugement. Bien que divers modèles prédictifs aient été développés pour être utilisés dans le cadre des TCC, des limitations importantes ont été identifiées dans le développement de plusieurs de ces modèles [44, 45]. Les problèmes spécifiques sont liés au surajustement (overfitting) et au manque de validation externe. Pour être utilisable cliniquement, un modèle pronostique doit être robuste et largement généralisable. Le modèle IMPACT répond à ces critères.
10.4. Modèle IMPACT
Le modèle IMPACT (The International Mission on Prognosis Analysis of Clinical trials) a été développé à partir d’une base de données collectées prospectivement de patients victimes de TCC modérés et sévères dans huit essais contrôlés randomisés et trois études observationnelles (total n = 8509) [46].
Il a montré que la plus grande information pronostique est contenue dans un ensemble de trois prédicteurs présents à l’admission après TCC et qui sont : l'âge, le score de Glasgow (en particulier le msGCS) et la réactivité pupillaire. Diverses études [47, 48] ont démontré que ce modèle est grandement généralisable dans d'autres contextes et populations. Nous avons ainsi utilisé ce modèle comme référence pour la comparaison avec le modèle développé dans notre étude et qui inclut le HAIS, l’âge et la réactivité pupillaire.
11. OBJECTIFS DE CETTE THESE :
Comme exposé précédemment, le HAIS est un score anatomique moins affecté par les facteurs externes que le GCS. Il qui permet d’évaluer à la fois l’étendue et la gravité des lésions cérébrales.
L’objectif de cette thèse est de comparer, chez des patients victimes de TCC sévères (HAIS≥3), la performance pronostique d'un modèle de prédiction basé sur le HAIS, la réactivité pupillaire et l'âge, avec le modèle IMPACT utilisé comme référence incluant le msGCS, la réactivité pupillaire et l'âge. Il s’agit d’une analyse secondaire d’une étude prospective observationnelle multicentrique (11 trauma-‐
centers en Suisse) sur une cohorte incluant 808 patients victime de TCC sévères avec un suivi de la mortalité jusqu’au 14ème jour après la survenue du traumatisme. La performance de la prédiction, basée sur la précision de la discrimination, la calibration et la validation pour l’optimisme des deux modèles de prédiction sont les principales questions soulevées dans cet article.
12. ARTICLE (IN ENGLISH)
12.1. MATERIALS AND METHODS
This report complies with the TRIPOD guideline [49].
12.1.1. Source of data
We used an existing dataset from a prospective epidemiological cohort study including patients with severe TBI who were followed up for 14 days (or till time of death) from the time of injury [7]. The study was approved by the ethics committees of each participating trauma center. Because eligible patients were unable to give informed consent on enrolment, local study coordinators contacted their legal representatives (proxies) to inform them of the study within 14 days following injury.
Written consent was requested from patients or proxies. Follow-‐up was discontinued, and all collected data discarded, any time consent was not granted or withdrawn.
12.1.2 Study population and inclusion criteria
We included patients ≥16 years who sustained severe TBI from both blunt and penetrating trauma in Switzerland between May1, 2007 and April 30, 2010. Severe TBI was defined by a HAIS >3. The neurosurgeon or radiologist in charge was responsible for HAIS scoring based on clinical assessments and head computer tomography imaging. The worst head CT scan within the first 24 hours was used and assessed using a standardized data sheet. Patients who died before neurosurgical or radiological diagnosis were excluded. Additionally, patients with unclear brain trauma history (for instance, comatose patients found on a public area without observation by bystanders) or absence of brain trauma (for instance, fatal multi-‐trauma patients with abdominal and thoracic injuries without visual injuries to the head) were excluded. Finally, patients who died during the prehospital phase, as well as those with missing predictors [msGCS in emergency department (ED), pupil reactivity in ED, age]
were also excluded.
Predictors:
i. Patient characteristics: Age
ii. Initial physiological and biological variables: GCS total score and msGCS, pupil reactivity at hospital admission in the ED
iii. Severity of TBI: HAIS score based on clinical assessment and head CT scan performed within 24 hours of injury
12.1.4. Sample size and missing data
The sample size was prespecified [7]. To improve predictive accuracy and to decrease bias in regression coefficients, we limited potential predictors to variables with sufficient events per variable [50]. A total of 11 patients who died on scene were excluded. We excluded 102 patients with missing predictive factors. The msGCS was not available in 77 (8.4%) patients. Assessment of pupil reaction was missing in 31 (3.4%) patients (Figure 1 and Supplementary table 1).
12.1.5. Statistical analysis
Patients’ baseline characteristics were described as distribution with medians and inter-‐quartile ranges (IQR) for continuous variables and frequencies and percentages for categorical variables.
Descriptive statistics were conducted for the entire population and for two subgroups: survivors versus non-‐survivors at 14 days.
The predictor “age” was presented as a distribution (median, inter-‐quartile range = IQR). The predictor “msGCS” was presented as a distribution and as categories (1-‐2, 3-‐4, 5-‐6). The predictor
“HAIS” was presented as a distribution and as categories (HAIS 4, HAIS 5, HAIS 6). Relationship
We decided pre hoc to develop a prediction model based on data from the ED similar to the reference prediction model (IMPACT core model) [51, 52].[51, 52] Age was used continuously;
msGCS, and HAIS were categorized for the purpose of this study.
First, we refitted the IMPACT core model [51, 52] by including the following 3 predictors: msGCS on ED admission, pupillary reactivity on ED admission and age. This prediction model was considered as our reference model.
Second, we tested the performance of another prediction model similar to the refitted IMPACT core model, replacing the msGCS with HAIS. In both cases, we used multivariable logistic regression methods to predict the outcome of death within 14 days.
To assess the performance of each prediction model, we determined their amount of explained variation (by Nagelkerke’s pseudo R2 and deviance models), their level of discrimination [area under the receiver-‐operating curve (AUROC)] and calibration (by calibration slope and intercept).
While the Nagelkerke’s R2 measures the explained variation of a model, the deviance estimates the
‘goodness-‐of-‐fit’ of a model. It is defined as twice the difference between the log likelihoods of two models: a fitted model and a full model representing "the most complete model we could fit". The better the goodness of fit, the smaller the deviance.
12.1.5.2 Models’ discrimination and comparison of models’ AUROCs
The AUROCs of the two fitted models (reference prediction model and HAIS-‐based prediction model) were calculated to evaluate their discriminative ability. The AUROC values range from 0.5 to 1.0, where 1.0 indicates perfect discrimination and 0.5 means that the model does not perform any better than chance alone. Generally, AUROCs >0.90 are considered excellent, >0.80 good, >0.70 modest and ≤0.70 poor [53].
To compare the AUROC curves of each model, we calculated the difference in AUROCs by subtracting the AUROC of the reference prediction model from the AUROC of the HAIS-‐based prediction modes.
instance, proposed that differences in AUROC less than -‐0.10 or -‐10% would be small enough to lack clinical importance [54]. We adopted a more conservative approach to non-‐inferiority: we considered any difference of -‐0.05 or more between the AUROCs (non-‐inferiority margin), or any difference of 5% or more between the discriminative abilities, to be clinically relevant. As a result, the HAIS-‐based prediction model would be non-‐inferior to the reference prediction model if the lower bound of the 95% CI of the difference AUROCs remains above -‐0.05 or -‐5.0% [55].
12.1.5.3. Calibration of prediction models
Calibration of the two fitted models aims to verify that predicted and observed outcomes remain concordant across all risk categories. We used the Hosmer-‐Lemeshow test to test concordance [53].
The test first divides the data points into equally sized intervals based on estimated mortality risk, then calculates a Χ2 for each interval. The smaller the value of Χ2, the larger the p-‐value, the better the calibration.
To graphically express the level of calibration of the HAIS-‐based prediction model, we plotted the predicted death rate at 14 days (x-‐axis) against the observed death rate at 14 days (y-‐axis). When calibration is perfect, the predicted and observed death rates are linearly related along a 45° line. We also plotted the observed death rate at 14 days by interval of predicted death rate to graphically illustrate the Hosmer-‐Lemeshow goodness-‐of-‐fit test. We repeated the same procedure for the reference prediction model.
12.1.5.4. Validation of the HAIS-‐based prediction model
We used a bootstrapping procedure with 2000 repetitions to correct for optimistic HAIS-‐based prediction model’s AUROC estimates [56]. This method aims to avoid issues related to overfitting.
Whenever optimistic AUROCs are close to initial AUROCs, overfitting is unlikely.
A total of 808 patients were included in this study (Figure 1). The median age was 56 (IQR 33-‐71), the median GCS on ED admission was 3 (IQR 3-‐14), the median msGCS on ED admission was 1 (IQR 1-‐6), 432 patients (53.5%) had a msGCS equal to 1 or 2. Abnormal pupil reactivity was observed in 234 patients (29.0%). The overall mortality rate at 14 days for the entire study population was 29.7% (240 out of 808 patients) (Table 1).
Non-‐survivors were significantly older and presented with worse brain injuries in univariate analyses (Table 1). HAIS scores and msGCS scores were inversely related: the greater the HAIS score, the lower the msGCS (p<0.0001; Figures 2a). This association remained valid irrespective of pupil reactivity (pnormal pupil reaction<0.0001 and pabnormal pupil reaction=0.001; Figure 2b).
12.2.2. Model development
The odds ratios for age and for pupil reaction were similar in both models (Table 2). Compared to the reference prediction model, the HAIS-‐based model had a similar predictive power (Nagelkerke’s pseudo R2: 39.5% vs. 36.6%; deviance 720 vs 742).
12.2.3. Models’ discrimination and comparison of model’s AUROCs
Both models reached good levels of discrimination with AUROCs ≥ 0.800 (Table 3, Figure 3). The difference between the 2 AUROCs was 0.013 (95%CI -‐0.007 – +0.037). Since the lower bound of the 95% CI was inferior to the pre-‐specified non-‐inferiority margin of -‐0.05, the HAIS-‐based prediction model was judged non-‐inferior to the reference prediction model.
12.2.4. Calibration of the prediction models
Overall, both prediction models were appropriately calibrated (Hosmer-‐Lemeshow Χ2 11.64, p=0.168; Hosmer-‐Lemeshow Χ2 8.66, p=0.372; Table 3, Figure 4a and 4b).
12.2.5 Validation of the HAIS-‐based prediction model
12.3 DISCUSSION
12.3.1 Key findings
The study observed a robust relationship between an anatomical or structural description of TBI using the HAIS and a physiological or functional description using the msGCS. This association was observed for patients with normal and abnormal pupil reactivity. Therefore, we demonstrate that the HAIS may replace the msGCS in prediction models for mortality within 14 days after TBI.
The discriminative accuracy of the HAIS-‐based prediction model was not inferior to the reference prediction model for the prediction of death at 14 days. Both models had good discrimination and appropriate calibration for short-‐term mortality prediction.
12.3.2 Interpretation of the results and implications
The observation that the HAIS-‐based model is non-‐inferior to the reference prediction model has several implications. First, accurate prediction of early mortality following TBI is feasible even in absence of an initial total or msGCS assessment. Since HAIS is often assessed for coding and accounting reasons, it should be readily available. Second, should external validation studies confirm the discriminative accuracy of the HAIS-‐based prediction model, risk assessment following TBI will be also achievable using this additional, simple approach. The armamentarium of mortality prediction tools will be more varied, contributing to improved early decision making and better resource management. By reducing the over-‐ and underestimation of risk after TBI, this clinically important aspect will contribute to improve our ability to predict early mortality following TBI. HAIS is particularly meaningful in cases where the GCS on admission is normal or near normal, as is often the case with elderly patients [33, 57]. Third, while initial GCS assessment are often missing in clinical
reasoning and clinical judgment were used. The one available study comparing the total GCS vs. a simplified GCS to estimate the non-‐inferiority boundary concluded that any predictive performance difference inferior to 10% is clinically non-‐relevant [54]. Given the little evidence available, we used a more conservative approach and declared any predictive performance difference inferior to 5%
clinically non-‐relevant.
12.3.3 Comparison with previous studies
MsGCS was a much stronger predictor of death within 14 days than HAIS in 2808 patients suffering from TBI and admitted to 8 U.S. Level I trauma centers [37]. Timmons et al. analyzed this data with Cox proportional hazards regressions methods, but failed to formally investigate the predictive performance of their model, which may decrease the validity of their conclusions.
In a single center study including 270 patients, a multi-‐linear regression analysis was performed with the Glasgow Outcome Scale extended (GOSE) at 1 year as the main outcome [34]. The authors concluded that HAIS and ISS outperformed GCS as predictors of GOSE. Again, in this smaller study, no formal analyses of the predictive performances were tested.
12.3.4 Limitations
This study has several limitations. First, we had to exclude some patients with missing data. Patients excluded due to missing predictive factors were demographically comparable to those without predictive factors, thereby reducing the risk of systematic bias. Second, since the study was performed in a high-‐income country, it cannot be generalized to middle or low income countries where limited access to CT imaging may complicate HAIS assessment. Third, while the study used a reference prediction model which was established with younger patients (IMPACT model) [51, 52], the greater median age in our cohort introduced a potential risk of case-‐mix bias. However, the IMPACT model was previously validated in a high-‐income country with a similar older population [58]. Fourth, the timing of predictor assessments was slightly different between the two prediction models: the msGCS was assessed on admission, whereas the HAIS was assessed 24 hours after admission. The impact of this time difference on the outcome is difficult to estimate, but is probably
performance. However, our reference model was based on the IMPACT model which used age as a continuous variable, therefore, we had applied the same methodology.
12.3.5 Future implications
Although both prediction models perform well at predicting short term mortality after severe TBI, they are not perfect. The following candidate predictors should be tested for further improvement:
multiple trauma [59], pre-‐existing co-‐morbidities assessed with the Charlson score [60] and post-‐
injury complications such as pneumonia [61] and/or transfusion of platelets [62].
13. SYNTHÈSE
Cette étude de cohorte multicentrique a mis en évidence une relation robuste entre une description anatomique ou structurelle du TCC utilisant le HAIS et une description physiologique ou fonctionnelle utilisant le msGCS. Cette association a été observée chez les patients présentant une réactivité normale et anormale de la pupille. Nous avons démontré que le HAIS peut remplacer le msGCS dans les modèles de prédiction de la mortalité dans les 14 jours suivant le TCC. Plusieurs implications sont secondaires aux résultats de cette étude. Premièrement, il est possible de prédire avec précision la mortalité précoce après un TCC, même en l'absence d'une évaluation initiale totale ou msGCS. Le HAIS est souvent évalué pour des raisons de codage et de facturation, il est facilement disponible.
L'arsenal des outils de prédiction de la mortalité est renforcé, ce qui contribuera à améliorer la prise de décision précoce et la gestion des ressources. Deuxièmement, le HAIS est particulièrement utile dans les cas où la GCS à l'admission est normale ou proche de la normale, comme c'est souvent le cas chez les patients âgés [33, 57] car la fiabilité du GCS est limité chez ces patients. Troisièmement, alors que les études cliniques et les registres de patients atteints de TCC ne fournissent pas toujours une évaluation initiale du GCS, le HAIS est souvent disponible. Nous proposons qu'il puisse être utilisé pour minimiser la quantité d'informations neurologiques manquantes dans les bases de données cliniques. Des bases de données plus volumineuses, plus complètes et plus robustes facilitent la recherche clinique, les audits, les évaluations comparatives de la qualité des soins entre les différents centres de traumatologie.
La force et l’originalité de l’étude résident dans le fait qu’elle s’appuie sur une étude comparative de non-‐infériorité de deux modèles de prédiction utilisant une cohorte importante. Lors du choix de la limite de non-‐infériorité, le raisonnement statistique et le jugement clinique ont été utilisés. La seule étude disponible comparant le GCS total par rapport à un GCS simplifié pour estimer la limite de non-‐
infériorité a conclu que toute différence de performance prédictive inférieure à 10% était cliniquement non pertinente [54]. Compte tenu du peu de preuves disponibles, nous avons utilisé une approche plus conservatrice et avons déclaré toute différence de performance prédictive inférieure à 5% comme cliniquement non pertinente. Par conséquent la non-‐inferiorité est encore plus pertinente dans notre étude.
la tomodensitométrie peut compliquer l'évaluation du HAIS. Troisièmement, alors que l’étude utilisait un modèle de prédiction de référence établi avec des patients plus jeunes (modèle IMPACT) [51, 52], l’âge médian plus élevé de notre cohorte introduisait un risque potentiel de biais de mixité.
Cependant, le modèle IMPACT avait déjà été validé dans un pays à revenu élevé avec une population âgée similaire [58]. Quatrièmement, le moment des évaluations des prédicteurs était légèrement différent entre les deux modèles de prédiction: le msGCS a été évalué à l'admission, tandis que le HAIS a été évalué jusqu’à 24 heures après l'admission. L’impact de cette différence de timing d’évaluation du prédicteur sur le résultat est difficile à estimer, mais a probablement une pertinence mineure. Cinquièmement, notre modèle de prédiction basé sur HAIS n'a pas été validé dans une cohorte externe. Nous pensons que le risque de surajustement est faible compte tenu des valeurs corrigées d'optimisme comparables d'AUROC pour les deux modèles de prédiction.
En conclusion, bien que ces deux modèles de prédiction permettent de prédire de manière adéquate la mortalité à court terme après un TCC sévère, ils ne sont pas parfaits. Pour être plus performants, les potentiels variables prédictives suivantes devront être évalués: les traumatismes multiples [59], les comorbidités préexistantes évaluées par le score de Charlson [60] et les complications post-‐
traumatiques telles que la pneumonie [61] et / ou la transfusion de plaquettes [62].
14. TABLE AND FIGURES
14.1 Figure 1 14.2 Figure 2 14.3 Figure 3a 14.4 Figure 3b 14.5 Figure 4a 14.6 Figure 4b 14.7 Table 1 14.8 Table 2 14.9 Table 3
Figure 1. Flow chart of enrolled and included patients.
Patients with inclusion criteria and consent n=921
10 deaths on arrival of OHEMS
Patients with predictive factors n=808
Patients with inclusion criteria and consent n=911
Patients with inclusion criteria and consent n=910
102 patients with missing predictive factors 1 death on scene after arrival of OHEMS
Figure 2a. Distribution of the categories of HAIS and motor GCS at ED.
0100200300400500Number of patients
020406080100Percent
4 5 6
HAIS
Subscale motor score 1-2 of GCS Subscale motor score 3-4 of GCS Subscale motor score 5-6 of GCS Number of patients
Figure 2b. Distribution of the categories of subscale motor score of GCS on ED and HAIS stratified in patients with normal pupil reactivity and abnormal pupil reactivity.
0100200300
Number of patients
020406080100Percent
4 5 6
HAIS
Subscale motor score 1-2 of GCS Subscale motor score 3-4 of GCS Subscale motor score 5-6 of GCS Number of patients
Normal pupil reaction
0100200300
Number of patients
020406080100Percent
4 5 6
HAIS
Abnormal pupil reaction
Figure 3. Accuracy of discrimination (AUROC) for the HAIS-based predictive model and the reference predictive model.
0. 00 0. 25 0. 50 0. 75 1. 00
Se nsi tivi ty
0.00 0.25 0.50 0.75 1.00
1-Specificity
HAIS-based predictive
model AUROC: 0.839 Reference predictive model AUROC: 0.826 Reference