• Aucun résultat trouvé

Chapitre 4. Matériel et méthodes : deuxième projet

4. Analyse principale

Plan d’analyse statistique

Tel que mentionné, certains patients ont subi plus d’une transplantation, bien que la plupart d’entre eux n’en aient subi qu’une seule. Ainsi, la corrélation intrinsèque de ces patients devait être prise en compte par un modèle statistique approprié. Comme l’issue principale était une issue ordinale de grade d’insuffisance rénale aiguë (0, 1, 2 ou 3), un modèle de cotes proportionnelles cumulatives estimé par équations d’estimation généralisées a été utilisé avec le package « multigee »150. Comme une corrélation similaire entre les transplantations, basée sur

les caractéristiques intrinsèques des patients, devait être supposée, une matrice de corrélation de type échangeable a été sélectionnée et des erreurs-types robustes basées sur l’analyse des résidus ont été employées. Le numéro de dossier de l’hôpital a été utilisé comme identifiant unique indiquant la « niche » et l’ordre chronologique respecté des transplantations en créant une variable d’ordre de greffes par patient. Le temps entre les transplantations n’a pas été considéré dans les modèles; peu de sujets ont subi plusieurs transplantations, ce temps était très différent d’un sujet à l’autre et il n’était pas nécessaire pour corréler les caractéristiques intrinsèques des patients. L’erreur alpha a été fixée à 0,05 pour tous les tests statistiques principaux et secondaires. Les résultats sont rapportés avec des intervalles de confiance à 95 %. Les analyses statistiques ont été réalisées avec le logiciel R, version 3.5.2, avec l’interface RStudio, version 1.1.463.

Analyses descriptives

Des analyses descriptives ont été réalisées afin de caractériser la population en utilisant le package « summarytools »151. Vingt-neuf patients (5.9 % de l’échantillon) ont subi deux

transplantations et 5 patients (1 % de l’échantillon) en ont subi trois. Ces analyses descriptives des caractéristiques de la population sont résumées au Tableau VI de la section résultats du chapitre 5. Les données catégorielles ont été rapportées en proportions et les données continues en moyennes avec écart-types. Les données continues avec distribution grossièrement asymétrique (évaluée par histogramme et avec « skewness » > 1) ont été rapportées en médiane

avec distance interquartile. Enfin, les diagnostics préopératoires ont été catégorisés à nouveau en un nombre plus limité.

Analyses bivariables

Des analyses bivariables ont été réalisées pour chacune des variables indépendantes prévues dans le modèle complet d’association avec un modèle de cotes proportionnelles cumulatives estimé par équations d’estimation généralisées. Le but de ces analyses consistait à explorer l’effet de ces variables, avant ajustement multivariable, sur l’issue principale. Les résultats des analyses bivariables n’ont pas permis de déterminer l’inclusion de quelque variable que ce soit dans le modèle multivariable principal; ce choix s’est fait en fonction du modèle d’association présenté à la figure 5.

Test de proportionnalité

Une première étape de la modélisation multivariable a consisté à estimer des modèles ordinaux sans matrice de corrélation avec le package « VGAM »152. Un test de ratio de vraisemblance

comparant un modèle de cotes proportionnelles cumulatives à un modèle de logit adjacents a suggéré le rejet de l’hypothèse de proportionnalité de l’effet selon l’exposition principale (p = 0.043). Comme l’effet du bilan liquidien sur l’issue était nul, le test a été réalisé de nouveau avec les variables dont l’effet était statistiquement significatif dans le modèle complet avec corrélation a posteriori (Cf. Résultats). La proportionnalité de l’effet sur l’insuffisance rénale aiguë à 48 heures était respectée pour l’âge, le MELD et la durée d’ischémie froide; il en va de même sur l’insuffisance rénale aiguë à 7 jours pour l’âge (Cf. résultats).

Estimation du modèle multivariable

Le modèle multivariable a été estimé en utilisant le bilan liquidien comme variable indépendante principale, tel que mentionné précédemment, et ajusté pour les variables de confusion évoquées ci-avant. Il a été estimé sur les cinq jeux de données avec imputations, et les coefficients de régression et leurs variances ont été combinés. L’effet du bilan liquidien sur le risque de changer de catégorie d’insuffisance rénale, ajusté pour la confusion, a ainsi été estimé. Le modèle a été inversé afin qu’un rapport de cotes proportionnelles au-dessus de 1 indique une augmentation du risque d’IRA plus grave. Quatorze (14) variables indépendantes ont été incluses, ce qui peut être toléré par un modèle ayant entre 61 et 154 événements par catégorie (entre 4,4 et 11 événements par variable).

Une relation potentiellement quadratique entre l’issue et le bilan liquidien a été explorée en modèle multivariable; elle s’est avérée inexistante. Le bilan a aussi été divisé en catégories à la recherche d’un autre type de relation; aucun effet n’a non plus été observé. Enfin, l’interaction entre les variables significativement associées à l’issue a été explorée et était absente.

Évaluation de la multicolinéarité

La multicolinéarité a été évaluée par le calcul du VIF (Variance Inflation Factor). Ceci dit, ce dernier était impossible avec le modèle estimé par équations d’estimation généralisées. Cette statistique a donc été calculée sur un modèle de cotes proportionnelles standard. Le VIF associé à chaque variable indépendante ne suggérait pas de problème de multicolinéarité (< 2 pour chaque variable). Le VIF est la statistique recommandée pour détecter la multicolinéarité (une valeur > 5-10 suggère que la variable engendre de la multicolinéarité dans le modèle). 153

Analyses de sensibilité

Les analyses de sensibilité suivantes ont été réalisées : imputation de la catégorie AKI = 3 aux patients décédés avant 48 heures, utilisation de la créatininémie seulement pour déterminer l’issue, catégorisation dichotomique de l’issue, imputation de la valeur 0 aux valeurs d’ascite manquantes et estimation sur jeu de données avec données complètes seulement. Un modèle avec le total de chaque type de solution de réanimation liquidienne administrée comme variables indépendantes, ajustés pour les saignements et l’ascite, en plus des autres facteurs confondants, a été aussi estimé par combinaison de modèles estimés sur jeux de données avec imputations. Autres éléments de l’analyse principale

Une comparaison des différents modèles quant à leur meilleure adéquation des données n’a pas pu être réalisée pour cette analyse, puisqu’aucun package permettant le calcul de la statistique d’adéquation QIC des modèles GEE n’a été trouvé pour les modèles ordinaux. Enfin, l’analyse des résidus ne donnait aucune information pertinente pour ce modèle.