• Aucun résultat trouvé

Proportion de l’effet du traitement expliqué (PE, Proportion explained)

Dans le document en fr (Page 31-34)

2.2 Approche de validation basée sur un essai clinique

2.2.1 Proportion de l’effet du traitement expliqué (PE, Proportion explained)

La validation du critère (2.5) pose une difficulté conceptuelle telle que discutée par Freedman et al. (1992) en ce sens où elle exige que le test statistique de l’effet du traitement sur T (βS) soit non significatif lorsqu’on ajuste sur S. Ainsi, le critère (2.5) pourrait permettre de rejeter un faible critère de substitution, lorsque le test sur l’effet du traitement après ajustement sur S reste significatif. En revanche le critère (2.5) reste inadéquat pour valider un bon critère de jugement en ce sens où il est difficile de prouver que l’hypothèse nulle (H0: βS = 0) est vraie, car le non rejet de H0 pourrait simplement être dû à un problème de puissance. Cette observation justifie donc l’utilisation des tailles d’échantillons élevées afin de mettre en évidence un effet significatif s’il existe. Par ailleurs, comme discuté par Burzykowski et al. (2005), même en

l’absence du problème de puissance, la signification statistique des tests non ajustés et ajustés ne permet pas de quantifier l’impact du critère de substitution sur l’analyse du vrai critère de jugement. En effet, la signification statistique ne peut pas prouver que S permet de capturer l’effet intégral du traitement sur T . De ces observations, Freedman et al. (1992) ont suggéré de se focaliser sur la proportion de l’effet du traitement expliquée (P E) par S. Ainsi, un bon critère de substitution permettra d’expliquer une large proportion d’effet. Étant donné le triplé (T, S, Z), P E est défini comme suit:

P E(T, S, Z) = β− βS

β = 1−

βS

β (2.13)

où β et βS sont les estimations des effets du traitement Z sans et avec ajustement sur S. Par exemple, β et βS peuvent être obtenus à partir des modèles (2.7) et (2.10) dans le cas de deux variables de Gauss. Un critère de substitution valide exige queP E soit égale à 1. En pratique, un critère de substitution sera acceptable si la borne inférieure de l’intervalle de confiance deP E est proche de 1. Buyse et al. (2016) ont discuté des difficultés émanant de l’utilisation de PE. Notamment, P E tend à être instable lorsque β est proche de 0, une situation qui peut arriver en pratique. Par ailleurs, l’intervalle de confiance de P E aura tendance à être large et parfois avec des bornes situées au-delà de la limite [0, 1], sauf en cas de grande taille d’échantillon (ce qui est possible en faisant recours à des données de méta-analyse) ou d’un grand effet du traitement sur T (ce qui n’est pas courant en pratique). Un autre problème viendrait de la mauvaise spécification du modèle (2.10). En présence d’une interaction significative dans ce modèle entreS et T (voir Equation 2.14), la définition même de P E deviendrait problématique. Tj = ˜µT + ˜βSZj+ ˜ρZSj+ γZjSj+ ˜Tj (2.14) Ces difficultés fondamentales issues de la définition du P E ont donc amené Buyse and Molenberghs (1998) à proposer deux autres métriques permettant la validation des critères de substitution.

2.2.2

Effet relatif et association ajustée [Relatif affect and adjusted

association ]

Buyse and Molenberghs (1998) ont proposé de remplacer P E par deux nouvelles mesures

d’association. La première étant l’effet relatif (RE) qui est le rapport des effets du traite- ment sur le vrai critère de jugement et le critère de substitution:

RE(T, S, Z) = β

2.2. APPROCHE DE VALIDATION BASÉE SUR UN ESSAI CLINIQUE

oùβ, α et les paramètres de variances associés sont obtenus à partir des modèles (2.6) à (2.8). Si on peut faire l’hypothèse d’une relation multiplicative entre β et α et si RE était connu, il pouvait être utilisé pour prédire l’effet du traitement sur T à partir de l’effet observé sur S. En pratique,RE est plutôt estimé, et la précision de l’estimation doit être pertinente pour une meilleure précision de la prédiction. RE ainsi défini permet de mesurer la qualité du critère de substitution au niveau de la population, et vaut1 pour une validité parfaite comme ont suggéré Buyse and Molenberghs (1998).

La deuxième quantité proposée par Buyse and Molenberghs (1998) permet de prendre en compte l’association au niveau individuel entre les deux critères de jugement, après prise en compte de l’effet du traitement. Il s’agit de l’association ajustée (ρz). Si les variables S et T sont issues d’une distribution normale, l’association ajustée est définie ainsi :

ρz =

σST √σ

SSσT T

(2.16)

oùσST,σSS etσT T sont les éléments de la matrice de variances-covariancesΣ définie dans (2.8). Tout comme précédemment, on aura une validité parfaite au niveau individuel pour le critère de substitution si ρz vaut1. Toutefois, il convient en pratique de juger du niveau d’association acceptable pour considérer un critère de substitution comme valide.

Au-delà des problèmes cités plus haut émanant de la définition du RE, Molenberghs et al. (2002) ont montré que P E pouvait s’écrire comme une fonction de RE et et ρz. En effet, si on définit λ2 = σ

T Tσ−1SS, alors λρz = σSTσSS−1 et à partir de (2.11) et (2.13), on obtient:

βS = β− ρzλα P E = λρz α β = λρz 1 RE. (2.17)

Cette nouvelle formulation duP E permet de voir cette quantité comme une mesure prenant en compte l’association au niveau individuel et au niveau essai. Seulement, à partir de (2.17),P E peut prendre n’importe quelle valeur, et donc des valeurs au delà de1, rendant son interprétation difficile en tant que proportion.

Par ailleurs, la difficulté dans l’utilisation du RE réside au niveau de son intervalle de confiance qui peut être très large et de l’impossibilité de vérifier l’hypothèse de la relation mul- tiplicative entre les effets du traitement (voir équation 2.15) en s’appuyant sur des données issues d’un seul essai clinique. Face à ce constat, Buyse et al. (2000) ont suggéré de généraliser le concept de validation au niveau individuel et au niveau de la population dans un contexte de méta-analyse ou d’études multicentriques. L’usage des données issues de méta-analyse d’essais cliniques randomisés permet d’améliorer la précision des estimations dans le processus de vali-

dation des critères de substitution, de limiter les problèmes de puissance statistique, et surtout de prendre en compte l’hétérogénéité au niveau essai. Ainsi, un critère intermédiaire validé comme critère de substitution à partir des données de méta-analyse pourra être utilisé dans tout autre essai pour prédire l’effet du traitement sur le critère de jugement final.

2.3

Approche de validation en contexte de méta-analyse

Dans la suite de ce chapitre, nous supposons disposer des données individuelles issues d’une méta-analyse d’essais cliniques randomisés incluanti = 1· · · G essais, et que chaque essai inclue j = 1· · · ni sujets. Le nombre total de sujets dans cette méta-analyse vaut N . Soit Tij et Sij deux variables aléatoires décrivant les observations du sujet j de l’essai i sur le critère de jugement principal et sur le critère de substitution, et Zij l’indicatrice de traitement pour le même sujet.

Dans le document en fr (Page 31-34)