• Aucun résultat trouvé

Tests statistiques des hypothèses

Analyse statistique des données

8.4 Études analytiques

8.4.1 Tests statistiques des hypothèses

Un test d’hypothèse comporte plusieurs étapes : Étape 0. Identifier l’hypothèse nulle.

C’est un nouvel énoncé de l’hypothèse de recherche sous la forme “nulle”, par exemple “traitement sans effet”, “aucune différence entre les taux de survie”, “aucune différence entre les taux de prévalence”, “risque relatif égal à un”, etc. L’hypothèse nulle est souvent énoncée dans les objectifs de recherche. L’hypothèse nulle doit être “testable”, c’est-à-dire il doit être possible d’identifier quels sont les paramètres à estimer, et il doit être possible d’estimer le paramètre, son écart-type et la distribution d’échantillonnage, grâce au plan de l’étude.

Étape 1. Déterminer les niveaux a et b des risques d’erreur acceptables dans l’inférence.

Comme l’inférence est basée sur un échantillon de la population, on ne peut jamais être absolument sûr que l’hypothèse nulle est vraie ou fausse en ce qui concerne la population. La décision est dichotomique : accepter l’hypothèse nulle Ho ou rejeter Ho. Deux risques d’erreur d’inférence sont possibles. Le risque d’erreur de première espèce (α) est la probabilité de rejeter l’hypothèse nulle par erreur lorsqu’elle est vraie, et le risque d’erreur de deuxième espèce (β) est la probabilité d’accepter l’hypothèse nulle par erreur lorsqu’elle est fausse. Ceci est résumé dans le tableau suivant :

Situation dans la population Decision (basée H0 est vraie H0 est fausse sur les résultats

sur échantillon)

Accepter H0 Pas d’erreur Erreur de deuxième espèce ou β Rejeter H0 Erreur de Pas d’erreur

première espèce ou α

Noter que le but de l’étude est de minimiser à la fois α et β ; cependant, ces erreurs jouent en sens inverse. Si l’une diminue, l’autre tend à augmenter. Souvent l’investigateur planifie l’étude pour avoir le niveau désiré pour α, et minimise β pour cette condition. Le test statistique d’hypothèse est donc souvent réalisé après choix de α et du meilleur test statistique disponible qui minimisera β. Le choix de α et β est fait après avoir déterminé les conséquences de chacune de ces erreurs et il est fixé au moment de l’étude.

Étape 2. Déterminer le meilleur test statistique adapté à l’hypothèse nulle énoncée.

Ce test dépend du plan d’étude, du type de variable et du type de distribution de probabilité de la variable. Par exemple, l’hypothèse nulle postulée est que les taux de prévalence d’une maladie parmi deux groupes de population sont les mêmes. Des échantillons sont tirés au hasard et indépendamment dans les deux groupes de population.

La variable, de nature discrète dichotomique, est la maladie, et la taille de l’échantillon est fixée. La distribution de probabilité dans les populations est donc binomiale et le paramètre de cette distribution est le taux de prévalence ; celui-ci est estimé par les taux de prévalence dans les échantillons. Ceux-ci ont une distribution approximativement normale (distribution d’échantillonnage). Donc des tests de z ou de χ2 sont les plus appropriés (voir ci-après).

Étape 3. Faire le test statistique

Il s’agit de calculer la grandeur statistique (z ou χ2) et de comparer la valeur calculée avec la distribution théorique. Si la valeur observée est en dehors des limites entre lesquelles la probabilité est

inférieure à α pour la distribution d’échantillonnage, l’hypothèse nulle est rejetée.

Étape 4. Calculer la puissance du test.

Si l’hypothèse nulle n’est pas rejetée, c’est-à-dire si la valeur calculée de la grandeur statistique est entre les limites pour α, alors la puissance statistique du test (1 - β) doit être calculée pour un certain écart minimum acceptable par rapport à l’hypothèse nulle. Si la puissance statistique est trop basse, on peut recommander de répéter l’étude avec une taille d’échantillon plus grande. Si la puissance est acceptable, on peut accepter l’hypothèse nulle.

Quelquefois, au lieu de décider l’acceptation ou le rejet de Ho, on compare la grandeur statistique avec la distribution d’échantillonnage et on calcule la valeur de α pour laquelle le test va rejeter l’hypothèse nulle ; elle est appelée la valeur P du test.

Dans l’exemple ci-dessus, si la valeur calculée de z est inférieure à –1,96 ou supérieure à +1,96 (ou si d’une façon équivalente, la valeur de χ2 est supérieure à 3,84), on doit rejeter l’hypothèse nulle avec un risque de première espèce α, de 0,05.

Il faut aussi noter que le rejet de l’hypothèse nulle ne veut pas dire nécessairement que l’effet ou la différence (écart à l’hypothèse nulle) est cliniquement significatif. La différence peut être insignifiante en ce qui concerne l’utilité pratique, tout en étant statistiquement significative si la taille de l’échantillon est grande. Par exemple un rapport de chances OR de 1,1 peut être statistiquement significatif au niveau de 5 %, si la taille de l’échantillon est très grande (disons 100 000), mais il n’y a pas lieu de s’inquiéter pour un accroissement aussi faible du risque relatif. Naturellement cela dépend de la maladie considérée, et la plus petite différence ayant un impact significatif est souvent appelée la différence minimale acceptable ; elle est utilisée pour calculer la taille de l’échantillon lorsqu’on planifie l’étude. (voir chapitre 5).

Lorsque nous rejetons une hypothèse nulle, nous acceptons habituellement une hypothèse alternative H1 qui dans la plupart des cas est l’opposée de Ho. Par exemple si Ho dit : les moyennes des deux populations sont égales, alors H1 signifie : les moyennes des deux populations ne sont pas égales. Ce type d’hypothèse alternative est appelé alternative bilatérale. Lorsque la moyenne d’une population est trop grande ou trop petite comparée à celle de l’autre population, nous rejetons l’hypothèse nulle. Il peut se trouver des cas où nous

nous intéressons seulement à détecter si la différence penche d’un coté de l’hypothèse nulle (par exemple le médicament améliore-t-il le taux de survie ?). Dans ce cas le test peut être unilatéral et Ho est rejetée lorsque la différence est trop grande et montre l’avantage du médicament, mais n’est pas rejetée si la différence est trop grande et montre que le médicament est nocif. Evidemment comme nous ne rejetons Ho que la moitié du temps, le risque d’erreur de première espèce est réduite. D’une façon équivalente, pour le même risque d’erreur de première espèce, Ho est rejetée plus souvent, ce qui accroît la puissance du test. La décision d’utiliser un test unilatéral ou bilatéral doit être prise au préalable, avant la collecte des données, et doit être fondée sur un raisonnement scientifique solide, pour éviter de biaiser la comparaison.

8.4.2 Quelques tests statistiques d’hypothèses couramment