• Aucun résultat trouvé

A2 D IFFERENCE ENTRE LES METHODES STATISTIQUES TRADITIONNELLES ET L ’ APPROCHE BAYESIENNE

APPROCHE BAYESIENNE ET AGE AU DECES

A2 D IFFERENCE ENTRE LES METHODES STATISTIQUES TRADITIONNELLES ET L ’ APPROCHE BAYESIENNE

a) les statistiques déductives

Les recherches dans le domaine des statistiques sont basées sur les probabilités déductives. Dans l’inférence déductive, on pose une hypothèse à partir de laquelle on prévoit ce que nous devrions observer si l’hypothèse est vraie. La déduction est objective dans le sens que les prédictions sur ce que nous voyons sont toujours vraies si les hypothèses sont vraies. Mais dans ce cas de figure, on ne peut pas étendre nos connaissances au delà de ce qu’il y a dans l’hypothèse (Goodman, 1999a). Les probabilités déductives sont calculées par des formules mathématiques qui décrivent la fréquence de tous les résultats possibles si l’expérience est répétée plusieurs fois (Howson et Urbach, 1993). Ces méthodes incluent un index pour mesurer la force de la démonstration : la valeur p, un index informel à utiliser comme une mesure de la différence entre les données et l’hypothèse nulle (Fisher, 1958). Or, cette valeur p a été mal interprétée (Browner et Newman, 1987 ; Freeman, 1993). La plupart des chercheurs pensent qu’une valeur p de 0.05 signifie que l’hypothèse nulle a une probabilité de seulement 5 %, alors qu’il s’agit d’une probabilité de se tromper en rejetant l’hypothèse nulle. Comme alternative à la valeur p, Neyman et Pearson (1933) ont proposé une méthode pour choisir entre les hypothèses appelées, test d’hypothèse. On pose une hypothèse (un effet nul)

et l’opposé de l’hypothèse (un effet non nul). Le résultat du test est un comportement, et non une inférence : on rejète l’effet d’une hypothèse et pas l’autre seulement sur la base des données. En quelque sorte, on cherche le risque de deux types d’erreur, l’erreur de type I (faux-positif) et l’erreur de type II (faux négatif). Ce système n’inclut pas de mesure du phénomène, aucun chiffre ne reflètant les données de l’hypothèse sous-jacente. On confond souvent la valeur de l’alpha (taux d’erreur du faux positif) et la valeur p. La similarité superficielle des deux éléments a conduit à dire, que la valeur p est un taux d’erreur spécial de faux positif. Les deux méthodes, celle de la valeur p et celle des tests d’hypothèses sont considérées comme une seule déduction statistique, ce qui n’est pas le cas (Goodman, 1993).

Dans les études médicales, la méthode de la valeur p a beaucoup de succès. On trouve très utile d’avoir une méthodologie quantitative qui génère une conclusion indépendante de la personne menant l’expérience (Matthews, 1995 ; Marks, 1997). La méthode étant considérée comme objective, les conclusions sont considérées comme fiables (Goodman, 1999a). En fait, les méthodes statistiques traditionnelles s’avèrent très utiles si ce sont les statisticiens qui interprètent la valeur p (Wulff et al., 1987), ce qui n’est pas toujours le cas. Les conclusions scientifiques tirées des résultats statistiques ne tiennent pas toujours compte des hypothèses sous-jacentes et sont donc erronées. Il est à présent nécessaire que la statistique soit comprise parfaitement par des non-statisticiens si l’on veut que leur utilisation soit appropriée (Concato

et al., 1993).

b) le facteur bayésien

L’alternative aux méthodes statistiques courantes est le facteur bayésien (Goodman, 1999b). Cependant, cette alternative n’est pas considérée comme scientifiquement valable (Jonson, 1991 ; Fisher, 1996) parce qu’elle est mal comprise.

Le théorème de Bayes a deux composantes : une qui résume les données, et une qui représente la croyance. Dans le théorème de Bayes, le facteur bayésien est un index au travers duquel les données donnent des informations et cet index est séparé de la partie purement subjective de l’équation.

Le facteur bayésien correspond à la probabilité des données, selon l’hypothèse nulle par rapport à la probabilité des données, selon l’hypothèse alternative.

Le facteur bayésien diffère donc de la valeur p. Ce n’est pas une probabilité en soi, mais un taux de probabilité, il peut varier de 0 à l’infini. Il dépend de la probabilité des données

observées seules, sans inclure des expériences à long terme qui font partie du calcul de la valeur p. Par conséquent, les facteurs qui ne sont pas liés aux données qui affectent la valeur p, n’affectent pas le facteur bayésien (Berry, 1985 ; Berger et Berry, 1988).

Prenons un exemple tiré d’une recherche génétique (Shoemaker et al., 1999) : si les loci sont séparés par tant de centimorgans, à quel point sont improbables les résultats observés ? Cette formulation correspond aux méthodes statistiques traditionnelles. L’approche bayésienne répond à la question suivante : étant donné les résultats observés, quelle est la probabilité que deux loci (génétiques) soient séparés par plus de tant de centimorgans ? La réponse à la deuxième question répond mieux à ce que l’expérimentateur veut savoir.

Dans les statistiques classique et bayésienne, l’objectif est de déduire l’inférence de la valeur d’un paramètre fixe mais inconnu. La différence entre les deux approches réside dans la

façon d’approcher ce but et l’interprétation des résultats.

Le théorème de Bayes est une formule qui montre combien les croyances, exprimées sous forme de distribution de probabilités sont modifiées par de nouvelles informations. « Dans les statistiques classiques, l’interprétation de la valeur du p et l’intervalle de confiance dépend plutôt de formules alambiquées concernant les nombreuses propriétés de la procédure statistique sous les hypothèses nulles » (Spiegelhalter et al., 1999).

L’approche bayésienne est en opposition avec la démarche classique car cette dernière ne tient pas compte des probabilités a priori. Aucune hypothèse alternative n’est considérée.

c) quel outil employer pour la prédiction ?

Dans les problèmes de prédiction en anthropologie, il y a deux approches communément utilisées : la vraisemblance maximale et l’approche bayésienne. L’utilisation de l’approche bayésienne en paléoanthropologie sensu stricto est mise en doute (Konisberg et Frankenberg, 1992 ; Konisberg et al., 1998). Elle semble plus appropriée dans le domaine de la Médecine légale dont les cas à étudier viennent de la même population que l’échantillon de référence (Acree, 1999). Il est vrai qu’en paléoanthropologie, nous ignorons si les individus dont nous devons estimer l’âge viennent d’une population dont la distribution est la même que notre échantillon de référence.

Cependant, il y a une alternative à l’approche bayésienne pour les estimations individuelles : la vraisemblance maximale (Iscan et Boldsen, 1995 ; Konisberg et al., 1998 ; Usher et al.,

2000). La vraisemblance d’un modèle est la probabilité que les observations ou les données calculées adoptent le modèle. Pour tout modèle particulier, plusieurs échantillons différents de données peuvent être obtenus, mais certains ensembles sont plus probables que d’autres. Il est possible de calculer la vraisemblance qui répond à la question : si le modèle est vrai, quel est la chance d’obtenir l’ensemble des données que nous avons collectées ? Si l’on essaie des modèles avec toutes les combinaisons possibles de pente et d’intercept, il est possible de trouver la ligne de régression qui a la vraisemblance maximale de produire l’ensemble des données observées. Cette méthode permet de trouver les valeurs des variables qui ont le plus de chance d’être avérées.

Mais en ce qui concerne l’estimation de l’âge, la question à laquelle nous voulons répondre est la suivante : étant donné la variabilité de l’évolution des indicateurs d’âge, quelle est la chance de classer un individu dans une classe par rapport à une autre et compte tenu d’une distribution par âge bien précise ? L’approche bayésienne est donc plus appropriée, car nous ne voulons pas seulement une prédiction, nous voulons aussi une mesure de l’incertitude. Avec la vraisemblance maximale, nous pourrions accepter un modèle car il correspond aux données collectées, mais nous ne pourrions pas savoir s’il est vrai.