• Aucun résultat trouvé

Démarche statistique Premiers pas avec

N/A
N/A
Protected

Academic year: 2022

Partager "Démarche statistique Premiers pas avec"

Copied!
21
0
0

Texte intégral

(1)

Démarche statistique Premiers pas avec

David Causeur Agrocampus Ouest IRMAR CNRS UMR 6625

http://math.agrocampus-ouest.fr/infoglueDeliverLive/membres/david.causeur

(2)

1 Effet à l’échelle d’une population 2 Décider à partir de données

3 Effet ’groupe’

Comparaison de groupes

Analyse de variance à un facteur Estimation des paramètres d’effet Test de Fisher

Le cas particulier de la comparaison de 2 groupes Décrire un effet groupe

Test avec des données appariées 4 Effet linéaire

(3)

Plan

1 Effet à l’échelle d’une population 2 Décider à partir de données

3 Effet ’groupe’

Comparaison de groupes

Analyse de variance à un facteur Estimation des paramètres d’effet Test de Fisher

Le cas particulier de la comparaison de 2 groupes Décrire un effet groupe

Test avec des données appariées 4 Effet linéaire

(4)

1 Effet à l’échelle d’une population 2 Décider à partir de données

3 Effet ’groupe’

Comparaison de groupes

Analyse de variance à un facteur Estimation des paramètres d’effet Test de Fisher

Le cas particulier de la comparaison de 2 groupes Décrire un effet groupe

Test avec des données appariées 4 Effet linéaire

(5)

Comparaison de deux groupes

Test de l’effet d’un facteur à deux modalités : ( H0: δ=µ1µ2= 0

H1: δ=µ1µ26= 0

I

Test de comparaison entre sexes dansR

(6)

Reprenons la statistique de Fisher :

F = n1(Y1•−Y••)2+n2(Y2•−Y••)2 ˆ

σ2 ,

avec

n1(Y1•−Y••)2 = n1Y1•− n1Y1•+n2Y2•

n1+n2 2

,

= n1n22Y2•−Y1•

n1+n2 2

,

n2(Y2•−Y••)2 = n2n21Y2•−Y1•

n1+n2 2

.

(7)

Test de Student

Reprenons la statistique de Fisher :

F = n1(Y1•−Y••)2+n2(Y2•−Y••)2 ˆ

σ2 ,

= Y2•−Y1•

σˆ

2n1n2(n1+n2) (n1+n2)2 ,

= Y2•−Y1•

ˆ σqn1

1 +n1

2

| {z }

T

2

.

(8)

Reprenons la statistique de Fisher :

F = T2, oùT = Y2•−Y1•

ˆ σqn1

1 +n1

2

= δˆ ˆ σδˆ.

En effet,

σ2δˆ = Var(Y1•−Y2•),

= Var(Y1•) + Var(Y2•),

= σ21 n1 + 1

n2 .

(9)

Test de Student

Reprenons la statistique de Fisher :

F = T2, oùT = Y2•−Y1•

ˆ σqn1

1 +n1

2

= δˆ ˆ σδˆ.

Soit ˆθ un estimateur deθ et ˆσθˆ un estimateur de l’écart- type de ˆθ.

Pour le test de H0 :θ= θ0,Tθ0 = ( ˆθθ0)/σˆθˆ est appelée statistique de Student.

(10)

I

Statistique du test de Student dansR

La distribution de T sous l’hypothèse nulle est la loi de Studentàn−2 degrés de liberté, notéeTn−2.

I

p-value du test de Student dansR

(11)

Test unilatéral

Test de H0:δ= 0 contre H1:δ <0.

Règleunilatéralede décision : H0est rejetée siT prend une valeur jugée anormalement faible sous H0.

Ici, la p-value est la probabilité pour qu’une variable aléatoire de loiTn−2soit plus petite que la valeur observée deT :

I

Test de Student unilatéral dansR

(12)

L’ensemble des valeursθ0telles que H0: θ=θ0n’est pas rejetée au seuilα est un intervalle de confiance deθ, de niveau de confiance 1−α.

On en déduit l’intervalle de confiance CI1−α(δ) : CI1−α(δ) =

(

δ0, −t1−α/2(n−2)δˆ−δ0 ˆ

σδˆ ≤t1−α/2(n−2) )

,

= hδˆ−t1−α/2(n−2) σˆδˆ; ˆδ+t1−α/2(n−2) σˆδˆi.

I

Intervalle de confiance part.testdansR

(13)

Intervalle de confiance d’un paramètre

Pour les paramètresµ1etµ2: CI1−αi) = hµˆi−t1−α/2(n−2) σˆ

√ni; ˆµi+t1−α/2(n−2) σˆ

√ni i

.

I

Intervalle de confiance part.testdansR

(14)

Dans quelle mesure le test de Student peut-il détecter une différence de moyennes à l’échelle de la population ? Cas des donnéesporcs: si la différence de moyenne entre mâles et femelles à l’échelle de la population vaut 1, le test de Student concluera-t’il que l’effetsexeest significatif ?

(15)

Puissance du test de Student

Soit le test de H0: µ1−µ2= 0 contre H1: µ1−µ2=δ 6= 0.

Au seuilα, lapuissancedu test est la probabilité sous H1 que le test rejette H0:

Puissance(δ) = Pµ1−µ2=δ(|T| ≥t1−α/2(n−2)).

Sous H1, T ∼ Tn−2(λ) avec :

λ = δ

σqn1

1 +n1

2

. [paramètre de non-centralité]

(16)

−4 −2 0 2 4

0.00.10.20.30.40.5

Density function of Student distribution (58 d.f.)

x

Density

Student (58 d.f)

Noncentral Student (58 d.f., ncp=1)

(17)

Puissance du test de Student

Plusλest grand, plus le test de Student est puissant :

Plus|δ|/σest grand, plus le test est puissant.

Plusn1etn2sont grands, plus le test est puissant.

I

Puissance du test de Student dansR

(18)

L’effet d’un facteur est significatif = les moyennes de la variable réponse danscertainsgroupes sont différentes.

Quels groupes ?

P06= P25 6= P50 ou P06={P25 = P50}ou ...

Tests post-hoc pour 3 groupes: 3 tests simultanés

H(12)0 : µ1=µ2,

H(13)0 : µ1=µ3,

H(23)0 : µ2=µ3.

I

Comparaisons deux à deux dansR

(19)

Tests Post-hoc

Quel risque d’erreur pour plusieurs tests simultanés ?

Probabilité d’au moins un rejet à tort (faux positif) : PH(ii0)

0 ,i6=i0 au moins une hypothèse H(ii00)rejetée

X

i6=i0

PH(ii0)

0

(H(ii00) rejetée),

≤ 3α

Correction de Bonferroni:α=α/3 :

I

Correction de Bonferroni dansR

(20)

1 Test deH0 : θ=θ0contreH1 : θ6=θ0ouθ > θ0

Statistique du test de Student :T = ( ˆθθ0)/σˆθˆ

Loi sous H0:T ∼ Tk, oùk est le nombre de dégrés de liberté pour l’estimation de ˆσ2ˆ

θ

2 Intervalle de confiance de niveau 1−α: ensemble desθ0tels que H0n’est pas rejetée au seuilα

3 Comparaison de moyennes : H0 : µ1=µ2

4 Evaluation d’un dispositif expérimental :

Puissance du test (à objectif de précision fixé)

Taille d’échantillon nécessaire (à objectifs de précision et de puissance fixés)

5 Tests post-hoc : correction du seuil (Bonferroni) pour un contrôle global du risque d’un faux positif.

(21)

Plan

1 Effet à l’échelle d’une population 2 Décider à partir de données

3 Effet ’groupe’

Comparaison de groupes

Analyse de variance à un facteur Estimation des paramètres d’effet Test de Fisher

Le cas particulier de la comparaison de 2 groupes Décrire un effet groupe

Test avec des données appariées 4 Effet linéaire

Références

Documents relatifs

- Questionne les besoins des sociétés et les activités déployées pour les satisfaire - Selon la situation, identifie, catégorise et décris le rôle des acteurs concernés SHS

Les critères les plus utilisés pour le choix des femelles dans les trois groupes étaient l’état de santé, la taille de la portée, la croissance naissance -sevrage et

Pour l’analyse de la qualité de carcasse et de viande, un modèle linéaire mixte a été utilisé avec la loge comme unité expérimentale, le verrat terminal et

Evaluation des performances, de la qualité de carcasse et de viande de porcs femelles et mâles immuno-castrés issus de différents verrats

Une bande de porcs croisés (Large White x Landrace) x Piétrain est élevée dans la salle équipée d'un système d'alimentation de précision à la station IFIP de Romillé.

CMJ : consommation moyenne journalière, GMQ : vitesse de croissance, IC : indice de consommation, TMP : taux de muscle des pièces (Image Meater, abattage en deux départs vers 112 kg

Dans ce but, un essai a été conduit afin de déterminer les effets d’une réduction de 10% des apports de protéines sur les performances et la qualité de carcasse de porcs

Dans la table suivante, on fournit dans la case (i, j) la valuation i-adique de i dans la factorielle de j (ou val i (j!), pour i