• Aucun résultat trouvé

TD1

N/A
N/A
Protected

Academic year: 2022

Partager "TD1"

Copied!
4
0
0

Texte intégral

(1)

Statistiques et Analyse de Données 3

TD : Statistique bayésienne 1

1. Loi a priori discrète

Exercice 1.

Dans un sac opaque se trouve différents dés (4, 6, 8, 12 et 20 faces). Plus précisément, il y a 1 dé à 4 faces, 2 dés à 6 faces, 10 dés à 8 faces, 2 dés à 12 faces et 1 dé à 20 faces. Une amie choisit un dé au hasard puis le lance deux fois. Elle a obtenu les deux fois le résultat 5.

1. Réaliser le tableau de mise à jour fournissant les probabilités a posteriori des différents types de dés.

2. Quel est le type de dé le plus probable ?

3. Quelle est la probabilité que, si elle lance une troisième fois le dé, elle obtienne un 5 ? un 3 ? un 15 ? Utiliser des tableaux de mise à jour bayésienne.

Exercice 2 (CC1 - 2018-2019).

Une personne choisit un dé au hasard de façon uniforme entre un dé à 4 faces, un dé à 6 faces et un dé à 8 faces. Puis elle lance ce dén fois (n∈N) et elle vous dit qu’elle a obtenu n fois le résultat 5.

On note T la variable représentant le nombre de faces du dé choisi et Xi le résultat du ie lancer de dé, pour tout entieristrictement positif.

1. Donner la loi a priori de T.

2. Cas oùn= 1.

Donner la vraisemblance de la donnée observée. Déterminer la loi a posteriori du type de dé choisi par la personne. Quelle est la probabilité d’obtenir à nouveau 5 si on relance ce dé ?

3. Cas général.

(a) Donner la vraisemblance des données :{X1 = 5, X2 = 5, . . . , Xn= 5}.

(b) Déterminer la loi a posteriori du type de dé choisi par la personne.

(c) Quelle est la limite, quandntend vers +∞, pour chacune des probabilités de la question précédente ? (d) Expliquer pourquoi cela a du sens.

(e) Classer les résultats possibles pour le prochain lancer (le (n+ 1)e) du plus probable au moins probable (les ex-æquo sont possibles). Aucun calcul n’est attendu mais vous devez expliquer votre raisonnement proprement et de façon précise.

Exercice 3 (Script R).

On revient à notre sac contenant des dés de type différents (4, 6, 8, 12 et 20 faces). Cette fois on en met un de chaque type dans le sac et surtout on utiliseraRpour faire les mises à jour bayésiennes et pour visualiser ce qui se passe.

1. On notek le résultat d’un lancer. Exprimer la vraisemblance dek (en fonction de la valeur dek) pour chaque hypothèse.

2. Lancer les lignes de code 9 à 25. Comprendre le code et mettre un titre adapté au graphique.

3. Lancer les lignes 27 à 34. Admirer le travail deggplot2.

4. Lancer les lignes 37 à 44.

Comprendre le code et décommenter et compléter la ligne 46 permettant le calcul de la loi a posteriori.

5. Représenter graphique la loi a posteriori obtenu en lançant les lignes 48 et 49.

L3 Économie Université de Tours - 2019-2020

(2)

6. Vous pouvez réitérer l’expérience en relançant les lignes 40 à 49.

7. Maintenant nous allons effectuer 20 lancers du dé choisi. Lancer et comprendre les lignes de code 54 à 84.

8. Créer une fonction prenant en paramètre : les types de dés possibles, la loi a priori, le nombre de lancers effectués ; et renvoyant le graphique de l’évolution de la loi du dé choisi et la loi a posteriori finale.

Exercice 4.

Une association sportive vend des badges lors de ses manifestations. Arthur et Lidia se partagent la responsabilité du stand selon les manifestations. Le nombre de badges vendus pendant une heure est modélisé par une loi de Poisson et on suppose que le nombre de badges vendus chaque heure est indépendant du nombre vendus les autres heures. Lidia vend en moyenne 15 badges par heure et Arthur seulement 10.

Lors de la dernière rencontre sportive, Luc, le trésorier, n’était pas présent. Il sait que c’est Lidia qui devait s’occuper du stand de badges mais il pense qu’elle arrive à se faire remplacer par Arthur une fois sur 10.

Il observe le carnet de compte et constate que sur les 5 heures, il y a eu 12, 10, 11, 4 et 11 badges vendus chaque heure. À votre avis, qui a réellement tenu le stand ?

Préciser : la loi a priori, la vraisemblance des données et la loi a posteriori.

2. Loi a priori continue et estimation d’une proportion

Exercice 5.

On dispose d’une pièce qui a de forte chance d’être biaisée. La probabilité qu’elle renvoie face correspond à un paramètreθ. Nos connaissances de ce paramètre θse traduisent par le fait que sa loi a priori est continue de densitéfT(θ) = 2θ1]0;1[(θ).

Afin d’avoir une meilleure idée du paramètre de la pièce, on souhaite la lancer une fois et observer le résultat.

1. Donner les deux lois a posteriori selon les deux résultats possibles du lancer.

2. Que pensez-vous de son biais si le résultat est face ? pile ?

Pour cela, vous pouvez utiliser : une estimation du paramètre d’intérêt, un ou des intervalles de crédibilité, calculer différentes probabilités a posteriori, etc.

3. Si vous avez obtenu face, quelle est la probabilité d’obtenu encore face au lancer suivant ? 4. Vous décidez finalement de lancern fois la pièce pour avoir une idée plus précise deθ.

(a) Exprimer la loi a posteriori de θen fonction du nombre xde faces obtenues.

(b) Proposer un estimateur de θ.

(c) Concrètement vous avez lancé 10 fois la pièce et obtenu 6 fois face. Quelle est la probabilité d’obtenir face lors d’un onzième lancer ?

Exercice 6.

On souhaite estimer la proportionθd’étudiants de troisième année de Licence d’Économie préférant LATEX à Word.

On choisit 10 étudiants aléatoirement et on suppose leurs réponses indépendantes entre elles. On poseX le nombre d’étudiants préférant LATEX dans un échantillon de 10 étudiants.

1. Donner la loi deX en fonction deθ.

2. On décide de commencer avec comme loi a prioriT ∼Beta(2 ; 2). Commenter ce choix (famille de lois et paramètres).

3. Avec la loi a priori proposée précédemment, exprimer la loi a posteriori deT sachant que X=x.

4. On a observé 6 étudiants préférant LATEX à Word.

En déduire une estimation deθ.

5. Quelle est la probabilité que plus de la majorité des étudiants préfèrent LATEX à Word ? Utilisez Rpour l’obtention des probabilités.

6. Fournir un intervalle de crédibilité à 90% pour θ(utiliserR pour obtenir les quantiles nécessaires). Idem à 50%.

L3 Économie Université de Tours - 2019-2020

(3)

7. Proposer une autre loi a priori correspondant à votre croyance à ce propos en justifiant les paramètres.

Est-ce que la conclusion change beaucoup ?

Exercice 7 (CC1 - 2018-2019).

On souhaite estimer les intentions de vote pour une élection. On interroge 10 personnes de notre entourage et seulement une compte voter pour le candidat sortant. On planifie une enquête sur 100 personnes comptant voter à l’élection.

1. Proposer une loi a priori pour la proportion de personnes prévoyant de voter pour le candidat sortant correspondant à l’information fournie par notre entourage.

Justifier tous les aspects de votre choix.

2. Comme l’échantillon initial de 10 individus n’est pas aléatoire, on souhaite diminuer de moitié son poids dans la construction de notre loi a priori. Proposer en justifiant une loi a priori adaptée.

3. Notre enquête a trouvé 38 personnes sur 100 comptant voter pour le candidat sortant. En utilisant la loi a priori de la question précédente, donner la loi a posteriori et une estimation de la proportion d’individus souhaitant voter pour le candidat sortant.

4. Finalement si on ne souhaite pas utiliser les informations fournies par notre entourage, proposer en justifiant (succinctement) d’autres lois a priori.

Exercice 8 (Script R).

1. Charger dansRla fonctionmaj_betacontenu dans le fichierTD2-maj-beta.R.

2. L’utiliser avec différents paramètres pour expérimenter l’évolution d’une loi a posteriori selon les données.

3. Tenter de la modifier pour pouvoir démarrer avec une loi a priori Beta quelconque.

3. La pièce d’un euro belge est-elle biaisée ?

On va étudier le biais prétendu des pièces d’un euro belge orné du portrait du roi Albert II. Pour cela on se réfère à l’expérience relatée dans l’article du New Scientist du 4 janvier 2002 (www.newscientist.com/

article/dn1748-euro-coin-accused-of-unfair-flipping/)

1. Retrouver les valeurs numériques présentées dans la seconde partie de l’article avec le paradigme fréquentiste.

2. Utiliser vos connaissances du point de vue bayésien pour apporter un éclairage nouveau sur le problème.

Fournir plusieurs résultats (estimation, intervalle de crédibilité, calcul de probabilité sur le biais des pièces). Ne pas hésiter à utiliser des lois a priori différentes.

L3 Économie Université de Tours - 2019-2020

(4)

Statistiques et Analyse de Données 3

Fiche version 1

Le contenu de cette fiche sera joint au sujet du CC2 du vendredi 6 mars.

1. Lois

• Lois Beta.

Soientα etβ dansR+. SoitX ∼Beta(α, β).

AlorsX est une variable aléatoire de densité

fX(x) =kxα−1(1−x)β−11[0,1](x)

aveck= 1

B(α, β) = Γ(α+β)

Γ(α)Γ(β). Si n∈N, on a Γ(n) = (n−1)!. Par exemple, on a Γ(5) = 3! = 6. De plus, on aE(X) = α

α+β et V(X) = αβ

(α+β)2(α+β+ 1).

• Lois de Poisson.

SoitX ∼ P(λ), avec λ∈R+.

AlorsX est une variable aléatoire à valeurs dansNtelle que, pour tout x∈N,P(X=x) =e−λλx x!. De plus, on aE(X) = V(X) =λ.

• Lois géométriques

SoitX ∼ G(p), avecp∈]0; 1[.

AlorsX est une variable aléatoire à valeurs dansNtelle que, pour tout x∈N, P(X=x) = (1p)x−1p.

De plus, on aE(X) = 1

p et V(X) = 1−p p2 .

• Lois exponentielles.

SoitX ∼ Exp(λ), avec λ∈R+.

AlorsX est une variable aléatoire de densité

fX(x) =λe−λx1]0;+∞[(x).

De plus, on aE(X) = 1

λ et V(X) = 1 λ2.

2. Tableau de mises à jour bayésiennes

Hypothèses Données A priori Vraisemblance A posteriori

θ x U(]0 ; 1[) Bin(n ;θ) Beta (x+ 1 ;nx+ 1)

θ x Beta (α ;β) Bin(n ;θ) Beta (α+x;β+nx) θ (xi)i∈

J1;nK Beta (α ;β)

n

Y

i=1

G(θ) Beta α+n;β+

n

X

i=1

xin

!

L3 Économie Université de Tours - 2019-2020

Références

Documents relatifs

L’entreprise Granulex distribue un aliment pour chat dans un contenant m´ etallique dont le poids apr` es remplissage, repr´ esent´ e par une variable al´ eatoire X, est calibr´ e `

C- Ecrire l’équation bilan de la réaction du dosage : (la faire vérifier par votre enseignant avant de poursuivre)2. D- Réactif limitant avant et après

■ Pour chacune des questions suivantes une seule des trois réponses proposées est exacte. Le candidat indiquera sur sa copie le numéro de la question et la lettre correspondant à

Toutefois, pour les femmes enceintes, des précautions doivent être prises systématiquement : c’est pourquoi il est important de signaler si vous pouvez être dans

Salarié moi-même -je travaille aux PTT -je connais vos difficultés. Ma suppléante Monique MARCHAL, mère de famille , les affronte également tous les jours. Les bas

On a déplombé nos wagons et on nous a fait sortir à coups de crosses pour nous conduire au camp de Birkenau, qui est une dépendance du camp d’Auschwitz, dans une immense plaine,

Quelle serait une loi a priori pour la proportion de personnes prévoyant de voter pour le candidat sortant correspondant à l’information fournie par notre entourage5.

C'est ce qu'elle fait aussi dans ce numéro, avec son reportage saisissant à Amman, dans l'hô- pital où sont soignées les vic- times civiles irakiennes.. En revanche, nous devons