• Aucun résultat trouvé

Exercices 1

N/A
N/A
Protected

Academic year: 2022

Partager "Exercices 1"

Copied!
4
0
0

Texte intégral

(1)

Statistiques et Analyse de Données 3

TD : Statistique bayésienne 1

1. Réflexions bayésiennes (et fréquentistes)

Exercice 1 (De Bayes Rules! de Alicia A. Johnson, Miles Ott, Mine Dogucu).

Dans cet extrait (lien) de la sixième saison de Parks and Recreation, Leslie Knope m’est en avant un raisonnement bayésien.

1. Identifiez les connaissances a priori de Leslie Knope sur le lait au chocolat.

2. Identifiez les données qu’elle a confronté a sa croyance initiale.

3. Identifiez sa conclusion mise à jour à propos du lait au chocolat.

Exercice 2 (De Bayes Rules! de Alicia A. Johnson, Miles Ott, Mine Dogucu).

1. Pensez à une situation récente au cours de laquelle vous avez changé d’avis.

Identifiez votre avis en amont, les données/informations qui vous ont fait changer d’avis, ainsi que votre avis après coup.

2. Pensez à une situation récente au cours de laquelle vous avez fait changer d’avis quelqu’un.

Identifiez son avis en amont de la discussion, les données/informations qui vous lui avez fourni et qui l’ont fait changer d’avis, ainsi que son avis après coup.

3. Dans chaque situation, estimez la force des avis et des données.

Exercice 3.

Regardez des vidéos de la playlist sur la statistique fréquentiste : lien.

2. Loi a priori discrète

Exercice 4.

Regardez des vidéos de la playlist sur la statistique bayésienne (lien), en priorité l’épisode 26 d’Hygiène Mentale et pour les non-réfractaires à l’anglais la vidéo de 3Blue1Brown.

Exercice 5.

Dans un sac opaque se trouve différents dés (4, 6, 8, 12 et 20 faces). Plus précisément, il y a 1 dé à 4 faces, 2 dés à 6 faces, 10 dés à 8 faces, 2 dés à 12 faces et 1 dé à 20 faces. Une amie choisit un dé au hasard puis le lance deux fois. Elle a obtenu les deux fois le résultat 5.

1. Réaliser le tableau de mise à jour fournissant les probabilités a posteriori des différents types de dés.

2. Quel est le type de dé le plus probable ?

3. Quelle est la probabilité que, si elle lance une troisième fois le dé, elle obtienne un 5 ? un 3 ? un 15 ? Utiliser des tableaux de mise à jour bayésienne.

Exercice 6 (CC1 - 2018-2019).

Une personne choisit un dé au hasard de façon uniforme entre un dé à 4 faces, un dé à 6 faces et un dé à 8 faces. Puis elle lance ce dén fois (n∈N) et elle vous dit qu’elle a obtenu n fois le résultat 5.

On note T la variable représentant le nombre de faces du dé choisi et Xi le résultat du ie lancer de dé, pour tout entieristrictement positif.

L3 Économie Université de Tours - 2020/2021

(2)

1. Donner la loi a priori de T. 2. Cas oùn= 1.

Donner la vraisemblance de la donnée observée. Déterminer la loi a posteriori du type de dé choisi par la personne. Quelle est la probabilité d’obtenir à nouveau 5 si on relance ce dé ?

3. Cas général.

(a) Donner la vraisemblance des données :{X1 = 5, X2 = 5, . . . , Xn= 5}. (b) Déterminer la loi a posteriori du type de dé choisi par la personne.

(c) Quelle est la limite, quandntend vers +∞, pour chacune des probabilités de la question précédente ? (d) Expliquer pourquoi cela a du sens.

(e) Classer les résultats possibles pour le prochain lancer (le (n+ 1)e) du plus probable au moins probable (les ex-æquo sont possibles). Aucun calcul n’est attendu mais vous devez expliquer votre raisonnement proprement et de façon précise.

Exercice 7.

Une association sportive vend des badges lors de ses manifestations. Arthur et Lidia se partagent la responsabilité du stand selon les manifestations. Le nombre de badges vendus pendant une heure est modélisé par une loi de Poisson et on suppose que le nombre de badges vendus chaque heure est indépendant du nombre vendus les autres heures. Lidia vend en moyenne 15 badges par heure et Arthur seulement 10.

Lors de la dernière rencontre sportive, Luc, le trésorier, n’était pas présent. Il sait que c’est Lidia qui devait s’occuper du stand de badges mais il pense qu’elle arrive à se faire remplacer par Arthur une fois sur 10.

Il observe le carnet de compte et constate que sur les 5 heures, il y a eu 12, 10, 11, 4 et 11 badges vendus chaque heure. À votre avis, qui a réellement tenu le stand ?

Préciser : la loi a priori, la vraisemblance des données et la loi a posteriori.

3. Loi a priori continue et estimation d’une proportion

Exercice 8.

On dispose d’une pièce qui a de forte chance d’être biaisée. La probabilité qu’elle renvoie face correspond à un paramètreθ. Nos connaissances de ce paramètre θse traduisent par le fait que sa loi a priori est continue de densitéfT(θ) = 2θ1]0;1[(θ).

Afin d’avoir une meilleure idée du paramètre de la pièce, on souhaite la lancer une fois et observer le résultat.

1. Donner les deux lois a posteriori selon les deux résultats possibles du lancer.

2. Que pensez-vous de son biais si le résultat est face ? pile ?

Pour cela, vous pouvez utiliser : une estimation du paramètre d’intérêt, un ou des intervalles de crédibilité, calculer différentes probabilités a posteriori, etc.

3. Si vous avez obtenu face, quelle est la probabilité d’obtenir encore face au lancer suivant ? 4. Vous décidez finalement de lancern fois la pièce pour avoir une idée plus précise deθ.

(a) Exprimer la loi a posteriori de θen fonction du nombre xde faces obtenues.

(b) Proposer un estimateur de θ.

(c) Concrètement vous avez lancé 10 fois la pièce et obtenu 6 fois face. Quelle est la probabilité d’obtenir face lors d’un onzième lancer ?

Exercice 9.

On souhaite estimer la proportionθd’étudiants de troisième année de Licence d’Économie préférant LATEX à Word.

On choisit 10 étudiants aléatoirement et on suppose leurs réponses indépendantes entre elles. On poseX le nombre d’étudiants préférant LATEX dans un échantillon de 10 étudiants.

1. Donner la loi deX en fonction deθ.

L3 Économie Université de Tours - 2020/2021

(3)

2. On décide de commencer avec comme loi a prioriT ∼Beta(2 ; 2).

Commenter ce choix (famille de lois et paramètres).

3. Avec la loi a priori proposée précédemment, exprimer la loi a posteriori deT sachant que X=x. 4. On a observé 6 étudiants préférant LATEX à Word. En déduire une estimation de θ.

5. Quelle est la probabilité que plus de la majorité des étudiants préfèrent LATEX à Word ? Utilisez Rpour l’obtention des probabilités.

6. Fournir un intervalle de crédibilité à 90% pour θ(utiliserR pour obtenir les quantiles nécessaires). Idem à 50%.

7. Proposer une autre loi a priori correspondant à votre croyance à ce propos en justifiant les paramètres.

Est-ce que la conclusion change beaucoup ?

Exercice 10 (CC1 - 2018-2019).

On souhaite estimer les intentions de vote pour une élection. On interroge 10 personnes de notre entourage et seulement une compte voter pour le candidat sortant. On planifie une enquête sur 100 personnes comptant voter à l’élection.

1. Proposer une loi a priori pour la proportion de personnes prévoyant de voter pour le candidat sortant correspondant à l’information fournie par notre entourage.

Justifier tous les aspects de votre choix.

2. Comme l’échantillon initial de 10 individus n’est pas aléatoire, on souhaite diminuer de moitié son poids dans la construction de notre loi a priori. Proposer en justifiant une loi a priori adaptée.

3. Notre enquête a trouvé 38 personnes sur 100 comptant voter pour le candidat sortant. En utilisant la loi a priori de la question précédente, donner la loi a posteriori et une estimation de la proportion d’individus souhaitant voter pour le candidat sortant.

4. Finalement si on ne souhaite pas utiliser les informations fournies par notre entourage, proposer en justifiant (succinctement) d’autres lois a priori.

4. R à notre service

Exercice 11 (A priori discret).

On revient à notre sac contenant des dés de type différents (4, 6, 8, 12 et 20 faces). Cette fois on en met un de chaque type dans le sac et surtout on utilisera Ret le code du documentTD1-queldé.R pour faire les mises à jour bayésiennes et pour visualiser ce qui se passe.

1. On notek le résultat d’un lancer. Exprimer la vraisemblance dek (en fonction de la valeur dek) pour chaque hypothèse.

2. Lancer les lignes de code 9 à 25. Comprendre le code et mettre un titre adapté au graphique.

3. Lancer les lignes 27 à 36. Admirer le travail deggplot2. 4. Lancer les lignes 39 à 46.

Comprendre le code et décommenter et compléter la ligne 48 permettant le calcul de la loi a posteriori.

5. Représenter graphique la loi a posteriori obtenu en lançant les lignes 50 à 53.

6. Vous pouvez réitérer l’expérience en relançant les lignes 42 à 53.

7. Maintenant nous allons effectuer 20 lancers du dé choisi. Lancer et comprendre les lignes de code 58 à 90.

8. Créer une fonction prenant en paramètre : les types de dés possibles, la loi a priori, le nombre de lancers effectués ; et renvoyant le graphique de l’évolution de la loi du dé choisi et la loi a posteriori finale.

Exercice 12 (Mise à jour de la loi).

1. Charger dansRla fonctionmaj_betacontenu dans le fichierTD1-maj-beta.R.

2. L’utiliser avec différents paramètres pour expérimenter l’évolution d’une loi a posteriori selon les données.

3. Tenter de la modifier pour pouvoir démarrer avec une loi a priori Beta quelconque.

L3 Économie Université de Tours - 2020/2021

(4)

Statistiques et Analyse de Données 3

Fiche version 1

Le contenu de cette fiche sera joint au sujet du CC du vendredi 12 mars.

1. Lois

• Lois Beta.

Soientα etβ dansR+. SoitX ∼Beta(α, β).

AlorsX est une variable aléatoire de densité

fX(x) =kxα−1(1−x)β−11[0,1](x) aveck= 1

B(α, β) = Γ(α+β)

Γ(α)Γ(β). Si n∈N, on a Γ(n) = (n−1)!. Par exemple, on a Γ(5) = 3! = 6. De plus, on aE(X) = α

α+β et V(X) = αβ

(α+β)2(α+β+ 1).

• Lois de Poisson.

SoitX ∼ P(λ), avec λ∈R+.

AlorsX est une variable aléatoire à valeurs dansNtelle que, pour tout x∈N,P(X=x) =e−λλx x!. De plus, on aE(X) = V(X) =λ.

• Lois géométriques

SoitX ∼ G(p), avecp∈]0; 1[.

AlorsX est une variable aléatoire à valeurs dansNtelle que, pour tout x∈N, P(X=x) = (1−p)x−1p. De plus, on aE(X) = 1

p et V(X) = 1−p p2 .

• Lois exponentielles.

SoitX ∼ Exp(λ), avec λ∈R+.

AlorsX est une variable aléatoire de densité

fX(x) =λe−λx1]0;+∞[(x). De plus, on aE(X) = 1

λ et V(X) = 1 λ2.

2. Tableau de mises à jour bayésiennes

Hypothèses Données A priori Vraisemblance A posteriori

θ x U(]0 ; 1[) Bin(n ;θ) Beta (x+ 1 ;nx+ 1)

θ x Beta (α ;β) Bin(n ;θ) Beta (α+x;β+nx) θ (xi)i∈J1;nK Beta (α ;β)

n

Y

i=1

G(θ) Beta α+n;β+

n

X

i=1

xin

!

L3 Économie Université de Tours - 2020/2021

Références

Documents relatifs

Il en ressort, entre autres, que l’intervalle basé sur les rangs des observations est valide (niveau de confiance réel proche du nominal) et efficace (longueur moyenne

[r]

Un résultat est la somme de la face obtenue sur le dé et du nombre obtenu par la pièce. On suppose que chaque famille habite une maison individuelle ou un appartement et que

Quelle est la probabilité pour que la femme ne soit ni salariée ni mère de famille ?... Solution 1 : Utilisons le diagramme ci-dessous appelé diagramme

On replace la boule tirée dans l’urne puis on effectue un second tirage et on note la couleur de la deuxième boule tirée.. a.Quelle est la probabilité de tirer une boule rouge

1 Pour chacun des événements suivants, indique s’il relève du hasard et si oui place-le sur l’échelle ci-dessous comme dans l’exemple.. Obtenir pile au jeu de pile

1  Pour chacun des événements suivants, indique s’il relève du hasard et si oui place-le sur l’échelle ci-dessous comme dans l’exemple.. Obtenir pile au jeu de pile

C’est ainsi qu’est bien représentée la littérature, en rapide extension, sur les problèmes combinatoires proches : graphes de comparabilité, ordres, graphes. et