• Aucun résultat trouvé

des stats a l oral

N/A
N/A
Protected

Academic year: 2021

Partager "des stats a l oral"

Copied!
2
0
0

Texte intégral

(1)

Des stats ` a l’oral

Pour utiliser efficacement le tableur (LibreOffice).

— Pendant la pr´eparation, pour ´eviter que le logiciel ne recalcule en permanence toutes les cellules : dans le menu Donn´ees -> Calculer : d´ecocher le calcul automatique. La touche F9 permet de lancer le calcul des formules `a la demande.

— Pour cr´eer un fichier avec de nombreuses simulations : cr´eer une ligne avec la simulation d’un

´

echantillon et toute l’´etude que l’on veut faire dessus. Bien v´erifier les adresses des cellules (avec/sans$). Puis, s´electionner la zone sur laquelle on veut reproduire l’´echantillon (soit `a la main, soit en l’indiquant dans la zone qui affiche l’adresse de la cellule sur laquelle on est) et remplir la zone, g´en´eralement vers le bas (Ctrl-D, ou menu Feuille -> Remplir les cellules).

Un Ctrl-C / Ctrl-V marche aussi, tout comme double-cliquer sur le petit carr´e qui apparaˆıt en bas de la cellule. Dans ce dernier cas, la ou les colonnes s´electionn´ees seront remplies jusqu’`a la 1`ere ligne vide de la colonne juste `a gauche.

— Pour que les commandes soient plus lisibles : on peut donner un nom `a une donn´ee ou une plage de donn´ees : dans le menu Donn´ees-> Donner un nom, par exemple zone. On peut alors l’utiliser dans les commandes (moyenne(zone), ecartype(zone)...)

— La commande nb.si est pratique mais capricieuse. =nb.si(A1:A100;4) [resp. =nb.si(A1:A100;B1)]

compte le nombre de cellules dont le contenu est ´egal `a 4 [resp. au contenu de la cellule B1]. =nb.si(A1:A100;"<=4") [resp. =nb.si(A1:A100;"<="&B1)] le nombre de cellule dont le contenu est inf´erieur ou ´egal `a 4 [resp. au contenu de la cellule B1).

Pour compter le nombre de cellules v´erifiant plusieurs conditions simultan´ement, on peut utiliser sommeprod : en effet, =sommeprod(A1:A100<B1;C1:C100>3) vous indiquera le nombre d’indices v´erifiant les deux conditions indiqu´ees. Cette fonctionnalit´e ne semble pas marcher avec Excel !

— Pour les histogrammes et les diagrammes en boite, utiliser de pr´ef´erence le tableur de Geo- gebra. Tr`es pratique ´egalement pour les statistiques `a 2 variables, mais peut faire planter le logiciel dans le cas d’un grand fichier. LibreOffice ne permet pas de faire des histogrammes mais uniquement des diagrammes en barre, et pour dessiner un diagramme en boˆıte, il faut indiquer `a la main le minimum, Q1,la m´ediane, Q3, et le maximum de l’´echantillon : pas tr`es ergonomique !

— Pour simuler une valeur selon la loi uniforme sur [0, 1] (resp. sur {1, . . . , k} : Alea() (resp.

Alea.Entre.Bornes(1,k)). Avec GeoGebra : il y a les commandes Al´eaUniforme[min, max]

ou Al´eaUniforme[min, max, n] pour obtenir un ´echantillon de taille n, sous forme d’une liste (resp. Al´eaEntreBornes[min,max]). NB : avec Geogebra, l’autocompl´etion des formules marche mal dans le tableur : si vous avez un doute sur une formule, tapez-la dans le champ de saisie, sous la fenˆetre Alg`ebre.

— Pour simuler une valeur suivant une autre loi que la loi uniforme : pour la loi binomiale, le plus simple est de sommer des Bernoulli de mˆeme param`etre. Pour les lois `a densit´e, on utilise g´en´eralement le fait que, si U est une variable al´eatoire de loi uniforme sur [0, 1] et si F est la fonction de r´epartition d’une variable al´eatoire `a densit´e, alors F−1(U ) est de fonction de r´epartition F . Donc, par exemple, pour g´en´erer une valeur d’un ´echantillon suivant la loi normale N (0, 1), on tapera loi.normale.inverse(Alea();0;1). Pour simuler suivant la loi exponentielle de moyenne 3, on utilise = −3 ln(Alea()) ou −3 ln(1 − Alea()).

Les outils

Vous avez `a votre disposition le tableur de LibreOffice, GeoGebra (dont le tableur et le module

« Calcul de probabilit´es »), Algobox, Scratch, Scilab, Python, Xcas, un ´emulateur de calculatrice...

Vous devez absolument maˆıtriser pour l’oral LibreOffice, GeoGebra et un logiciel de programma- tion. Le tableur de GeoGebra n’est pas le plus simple `a utiliser (erreurs dans les formules difficilement d´etectables, plantage avec des fichiers trop grands), mais il est tr`es efficace pour traiter les ´echantillons

1

(2)

« comme devant une classe », tout comme la calculatrice. N’utilisez pas LibreOffice pour tracer des histogrammes (il n’est pas con¸cu pour cela), ni des diagrammes en boite, mais vous pourrez faire avec des simulations d’´echantillons pour mettre en ´evidence les intervalles de fluctuation ou de confiance.

Quelques id´ees de choses `a faire.

— Pour illustrer le niveau de confiance d’un intervalle de fluctuation/de confiance : Simuler 1000

´

echantillons de mˆeme taille suivant une loi de Bernoulli de param`etre donn´e p ; calculer la proportion empirique (ie moyenne empirique) de chacun de ces mille ´echantillons et compter combien de ces ´echantillons tombent dans l’intervalle de fluctuation exact ou asymptotique, ou dans l’intervalle de confiance de niveau donn´e. On peut mettre en param`etre p et le niveau de risque.

— Pour illustrer la loi des grands nombres : Simuler un grand ´echantillon suivant la loi de votre choix et observer la convergence de la moyenne empirique vers l’esp´erance de la loi en calculant les moyennes de k premi`eres valeurs. Pour cela, au tableur : Si votre ´echantillon est dans la colonne A, taper dans la cellule B1 la formule =moyenne(A$1:A1) et faire glisser.) Peut servir d`es le coll`ege (convergence des fr´equences empiriques). N’oubliez pas de tracer le graphe des fr´equences empiriques.

— Pour le coll`ege : on peut aussi faire des simulations avec scratch, compter le nombre de fois o`u quelque chose se produit. Il est relativement simple de simuler les d´eplacements d’un gardien de mus´ee par exemple, en faisant ´eventuellement grossir un trait `a chaque fois qu’il passe dans une pi`ece donn´ee pour montrer visuellement le nombre de passages, mais la partie graphique n’est pas la plus int´eressante. Ca peut se faire ´egalement avec Algobox ou tout autre langage de programmation. Ne pas chercher `a faire quelque chose de beau/ludique, mais viser l’efficacit´e !

— GeoGebra est tr`es efficace pour traiter les s´eries statistiques `a deux variables : entrer la s´erie statistique dans le tableur, s´electionner la zone et demander son analyse.

— Je ne parle pas de python, ni de scilab : si vous maˆıtrisez l’un de ces logiciels, n’h´esitez pas ! Pour Python (attention : les listes sont index´ees `a partir de 0), je vous rappelle que les librairies numpy, scipy et matplotlib sont disponibles pour le concours. Pour scilab, vous avez le module lyc´ee.

2

Références

Documents relatifs

[r]

(**) Sous Casio, l’algorithme affiche toujours par défaut la dernière variable stockée.. 3) a) En s'inspirant des programmes précédents, écrire un programme (langage au

Il faudra attendre la fin de la première phase du déconfinement, prévue le 2 juin, pour en savoir plus sur les vacances d'été, a aussi déclaré Edouard

Tout d’abord, tout simplement parce que comme je l’ai déjà expliqué dans cet article précédent, tout est vibration (nous sommes des êtres énergétiques

Si n est un entier au moins égal à 2, on considère dans le plan les n 2 points de coordonnées (i, j) avec.. Trouver pour n variant de 2 à 10 de bonnes valeurs pour

Lorsqu’un parcours est obtenu pour une valeur n=p, avec un départ D et une arrivée A, il suffit de trouver un parcours avec les seuls points du périmètre de p+2 et de prévoir

3) Añadir texto a una diapositiva: Si la diapositiva contiene texto, haga clic en Pulse para añadir texto en el cuadro de texto y escriba su texto. Los estilos de esquema del 1 al

Pour commencer il faut ouvrir une nouvelle fenêtre puis aller au bas de la page dans la case Saisie et taper les formules données ci-dessous.. Attention à bien respecter