• Aucun résultat trouvé

Probabilités et Statistiques

N/A
N/A
Protected

Academic year: 2022

Partager "Probabilités et Statistiques"

Copied!
26
0
0

Texte intégral

(1)

Probabilités et Statistiques

Année 2009/2010!

laurent.carraro@telecom-st-etienne.fr!

olivier.roustant@emse.fr

!

(2)

Objectifs

 Acquérir les concepts élémentaires de probabilités.!

 Préparer aux enseignements qui suivent (ex : processus aléatoires).!

 Comprendre ce qu’est la modélisation probabiliste.!

 Acquérir un savoir-faire probabiliste en relation avec des applications.!

 Acquérir un savoir-faire statistique et savoir aborder un problème simple de traitement de données.!

 Savoir traiter un problème simple de régression.!

(3)

Probas-Stats 1A

octobre 09

3

Choix pédagogiques

  Ne pas traiter les fondements des probabilités (théorie de la mesure)!

  120h en master 1 de maths …

  Théorie utile seulement pour une minorité (0 à 5)

  Un enseignement différent de celui que vous avez connu!

  Moins de démonstrations, plus d’applications

  Apprentissage de savoir-faire

  Apprentissage Par Problèmes (APP)!

(4)

Moyens pédagogiques

  Modalités :" !

  Cours : 14 séances (21h)

  TD : 13 séances (19,5)

  TP : 2 séances (3h)

  APP : 3 séances (4,5h)

  Outils logiciels :!

  Excel (utilisé en entreprise)

  R (logiciel libre dédié aux statistiques, utilisable en entreprise)

  Portail!

(5)

Probas-Stats 1A

octobre 09

5

Evaluation

  Compte-rendus APP!

  QCM!

  Examen!

  Pondérations à préciser!

(6)

Plan du cours

  Le modèle probabiliste. Probabilité conditionnelle.

Indépendance.

  Variable aléatoire. Loi. Fonction de répartition. Densité.

  Espérance. Variance. Covariance.

  Outils d’exploration de données : histogramme, boxplot, qqplot…

  Loi des grands nombres, simulation et méthode de Monte Carlo.

  Théorème de la limite centrée (TLC).

  Vecteurs aléatoires, loi, indépendance. Vecteurs gaussiens.

  Estimation : biais, risque, méthodes d’estimation (MC, EMV)

  Intervalles de confiance

  Tests statistiques. Vocabulaire. Méthodologie. Notion de p- valeur

  Régression linéaire : modèle probabiliste, estimation, analyse de variance, validation, prédiction

(7)

Probas-Stats 1A

octobre 09

7

Déroulement 1/2

CM! TD/TP!

1 - Définition d’une probabilité! Premiers modèles!

2 - Modèle probabiliste! Propagation d’incertitudes!

3 - Variables aléatoires, loi, f.r.,

densité! TP : Initiation à R!

4 - Simulation! Loi normale et dérivées!

5 - Exploration de données! Calculs d’espérances!

6 - Espérance, indépendance! APP estimation d’une proportion!

7 - Variance, covariance, LGN! Probabilités conditionnelles, loi exponentielle, Bayes!

8 - Vecteurs aléatoires, cas gaussien! Calculs sur des vect.a.!

Rendu APP + QCM + sommes de v.a.

indépendantes!

TP : APP régression!

(8)

Déroulement 2/2

CM! TD/TP!

9 - Monte Carlo, TLC! Vecteurs gaussiens!

10 - Régression linéaire, vision

géométrique! Notions de fiabilité, comparaison de systèmes!

11 - Estimation et régression! Estimation ponctuelle!

12 - Tests! Intervalles de confiance, tests!

13 - Régression et tests, ANOVA! Tests non paramétriques!

14 - Validation en régression! Rendu APP + QCM + retour!

Etude de cas en groupe!

Révisions!

(9)

Cours °1

Vers la définition d’une probabilité!

(10)

Exemple 1

R : rigidité diélectrique

P(R < 11) ? P(R < 11.5) ? Test de résistance d’un isolant de bougie par claquage à

partir d’un échantillon de taille 60

Rigidité diélectrique (V/cm)

(11)

Probas-Stats 1A

octobre 09

11

1

er

calcul, définition fréquentiste

On obtient :

P(R < 11) = 1/60 ≈ 1.66%

P(R < 11.5) = 3/60 = 5%

Remarques :

P(R < 10) = 1/60 … P(R < x) = # {valeurs observées < x} / # {valeurs totales}

(12)

2 calcul, avec une « loi de probabilité »

On obtient :

P(R < 11) ≈ 2.06 % P(R < 11.5) ≈ 3.56 %

Remarque :

P(R < 9.5) ≈ 0.33%

Loi de Weibull : P(R < x) = 1 - exp(-(x/λ)α)

(13)

Probas-Stats 1A

octobre 09

13 consommation électrique hebdomadaire en France

du 1/01/1996 au 26/12/99

5000 6500 8000 9500 11000

janv-96 janv-97 janv-98 janv-99 janv-00

jour

énergie consommée en GWh

9650

Exemple 2

(14)

températures hebdomadaires à Paris du 1/01/1996 au 26/12/99

-10,00 0,00 10,00 20,00 30,00

janv-96 janv-97 janv-98 janv-99 janv-00

jour

température en °C

Influence d’autres variables ?

(15)

Probas-Stats 1A

octobre 09

15 consommation électrique hebdomadaire en France en fonction de

la température hebdomadaire à Paris du 1/01/1996 au 26/12/99

5000 6500 8000 9500 11000

-10 -5 0 5 10 15 20 25 30

température en °C

énergie consommée en GWh

Relation température/

consommation

(16)

R

R/2

Soit un disque de rayon R.

On tire une corde au hasard.

Quelle est la probabilité que la corde soit plus longue que le côté du triangle équilatéral inscrit ?

Paradoxe de J. Bertrand

(17)

Probas-Stats 1A

octobre 09

17 R

R/2

On choisit le milieu de la corde au hasard

dans le disque

Réponse

p = 1/4

(18)

R R/2

On fait tourner la

figure et on choisit le milieu de la corde sur le segment [0,R]

Deuxième réponse :-)

p = 1/2

(19)

Probas-Stats 1A

octobre 09

19

R/2

R

On fixe un point sur le cercle, et on choisit l’autre au hasard

Troisième réponse :-(

p = 1/3

(20)

Probas-Stats 1A 20

Quelle solution ?

  Réponse : préciser les hypothèses!

  Cas n°1 : simuler uniformément un point dans le disque

  Cas n°2 : simuler uniformément l’angle et le rayon

  Cas n°3 : simuler uniformément 1 point sur le cercle

Illustration :

cas n°1 ≠ cas n°2

(21)

Probas-Stats 1A

octobre 09

21

•  Considérons une erreur de mesure ε sur Ω=D(0,1) de R2

•  On donne A ⊂ Ω. Comment calculer la probabilité que ε soit dans A ?

1 0

A

•  Morale du paradoxe de Bertrand: préciser les hypothèses !

•  Question : par analogie, si nous devions calculer la masse de A, de quoi aurions-nous besoin ?

La vision mesure (d’aire)

(22)

•  Réponse : de la densité de masse du disque

•  Par exemple, f(x,y) = exp(-r2), avec r2=x2+y2, pour 0≤r≤1

•  Questions :

•  Comment s’interprète cette densité ?

•  Comment l’utilise-t-on pour calculer la masse ?

La densité

(23)

Probas-Stats 1A

octobre 09

23

•  Raisonnons maintenant en probabilité

•  Hypothèse : on se donne la densité de probabilité

•  f(x,y) proportionnel à exp(-r2), avec r2=x2+y2, pour 0≤r≤1

•  Questions :

•  Comment trouver la constante de proportionnalité ?

•  Comment s’écrit la probabilité cherchée ?

•  Avec la vision mesure, quelles sont les propriétés

minimales que l’on est en droit d’exiger d’une probabilité ?

La probabilité

(24)

•  Définition (incomplète) d’une mesure

On se donne un ensemble Ω, support des valeurs possibles.

Une mesure µ est une application sur (Ω) vérifiant :

•  µ()=0

•  µ(Ω)<+

•  Pour toute séquence d’éléments de (Ω) , A1, …, An, alors si les Ak sont deux à deux disjoints,

µ(A1An) = µ(A1)+…+ µ(An) (additivité)

•  Question : Que faut-il rajouter pour obtenir une probabilité ?

d’une probabilité

(25)

Probas-Stats 1A

octobre 09

25

•  Modèle probabiliste

•  La définition d’une probabilité dépend donc de Ω.

•  Lorsque µ est une probabilité sur (Ω),

le triplet (Ω ,(Ω), µ) définit un modèle probabiliste

Modèle probabiliste

•  Questions :

•  Quelles modèles probabilistes connaissez-vous ?

•  Les probabilités correspondantes sont-elles des mesures ?

•  Sont-elles toujours définies à partir d’une densité ?

(26)

•  La densité de probabilité précédente est voisine de celle de la loi normale standard (ou loi de LAPLACE-GAUSS)

•  En dimension 1, son expression est donnée par : f(x) = 1/√(2π) * exp(-x2/2)

C’est la fameuse « courbe en cloche »

•  Elle est très souvent utilisée pour modéliser des erreurs, à cause d’un résultat théorique fondamental :

le Théorème de la Limite Centrée

La reine des probabilités

Références

Documents relatifs

méthode n’a permis d’établir des équations permettant de réaliser des prédictions valables lorsque le nombre de variables explicatives potentielles est supérieur au

Dans ce module nous établissons deux ratios, le coefficient de corrélation linéaire (unité 1) et le coefficient de détermination (unité 2) qui permettent de

(e) Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

 Régression linéaire : modèle probabiliste, estimation, analyse de variance, validation,

Remarque : le nombre de degrés de liberté de l’interaction faisant intervenir la quantité (ν – 1), il en résulte qu’il est nécessaire de disposer d’au moins deux résultats

commun du modele statistique linéaire (1) ces trois methodes que cons- tituent la regression lineaire, la methode des moindres carres et l’estima- tion bayesienne.. On

Ce travail concerne l’´ etude de la pr´ ediction dans le mod` ele lin´ eaire fonctionnel lorsque la variable d’int´ erˆ et est elle aussi fonctionnelle1. Nous introduisons un

exemples disponibles par la méthode de validations croisées [13].  La validation croisée est une méthode qui permet de diviser le jeu de données en proportions d’exemples