Rappels de mathématiques
Introduction à la Data Science - Efreitech
Maxime Jumelle - Taieb Badis
www.blent.ai
Plan
1. Calcul matriciel
2. Statistiques / Probabilités
3. Analyse
Calcul matriciel
Lois de compositions
Produit matriciel
3 1
−1 2
!
× −2 4
1 3
!
= −5 15
4 2
!
1 2 3 4
!
× 1 1
!
= 3 7
!
Attention
Le produit matriciel n’est pas toujours commutatif ! En règle général, pour deux matricesAetB :
AB6=BA
Opérations particulières
Inverse
M−1= 1
det(M)Com(M)>
Transposée
1 2 3 4
!>
= 1 3 2 4
!
3
Normes
Considéronsx= (x1, . . . ,xn)>∈Rn. NormeL1:
kxk1=
n
X
i=1
|xi|
Norme euclidienne (ouL2) :
kxk2= v u u t
n
X
i=1
xi2
Norme infinie (ouL∞) :
kxk∞= max
1≤i≤n|xi|
Exercice
Montrer quekxk22=x>x.
Statistiques / Probabilités
Notions de bases
L’élément de base estla variable aléatoireX sur un ensemble Ωappelé univers. Une variable aléatoire peut être à plusieurs types :
• discrète finiesi elle peut prendre un nombre fini de valeurs (jeu de carte, lancer de dés, ...)
• discrète infinieest elle peut prendre une infinité de valeurs dénombrable (nombre de piles successifs au pile ou face)
• continue lorsque les valeurs possibles sont indénombrables (temps d’attente, distance, ...)
On noteX(Ω) l’ensemble des valeurs que peut prendre une variable aléatoire.
Parmi les lois les plus connus, on retrouve la loi de Bernouilli, binomiale et normale.
Mesure de probabilité
Une mesure de probabilitéPest une mesure à valeurs dans[0,1]telle que
• P(∅) =0
• Pour des événements A1,A2, ...deux à deux disjoints :
P
[
n≥1
An
=X
n≥1
P(An)
6
Espérance mathématique
Definition (Espérance mathématique)
L’espérance mathématique d’une variableX est définie par : (Discrète) E(X) = X
x∈X(Ω)
xP(X =x)
(Continue) E(X) = Z
xf(x)dx
Attention: l’espérance mathématique n’est pas la moyenne, même si elle y ressemble !
Moyenne
Definition (Moyenne)
La moyenne des observationsx1, ...,xnest définie par :
µ= 1
n
n
X
i=1
xi
[Loi des grands nombres] Si les observationsx1, ...,xn sont issues d’une variable aléatoireX alors
1 n
n
X
i=1
xi −→E(X)
8
Variance
Definition (Variance)
La variance d’une variableX est définie par : (Discrète) V(X) = X
x∈X(Ω)
(x−µ)2P(X =x)
(Continue) V(X) = Z
(x−µ)2f(x)dx
On peut montrer la formule de König-Huygens : V(X) =E(X2)−E(X)2 Une variance est toujours positive !
Variance empirique
Definition (Ecart-type)
L’écart-type d’une variable aléatoire est la racine carrée de la variance (si elle existe).
σX =p
V(X)
Definition (Variance empirique)
La variance empirique des observationsx1, ...,xnest définie par : 1
n
n
X
i=1
(xi−µ)2
10
Covariance
Definition (Covariance)
La covariance est une mesure de concentration entre deux variables aléatoiresX etY :
Cov(X,Y) =E[(X −E(X))(Y−E(Y))]
Definition (Corrélation linéaire)
La corrélation est une mesure de lien linéaire entre deux variables aléatoiresX etY :
ρ(X,Y) = Cov(X,Y) p
V(X)V(Y)
On a toujoursρ(X,Y)∈[−1,1]. Attention : corrélation6=dépendence.
Conclusion
• Bien différencier le cadre probabiliste (espérance, variance, ...) du cadre statistique (moyenne, variance empirique, ...)
• En probabilités, onprédit les futures observations
• En statistiques, onanalyseles observations dont on dispose
12
Analyse
Gradient
Considérons une fonctionf :Rn−→Rdifférentiable.
Le gradient d’une fonction à valeurs réelles est le vecteur de ses dérivées partielles.
∇f(x1, . . . ,xn) =
∂f
∂x1 ...
∂f
∂xn
13