Rappels de mathématiques Introduction à la Data Science - Efreitech

(1)

Rappels de mathématiques

Introduction à la Data Science - Efreitech

Maxime Jumelle - Taieb Badis

www.blent.ai

(2)

Plan

1. Calcul matriciel

2. Statistiques / Probabilités

3. Analyse

(3)

Calcul matriciel

(4)

Lois de compositions

Produit matriciel

3 1

−1 2

!

× −2 4

1 3

!

= −5 15

4 2

!

1 2 3 4

!

× 1 1

!

= 3 7

!

Attention

Le produit matriciel n’est pas toujours commutatif ! En règle général, pour deux matricesAetB :

AB6=BA

(5)

Opérations particulières

Inverse

M⁻¹= 1

det(M)Com(M)^>

Transposée

1 2 3 4

!>

= 1 3 2 4

!

3

(6)

Normes

Considéronsx= (x₁, . . . ,x_n)^>∈Rⁿ. NormeL¹:

kxk1=

n

X

i=1

|xi|

Norme euclidienne (ouL²) :

kxk2= v u u t

n

X

i=1

x_i²

Norme infinie (ouL^∞) :

kxk∞= max

1≤i≤n|xi|

Exercice

Montrer quekxk²₂=x^>x.

(7)

Statistiques / Probabilités

(8)

Notions de bases

L’élément de base estla variable aléatoireX sur un ensemble Ωappelé univers. Une variable aléatoire peut être à plusieurs types :

• discrète finiesi elle peut prendre un nombre fini de valeurs (jeu de carte, lancer de dés, ...)

• discrète infinieest elle peut prendre une infinité de valeurs dénombrable (nombre de piles successifs au pile ou face)

• continue lorsque les valeurs possibles sont indénombrables (temps d’attente, distance, ...)

On noteX(Ω) l’ensemble des valeurs que peut prendre une variable aléatoire.

Parmi les lois les plus connus, on retrouve la loi de Bernouilli, binomiale et normale.

(9)

Mesure de probabilité

Une mesure de probabilitéPest une mesure à valeurs dans[0,1]telle que

• P(∅) =0

• Pour des événements A1,A2, ...deux à deux disjoints :

P



 [

n≥1

An



=X

n≥1

P(An)

6

(10)

Espérance mathématique

Definition (Espérance mathématique)

L’espérance mathématique d’une variableX est définie par : (Discrète) E(X) = X

x∈X(Ω)

xP(X =x)

(Continue) E(X) = Z

xf(x)dx

Attention: l’espérance mathématique n’est pas la moyenne, même si elle y ressemble !

(11)

Moyenne

Definition (Moyenne)

La moyenne des observationsx1, ...,xnest définie par :

µ= 1

n

X

i=1

xi

[Loi des grands nombres] Si les observationsx1, ...,xn sont issues d’une variable aléatoireX alors

1 n

n

X

i=1

x_i −→E(X)

8

(12)

Variance

Definition (Variance)

La variance d’une variableX est définie par : (Discrète) V(X) = X

x∈X(Ω)

(x−µ)²P(X =x)

(Continue) V(X) = Z

(x−µ)²f(x)dx

On peut montrer la formule de König-Huygens : V(X) =E(X²)−E(X)² Une variance est toujours positive !

(13)

Variance empirique

Definition (Ecart-type)

L’écart-type d’une variable aléatoire est la racine carrée de la variance (si elle existe).

σ_X =p

V(X)

Definition (Variance empirique)

La variance empirique des observationsx1, ...,xnest définie par : 1

n

X

i=1

(x_i−µ)²

10

(14)

Covariance

Definition (Covariance)

La covariance est une mesure de concentration entre deux variables aléatoiresX etY :

Cov(X,Y) =E[(X −E(X))(Y−E(Y))]

Definition (Corrélation linéaire)

La corrélation est une mesure de lien linéaire entre deux variables aléatoiresX etY :

ρ(X,Y) = Cov(X,Y) p

V(X)V(Y)

On a toujoursρ(X,Y)∈[−1,1]. Attention : corrélation6=dépendence.

(15)

Conclusion

• Bien différencier le cadre probabiliste (espérance, variance, ...) du cadre statistique (moyenne, variance empirique, ...)

• En probabilités, onprédit les futures observations

• En statistiques, onanalyseles observations dont on dispose

12

(16)

Analyse

(17)

Gradient

Considérons une fonctionf :Rⁿ−→Rdifférentiable.

Le gradient d’une fonction à valeurs réelles est le vecteur de ses dérivées partielles.

∇f(x1, . . . ,xn) =







∂f

∂x₁ ...

∂f

∂xn







13