(1)Analyse des données
Texte intégral
(2) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. On cherche un « coude » dans le graphe des valeurs propres et on ne conserve que les valeurs jusqu’au ce « coude ».. Compléments du cours : Multiplicateurs de Lagrange : Optimisation classique avec contraintes: Cas de deux variables. Soit une fonction à deux variables f(x, y) soumise à une seule contrainte de la forme. lM ®E. g(x, y) = b, avec b une constante réelle. La méthode des multiplicateurs de Lagrange consiste à construire une fonction auxiliaire L(x, y, λ), appelée Lagrangien, définie ainsi : L(x, y,λ) = f(x, y)+λ[g(x, y)-b]. Où λ appelé multiplicateur de Lagrange est une inconnue.. ero. Il faut ensuite annuler ses premières dérivées partielles (condition nécessaire) :. ni. ua. ∂L ∂f ∂g ∂x = ∂x + λ ∂x = 0 ∂L ∂f ∂g = +λ =0 ∂ y ∂ y ∂ y ∂L = g ( x, y ) − b = 0 ∂λ. FP. Les points candidats s’obtiennent en résolvant ce système de trois équations à trois inconnues (x, y, λ).. Te. Mentionnons que la troisième équation de ce système ∂L/∂λ = g(x, y) -b=0 n’est rien d’autre que la contrainte ! Les points candidats satisfont par conséquent cette contrainte.. Condition suffisante: On pose:. 2. ∂2L ∂2L > 0 et > 0 , on a un minimum ∂x 2 ∂y 2. an. 1. Si ∆>0 ,. ∂2L ∂2L ∂2L ∆ = 2 ⋅ 2 − ∂x ∂y ∂x∂y . tou. La solution des trois équations ci-dessus fournit les points candidats de la fonction sous contrainte. Ces points candidats satisfont la contrainte mais il reste à déterminer leur nature ;. ∂2L ∂2L < 0 et < 0 , on a un maximum ∂x 2 ∂y 2 3. Si ∆<0, pas d’extremum. 2. Si ∆>0 ,. 4. Si ∆=0, on ne peut pas conclure. 19. www.elmerouani.jimdo.com.
(3) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. Rappel sur la distance : Définition d’une distance : Soit E un sous-ensemble de IRn. Une distance sur E est une application suivantes : ∀ x, y ∈ E ; ∀ x, y ∈ E ; ∀ x, y, z ∈ E ;. possédant. les. propriétés. d ( x, y ) = 0 ⇒ x = y d ( x, y ) = d ( y , x ) d ( x, y ) ≤ d ( x, z ) + d ( z , y ). lM ®E. i. ii. iii.. d : E × E → IR +. Exemple : « La distance euclidienne » Pour x = (x1 , x 2 , L , x n ) , y = ( y1 , y 2 , L , y n )∈ E ⊂ IR n , la distance euclidienne entre x et y est définie par : d ( x, y ) = ( x1 − y1 ) 2 + ( x 2 − y 2 ) 2 + L + ( x n − y n ) 2 .. ero. On peut vérifier facilement les propriétés i, ii, et iii précédentes pour la distance euclidienne. Rappel sur la matrice des variances-covariances et la matrice des corrélations :. ua. 1) La matrice des variances-covariances V de X=(x1,x2,…, xq) est définie par : L Cov( x1 , x q ) L Cov( x 2 , x q ) = E ( XX ′ ) − E ( X ) E ( X ) ′ O M L σ q2 . ni. Cov( x1 , x 2 ) σ 12 σ 22 Cov( x 2 , x1 ) V = M Cov( x , x ) L 1 q . FP. C’est une matrice carrée symétrique d’ordre q.. Si les variables xi sont réduites, V s’identifie avec la matrice des corrélations :. Te. L ρ1q L ρ 2q . O M L 1 . tou. ρ12 1 ρ 21 1 Γ= M ρ q1 L. x11 x 21 X = M x p1. x12 x 22 x p2. an. 2) Lorsque l’on observe les valeurs numériques de q variables sur p individus, on se trouve en présence d’un tableau X à p lignes et q colonnes :. L x1q L x2 q O M L x pq . xij est la valeur prise par la variable n° j sur l’ième individu. Le tableau des données centrés Y est : 20. www.elmerouani.jimdo.com.
(4) Analyse des données. x11 − x1 x 21 − x1 Y = M x − x p1 1. S6, Option : Gestion. x12 − x 2 x 22 − x 2 x p 2 − x2. Prof. Mohamed El Merouani. L x1q − x q L x2q − xq O M L x pq − x q . La matrice des variances-covariances des q variables est : L σ 1q L σ 2q O M L σ q2 . lM ®E. σ 12 σ 12 σ 22 σ V = 21 M σ q1 L. où σ kl =. 1 p (xik xil − xk xl ) est telle que V = 1 Y ′Y ∑ p i =1 p. ero. La matrice des corrélations entre les q variables prises deux à deux est :. L ρ1q L ρ 2q O M L 1 . ni. ua. ρ12 1 ρ 21 1 Γ= M ρ q1 L. Γ est identique à V des données centrées et réduites.. Γ résume la structure des dépendances linéaires entre les q variables.. FP. Le tableau des données centrées et réduites Z est :. x12 − x 2. σ2. x 22 − x 2. σ2. σ2. Alors. Γ=. Si σ j = 1 , alors. an. avec σ j =. 1 p (xij − x j )2 ∑ p i =1. tou. x p 2 − x2. x1q − x q σq x2q − xq L σq O M x pq − x q L σ q L. Te. x11 − x1 σ1 x −x 21 1 Z = σ1 M x −x p1 1 σ 1 . 1 Z ′Z p V=. 1 1 Y ′Y = Z ′Z = Γ p p. 21. www.elmerouani.jimdo.com.
(5) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. Exercices de TD : Exercice 1 : On considère la matrice X de type (2,3) suivante : − 1 0 1 . X = 0 − 1 1. ero. lM ®E. 1. Calculer le produit matriciel. X ′ × X . s’assurer que c’est une matrice carrée et symétrique 2. Chercher les valeurs propres λi et les sous-espaces propres associés Fi . Donner le vecteur unitaire u i de chaque sous-espace. Ecrire la matrice diagonale Λ semblable à X’X et sa matrice de passage A 3. Calculer et vérifier que tr ( X ′X ) = tr (Λ). .. Exercice 2 :. Soit la matrice des données suivante :. On note C1 et C2 les vecteurs colonnes de X. Centrer et normer les variables C1 et C2. Déterminer la matrice V des variances-covariances et la matrice Γ des corrélations. Diagonaliser ces matrices. On note λi leurs valeurs propres. Déterminer les espaces propres Fi associés aux valeurs propres λi .. Exercice 3 :. FP. 1. 2. 3. 4.. ni. ua. 4 5 X = 6 7 8 0 . Te. Réaliser l’ACP de la matrice suivante, à partir de sa matrice de dispersion (données centrées mais non réduites) :. an. 22. 2 2 4 4 . tou. 2 6 6 10 . www.elmerouani.jimdo.com.
(6)
Documents relatifs
On demande ici de montrer que certaines familles sont des bases et de préciser les matrices de passage à partir d'une base xée.. Les vecteurs de ces familles (les a i ) sont
[r]
Ces règles sont en fait autant d’instances différentes d’une seule et même règle qui associe à deux doublons de booléens un troisième doublon dont les coordonnées sont
Définition: Un sous-graphe d'un graphe G est un graphe G' composé de certains sommets du graphe G, ainsi que de toutes les arêtes qui relient
Plus concrètement, on pouvait utiliser le fait que pour obtenir des équations du noyau et de l’image de t a, il suffit d’échelonner la matrice t A, augmentée à droite, en lignes,
Tableaux croisés dynamiques • Mise à jour des tableaux croisés – Si les données changent, le tableau n’est pas mise à jour automa;quement – Si des nouvelles lignes sont
Valida&on de données • Liste déroulante – On peut limiter une cellule à un ensemble fixe de valeurs – Les valeurs sont indiquées dans une plage de cellules « source » –
Nous pouvons, par exemple, essayer de conjecturer le résultat à partir de quelques matrices simples (ce n’est en rien une obligation !). Ce résultat serait-il valable quelle que