(1)Analyse des données
Texte intégral
(2) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. On cherche un « coude » dans le graphe des valeurs propres et on ne conserve que les valeurs jusqu’au ce « coude ».. Compléments du cours : Multiplicateurs de Lagrange : Optimisation classique avec contraintes: Cas de deux variables. Soit une fonction à deux variables f(x, y) soumise à une seule contrainte de la forme. lM ®E. g(x, y) = b, avec b une constante réelle. La méthode des multiplicateurs de Lagrange consiste à construire une fonction auxiliaire L(x, y, λ), appelée Lagrangien, définie ainsi : L(x, y,λ) = f(x, y)+λ[g(x, y)-b]. Où λ appelé multiplicateur de Lagrange est une inconnue.. ero. Il faut ensuite annuler ses premières dérivées partielles (condition nécessaire) :. ni. ua. ∂L ∂f ∂g ∂x = ∂x + λ ∂x = 0 ∂L ∂f ∂g = +λ =0 ∂ y ∂ y ∂ y ∂L = g ( x, y ) − b = 0 ∂λ. FP. Les points candidats s’obtiennent en résolvant ce système de trois équations à trois inconnues (x, y, λ).. Te. Mentionnons que la troisième équation de ce système ∂L/∂λ = g(x, y) -b=0 n’est rien d’autre que la contrainte ! Les points candidats satisfont par conséquent cette contrainte.. Condition suffisante: On pose:. 2. ∂2L ∂2L > 0 et > 0 , on a un minimum ∂x 2 ∂y 2. an. 1. Si ∆>0 ,. ∂2L ∂2L ∂2L ∆ = 2 ⋅ 2 − ∂x ∂y ∂x∂y . tou. La solution des trois équations ci-dessus fournit les points candidats de la fonction sous contrainte. Ces points candidats satisfont la contrainte mais il reste à déterminer leur nature ;. ∂2L ∂2L < 0 et < 0 , on a un maximum ∂x 2 ∂y 2 3. Si ∆<0, pas d’extremum. 2. Si ∆>0 ,. 4. Si ∆=0, on ne peut pas conclure. 19. www.elmerouani.jimdo.com.
(3) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. Rappel sur la distance : Définition d’une distance : Soit E un sous-ensemble de IRn. Une distance sur E est une application suivantes : ∀ x, y ∈ E ; ∀ x, y ∈ E ; ∀ x, y, z ∈ E ;. possédant. les. propriétés. d ( x, y ) = 0 ⇒ x = y d ( x, y ) = d ( y , x ) d ( x, y ) ≤ d ( x, z ) + d ( z , y ). lM ®E. i. ii. iii.. d : E × E → IR +. Exemple : « La distance euclidienne » Pour x = (x1 , x 2 , L , x n ) , y = ( y1 , y 2 , L , y n )∈ E ⊂ IR n , la distance euclidienne entre x et y est définie par : d ( x, y ) = ( x1 − y1 ) 2 + ( x 2 − y 2 ) 2 + L + ( x n − y n ) 2 .. ero. On peut vérifier facilement les propriétés i, ii, et iii précédentes pour la distance euclidienne. Rappel sur la matrice des variances-covariances et la matrice des corrélations :. ua. 1) La matrice des variances-covariances V de X=(x1,x2,…, xq) est définie par : L Cov( x1 , x q ) L Cov( x 2 , x q ) = E ( XX ′ ) − E ( X ) E ( X ) ′ O M L σ q2 . ni. Cov( x1 , x 2 ) σ 12 σ 22 Cov( x 2 , x1 ) V = M Cov( x , x ) L 1 q . FP. C’est une matrice carrée symétrique d’ordre q.. Si les variables xi sont réduites, V s’identifie avec la matrice des corrélations :. Te. L ρ1q L ρ 2q . O M L 1 . tou. ρ12 1 ρ 21 1 Γ= M ρ q1 L. x11 x 21 X = M x p1. x12 x 22 x p2. an. 2) Lorsque l’on observe les valeurs numériques de q variables sur p individus, on se trouve en présence d’un tableau X à p lignes et q colonnes :. L x1q L x2 q O M L x pq . xij est la valeur prise par la variable n° j sur l’ième individu. Le tableau des données centrés Y est : 20. www.elmerouani.jimdo.com.
(4) Analyse des données. x11 − x1 x 21 − x1 Y = M x − x p1 1. S6, Option : Gestion. x12 − x 2 x 22 − x 2 x p 2 − x2. Prof. Mohamed El Merouani. L x1q − x q L x2q − xq O M L x pq − x q . La matrice des variances-covariances des q variables est : L σ 1q L σ 2q O M L σ q2 . lM ®E. σ 12 σ 12 σ 22 σ V = 21 M σ q1 L. où σ kl =. 1 p (xik xil − xk xl ) est telle que V = 1 Y ′Y ∑ p i =1 p. ero. La matrice des corrélations entre les q variables prises deux à deux est :. L ρ1q L ρ 2q O M L 1 . ni. ua. ρ12 1 ρ 21 1 Γ= M ρ q1 L. Γ est identique à V des données centrées et réduites.. Γ résume la structure des dépendances linéaires entre les q variables.. FP. Le tableau des données centrées et réduites Z est :. x12 − x 2. σ2. x 22 − x 2. σ2. σ2. Alors. Γ=. Si σ j = 1 , alors. an. avec σ j =. 1 p (xij − x j )2 ∑ p i =1. tou. x p 2 − x2. x1q − x q σq x2q − xq L σq O M x pq − x q L σ q L. Te. x11 − x1 σ1 x −x 21 1 Z = σ1 M x −x p1 1 σ 1 . 1 Z ′Z p V=. 1 1 Y ′Y = Z ′Z = Γ p p. 21. www.elmerouani.jimdo.com.
(5) Analyse des données. S6, Option : Gestion. Prof. Mohamed El Merouani. Exercices de TD : Exercice 1 : On considère la matrice X de type (2,3) suivante : − 1 0 1 . X = 0 − 1 1. ero. lM ®E. 1. Calculer le produit matriciel. X ′ × X . s’assurer que c’est une matrice carrée et symétrique 2. Chercher les valeurs propres λi et les sous-espaces propres associés Fi . Donner le vecteur unitaire u i de chaque sous-espace. Ecrire la matrice diagonale Λ semblable à X’X et sa matrice de passage A 3. Calculer et vérifier que tr ( X ′X ) = tr (Λ). .. Exercice 2 :. Soit la matrice des données suivante :. On note C1 et C2 les vecteurs colonnes de X. Centrer et normer les variables C1 et C2. Déterminer la matrice V des variances-covariances et la matrice Γ des corrélations. Diagonaliser ces matrices. On note λi leurs valeurs propres. Déterminer les espaces propres Fi associés aux valeurs propres λi .. Exercice 3 :. FP. 1. 2. 3. 4.. ni. ua. 4 5 X = 6 7 8 0 . Te. Réaliser l’ACP de la matrice suivante, à partir de sa matrice de dispersion (données centrées mais non réduites) :. an. 22. 2 2 4 4 . tou. 2 6 6 10 . www.elmerouani.jimdo.com.
(6)
Documents relatifs
Ces règles sont en fait autant d’instances différentes d’une seule et même règle qui associe à deux doublons de booléens un troisième doublon dont les coordonnées sont
Tableaux croisés dynamiques • Mise à jour des tableaux croisés – Si les données changent, le tableau n’est pas mise à jour automa;quement – Si des nouvelles lignes sont
Valida&on de données • Liste déroulante – On peut limiter une cellule à un ensemble fixe de valeurs – Les valeurs sont indiquées dans une plage de cellules « source » –
Plus concrètement, on pouvait utiliser le fait que pour obtenir des équations du noyau et de l’image de t a, il suffit d’échelonner la matrice t A, augmentée à droite, en lignes,
Définition: Un sous-graphe d'un graphe G est un graphe G' composé de certains sommets du graphe G, ainsi que de toutes les arêtes qui relient
[r]
Nous pouvons, par exemple, essayer de conjecturer le résultat à partir de quelques matrices simples (ce n’est en rien une obligation !). Ce résultat serait-il valable quelle que
On demande ici de montrer que certaines familles sont des bases et de préciser les matrices de passage à partir d'une base xée.. Les vecteurs de ces familles (les a i ) sont