• Aucun résultat trouvé

5.3 Extremums de fonctions num´eriques

5.3.2 Probl`emes d’extremums li´es

Soit la fonction ojectif φ : Ω ouvert ⊂ IRn → IR et soit la fonction vectorielle g = [g1, . . . , gm] : Ω → IRm permettant de d´efinir l’ensemble S des contraintes

S ={x∈IRn|x∈Ω ;g1(x) = 0, . . . , gm(x) = 0}.

Calcul Matriciel et Analyse Factorielle des Donn´ees

Le probl`eme est maintenant le suivant :

minimiser φ(x) sous la contrainte : x∈S

La fa¸con la plus efficace pour r´esoudre ce type de probl`eme d’extremums li´es par les m contraintes de type ´egalit´e, est en g´en´eral d’utiliser les multiplicateurs de Lagrange.

Conditions n´ecessaires d’optimalit´e locale Th´eor`eme 4 (Lagrange) :

Hypoth`eses sur les contraintes

Soient g : Ω ouvert de IRn →IRm (n > m) et x∈Ω tels que H1 : g(x) = 0,

H2 : g est diff´erentiable sur une boule ouverte B(x),

H3 : la matrice Jacobienne Dg(x)m×n est continue en x, H4 : Dg(x) est de rangm.

Hypoth`eses sur la fonction objectif Soit φ : Ω →IRtelle que

H5 : φ est diff´erentiable en x,

H6 : φ(x)≥φ(x) pour tout x deB(x) v´erifiant g(x) = 0.

Conclusion

Il existe un (unique dˆu `a H4) vecteur l = [λ1, . . . , λm] appel´e vecteur des multiplicateurs de Lagrange, tel que

Dφ(x) +lDg(x) = 01×n, (**) ou en transposant

∇φ(x) +Pm

i=1λi∇gi(x) = 0n×1. (**) 2 Remarques :

R1 : M´ethode des multiplicateurs de Lagrange : Dans la recherhe d’optimums locaux, on construit d’abord la fonction de Lagrange L : Ω×IRm →IR

L(x, l) = φ(x) +lg(x) =φ(x) +Pm

i=1λigi(x).

Les conditions n´ecessaires d’optimalit´e locale pour le probl`eme d’extremums libres min L(x, l)

Ω×IRm s’´ecrivent

xL(x, l) =∇φ(x) +Pm

i=1λi∇gi(x) = 0 (**)

lL(x, l) =g(x) = 0.

Elles fournissent comme solutions les point critiques (x, l). Parmi eux se trouvent les optimums locaux de φ relatifs `a S. Il faut enfin s´electionner parmi les points

critiques ceux qui sont des minimums.

R2 : Cas o`uφ est fonction d’une matriceXn×p.

Soient φ : Ω (ouvert de IRn×p) →IR etG : Ω→ IRm×q, le probl`eme d’optimisation devient

min φ(X) G(X) = 0m×q

Par vectorisation, ce probl`eme est un probl`eme d’optimisation `amq contraintes. On introduit Λ = [λij], matricem×qdes multiplicateurs de Lagrange, dans l’expression de la fonction de LagrangeL(X,Λ) definie par

L(X,Λ) =φ(X) +vec(Λ)vec(G(X)) =φ(X) + trace(ΛG(X)).

Il faut d´eterminer les points critiques (X,Λ) de la fonctionL(X,Λ) et enfin ´etudier la nature ces points.

Conditions suffisantes de minimum local sous contraintes

Th´eor`eme 5 : Supposons que L(x, l) soit 2 fois diff´erentiable au point critique (x, l) et que la matrice Jacobiennem×n Dg(x) soit de rangm. Si de plus

uHxL(x, l)u >0 pour toutu∈IRn tel que Dg(x)u= 0m×1, o`uHxL(x, l) =Hφ(x) +Pm

i=1λiHgi(x), alors φ pr´esente un minimum strict enx sous la contrainte g(x) = 0. 2

5.4 Exercices

Exercice 1 : Fonctions num´eriques d’un vecteur : Etablir le tableau d’identifi-cation suivant

φ(x) d φ(x) D φ(x) ∇φ(x)

ax adx a a

xAx x(A+A)dx x(A+A) (A+A)x

φ1(x) φ2(x)

φ21−φ12

φ2221−φ12)/φ22 φ2(x)∇φ1(x)−φφ2 1(x)∇φ2(x) 2(x)

Exercice 2 : Fonctions num´eriques d’une matrice a) Montrer que

∂trace(X)

∂X =I ; ∂trace(XX)

∂X = 2X ; ∂trace(X2)

∂X = 2X.

Calcul Matriciel et Analyse Factorielle des Donn´ees

b) Etablir le tableau d’identification suivant

φ(X) d φ(X) D φ(X) ∂φ(X)/∂X

trace(AX) trace(AdX) vec(A) A

trace(XAXB) trace[(AXB+AXB)dX] vec(BXA+BXA) BXA +BXA trace(XAXB) trace[(AXB+BXA)dX] vec(BXA+AXB) BXA+AXB

Exercice 3 : Fonctions vectorielles

Calculer les matrices Jacobiennes de f(x) =Ax, f(x) =a(xx), f(X) =Xa.

Exercice 4 : Fonctions matricielles : Etablir le tableau d’identification suivant

F(X) d F(X) D F(X)

X dX Inq

X dX Knq

XX (dX)X+X(dX) (In2 +Knn)(X⊗In) XX (dX)X+X(dX) (Iq2 +Kqq)(Iq⊗X) o`uX est une matrice n×q.

Exercice 5 : Calculer les matrices Hessiennes des fonctions scalaires suivantes : φ(x) =xAx, φ(X) = trace(XAX), φ(X) = trace(AXBX), φ(X) = trace(X2).

Exercice 6 : R´esoudre le probl`eme d’optimum libre suivant minX kY −AXk2F

o`u les matrices Y m×n etA m×psont donn´ees.

Exercice 10: SoientAune matrice sym´etrique d´efinie positiven×n etB une matrice m×n. Alors,

trace(XAX)≥trace[(BA−1B)−1]

pout toute matrice X n×m satisfaisant BX =Im. Le minimum ´etant obtenu pour Xb =A−1B(BA−1B)−1.

Indication : exprimer le probl`eme sous forme d’un probl`eme d’optimisation avec contraintes de type ´egalit´e et le r´esoudre.

Chapitre 6

Le paysage math´ ematique et

statistique de l’Analyse Factorielle de Donn´ ees : la g´ eom´ etrie Euclidienne

L’analyse factorielle de donn´ees a pris son essor dans le deuxi`eme tiers du XXi`eme si`ecle avec l’apparition des ordinateurs et le devoir de traiter des donn´ees dont la taille n’a fait que croˆıtre avec les progr`es de l’informatique. Traiter ou analyser les donn´ees, c’est d’abord essayer de d´etecter la pr´esence d’´eventuelles erreurs de saisie ou de donn´ees atypiques, ensuite tenter de visualiser certaines structures communes difficiles voire im-possibles `a mettre a priori en ´evidence `a cause de la taille des donn´ees.

La diversit´e de nature des variables mesur´ees est `a l’origine de la cr´eation des diff´erentes m´ethodes d’analyse factorielle. Historiquement, l’Analyse en Composantes Principales (ACP), dite classique ou usuelle, est la premi`ere apparue (Hotelling, 1901, Spearman, 1904) pour traiter des mesures sur des variables quantitatives. Cependant d’autres m´ethodes d’analyse factorielle portant sur des variablesqualitativesoubool´eennes, par exemple les m´ethodes d’analyse d’une enquˆete, proc`edent du mˆeme principe : celui de lar´eduction de la dimension, c’est `a dire, la mise en ´evidence de variables latentes ou Composantes Principales, en petit nombre, qui r´esument les variables mesur´ees, au sens o`uces nouvelles variables synth´etiques sont des combinaisons lin´eaires des variables originelles dont les poids sont appel´es les facteurs principaux. On emploie aussi de ce fait, la d´enomination d’analyse factorielle lin´eaire.

L’objectif de ce chapitre est de d´efinir vocabulaire et notations aptes `a mettre en ´evidence les analogies entre la g´eom´etrie Euclidienne et la statistique

6.1 Le triplet (T, M, D) des donn´ ees

Un jeu de donn´ees est constitu´e par un triplet (T, M, D) d´efini par les trois ´el´ements suivants.

– T = [Tij] ∈ IRn×p est la matrice des donn´ees brutes exprimant les n mesures de p variables, x1, . . . , xp, par exemple quantitatives. Le tableau T pourra aussi ˆetre obtenu `a partir des r´esultats d’une enquˆete ; on verra plus loin dans ce cas, la nature des donn´ees.

– M, p×p, est une m´etrique Euclidienne sur l’espace IRp des lignes de T.

Lai`eme ligne de T, not´ee Ti, sera consid´er´ee comme l’expression dans la base cano-nique de l’espace (IRp, M), de l’´echantillon du i`eme individu.

– D, m´etrique sur l’espace Euclidien IRn des colonnes de T, est une matrice, n×n, qui sera toujours diagonaleD = diag(p1, . . . , pn) .

La j`eme colonne de T, not´ee Tj, sera consid´er´ee comme l’expression dans la base canonique de (IRn, D), de l’´echantillon de la j`eme variable, xj.

Les espaces Euclidiens (IRn, D) et (IRp, M) consid´er´es sont respectivement les espaces des individus et des variables. Ces espaces sont soit des espaces vectoriels soit des espaces affines selon que l’on parlera de vecteurs ou de points, un point origine ayant alors ´et´e choisi au pr´ealable. Par abus de langage, on confondra parfois lorsqu’il n’y aura pas d’am-bigu¨ıt´e, un point-vecteur ligne (respectivement un point-vecteur colonne) avec la matrice ligne (colonne) de son expression dans la base canonique.

D’autre part, on notera r le rang de T, r ≤ min(n, p). L’espace des variables

´echantillonn´ees, Im T, et l’espace des individus ´echantillonn´es, Im T, sont de mˆeme dimension r

dim Im T =dim Im T =r.

Calcul Matriciel et Analyse Factorielle des Donn´ees

6.2 Statistique et g´ eom´ etrie sur (IR

n

, D), espace des