Fonctions de deux variables (DS de l’année 2018-2019)

(1)

Fonctions de deux variables (DS de l’année 2018-2019)

Exercice 1 (EML 2015)

Dans cet exercice on pourra utiliser l’encadrement suivant :2<e<3.

Partie I : Étude d’une fonction

On considère l’application ϕ:R→R, x7→ϕ(x) =x²e^x−1.

1. Dresser le tableau de variations deϕ, en précisant la limite deϕen−∞, sa valeur en 0 et sa limite en +∞.

Démonstration.

• La fonctionϕest dérivable sur Rcomme somme et produit de fonctions dérivables sur R.

• Soitx∈R.

ϕ⁰(x) = 2xe^x+x²e^x = x(2 +x)e^x Comme e^x>0,ϕ⁰(x) est du signe dex(2 +x).

Or le polynômeP(X) =X(2 +X) est un polynôme de degré2, dont les racines sont 0et−2. De plus son coefficient dominant est positif.

• On obtient alors le tableau de variations suivant.

x Signe def⁰(x)

Variations def

−∞ −2 0 +∞

+ 0 − 0 +

−1

4e⁻²−1 4e⁻²−1

−1

+∞

• Détaillons les différents éléments de ce tableau.

× En posant le changement de variable u=−x, on obtient :

x→−∞lim x²e^x = lim

u→+∞(−u)²e^−u = lim

u→+∞

u²

e^u = 0 (par croissances comparées) D’où : lim

x→−∞ ϕ(x) =−1.

× Ensuite :ϕ(0) =−1

× Enfin : lim

x→+∞ x²e^x= +∞. Ainsi : lim

x→+∞ϕ(x) = +∞.

2. Établir que l’équation e^x = 1

x², d’inconnue x∈ ]0,+∞[, admet une solution et une seule, notée α, et que α appartient à l’intervalle

1 2,1

. Démonstration.

• Soitx∈]0,+∞[. Remarquons : e^x = 1

x² ⇔ x²e^x= 1 ⇔ x²e^x−1 = 0 ⇔ ϕ(x) = 0

(2)

• La fonctionϕest :

× continue sur l’intervalle ]0,+∞[,

× strictement croissante sur ]0,+∞[.

Ainsi,ϕréalise une bijection de ]0,+∞[dansϕ(]0,+∞[) avec : ϕ(]0,+∞[) =

ϕ(0), lim

x→+∞ϕ(x)

= ]−1,+∞[

Or0∈]−1,+∞[. On en déduit que l’équationϕ(x) = 0admet une unique solutionα∈]0,+∞[.

L’équation e^x = 1

x² admet une unique solution α∈ ]0,+∞[.

• De plus :

× ϕ(¹₂) = 1

4e¹² −1. Or : ϕ(¹₂) = 1

4 e¹² −1 < 1

4 e−1 (par stricte croissance de expsur R)

< 1

4 ×3−1 (car e<3)

< 0

× ϕ(α) = 0.

× ϕ(1) =e¹−1>0 car e>2.

Ainsi :ϕ(¹₂)<0< ϕ(1).

D’après le théorème de la bijection,f⁻¹ : ]0,+∞[→]0,+∞[est strictement croissante sur]0,+∞[.

En appliquantf⁻¹ de part et d’autre de l’inégalité précédente : 1

2 < α <1.

Partie II : Étude d’une suite

On considère l’application f :R→R, x7→f(x) =x³e^x,

et la suite réelle (un)n∈N définie par : u0 = 1et∀n∈N,un+1 =f(un).

3. Montrer : ∀n∈N,u_n>1.

Démonstration.

Démontrons par récurrence : ∀n∈N, P(n) où P(n):u_n>1.

I Initialisation

D’après l’énoncé : u₀ = 1>1.

D’oùP(0).

I Hérédité: soit n∈N.

SupposonsP(n) et démontronsP(n+ 1) (i.e. u_n+1 >1).

Par hypothèse de récurrence :un>1. Ainsi :

× par croissance de la fonction x7→x³ surR:u³_n > 1³= 1,

× par croissance de la fonction expsur R: e^uⁿ > e¹>1.

On en déduit :un+1 =u³_ne^uⁿ >1.

D’oùP(n+ 1).

(3)

Dans cette question, on a utilisé l’implication suivante : 16u³_n et 16e^uⁿ

⇒

1×16u³_n×e^uⁿ

On a donc « multiplié » deux inégalités. Rappelons que ceci est valide seulement parce que tous les termes en présence sont positifs.

Commentaire

4. Établir que la suite (u_n)n∈N est croissante.

Démonstration.

Soit n∈N.

• Tout d’abord :

un+1−un = u³_ne^uⁿ−un = (u²_ne^uⁿ−1)un

• Or, d’après la question précédente :un>1. Ainsi :

× par croissance de la fonction x7→x² sur[0,+∞[:u²_n>1,

× par croissance de la fonction expsurR : e^uⁿ >e¹>1.

Ainsi :u²_ne^uⁿ >1. D’où : u²_ne^uⁿ−1>0.

• Enfin, comme de plus :u_n>1>0, on en déduit : u_n+1−u_n>0.

La suite (un) est donc croissante.

• On pouvait aussi démontrer par récurrence :∀n∈N,P(n) où P(n):un+1 >un :

I Initialisation

× D’une part : u0= 1.

× D’autre part : u1 = f(u0) = 1³×e¹ = e.

D’oùP(0).

I Hérédité: soit n∈N.

SupposonsP(n) et démontronsP(n+ 1) (i.e. un+2 >un+1).

Par hypothèse de récurrence :

un+1 >un

donc f(u_n+1)>f(u_n) (par croissance de f sur [1,+∞[ (à démontrer)) D’oùP(n+ 1).

Attention : le caractère croissant de f ne suffit pas à démontrer que (u_n) est croissante ! (si u0 >u1, la suite obtenue est décroissante).

• On pouvait aussi démontrer :∀x>1, f(x)>x.

Or, commeu_n>1 (d’après la question précédente) :f(u_n)>u_n. Ainsi :u_n+1 >u_n. Attention :

f croissante ⇒ f(x)>x

On peut penser à la fonction racine qui est croissante surR⁺ et vérifie : ∀x>1, √ x6x.

Commentaire

(4)

5. Quelle est la limite deu_n lorsque l’entierntend vers l’infini ? Démonstration.

• Démontrons que (u_n) n’est pas majorée. On procède par l’absurde.

Supposons que la suite(u_n) est majorée.

Dans ce cas, la suite(un) est :

× croissante,

× majorée.

On en déduit que la suite(un)converge vers`.

× D’une part, d’après la question 3.:∀n∈N,un>1.

Ainsi, par passage à la limite :`>1.

× D’autre part, par définition de(un):∀n∈N,un+1 =f(un).

Or la fonctionf est continue surR, donc au point`. Ainsi, par passage à la limite dans l’égalité précédente :

` = f(`) Or :

`=f(`) ⇔ `=`³e^`

⇔ 1

`² =e^` (car, comme `>1, en particulier : `6= 0)

D’après la question 2., cette équation admet le réel α comme unique solution sur ]0,+∞[. On en déduit :`=α.

× Or, toujours d’après la question 2.:α <1.

Absurde !

On en déduit que la suite (u_n) n’est pas majorée.

• Finalement, la suite(u_n)est :

× croissante,

× non majorée.

On en déduit que la suite (u_n) diverge vers+∞.

• On cherche dans cette question à déterminer la limite d’une suite (u_n) dont on vient de dé- montrer qu’elle est croissante (en particulier,monotone). Il faut alors immédiatement songer à l’utilisation d’un théorème de convergence monotone. Ce dernier nous fournit la disjonction de cas suivante (dans le cas d’une suite croissante) :

× soit la suite (u_n) est majorée.

Dans ce cas, elle est convergente (et on peut trouver une majoration / minoration / encadrement de sa limite grâce à une majoration / minoration / encadrement de la quantitéu_n)

× soit la suite (u_n) n’est pas majorée.

Dans ce cas, elle diverge vers+∞.

On rappelle que la démonstration de cette propriété s’effectue presque toujours par l’absurde.

• Dans cette question, on ne demande rien d’autre que d’établir cette disjonction de cas.

Commentaire

(5)

Partie III : Étude d’une série

6. Montrer que la série P

n>1

1

f(n) converge. On noteS =

+∞

P

n=1

1 f(n). Démonstration.

Remarquons :

× ∀n∈N^∗, 1

f(n) >0 et 1

n² >0. En effet, pour tout n∈N^∗ : n³>0 et eⁿ>0 donc n³eⁿ>0

d’où 1

f(n) = 1 n³eⁿ >0

× De plus : 1

f(n) = o

n→+∞

1 n²

. En effet :

1 f(n)

1 n²

=

1 n³eⁿ

1 n²

= n²

n³eⁿ = 1

neⁿ −→

n→+∞ 0

× la série P

n>1

1

n² est une série de Riemann d’exposant2>1. Elle est donc convergente.

Par critère de négligeabilité des séries à termes positifs, la série P

n>1

1

f(n) est convergente.

Il est important de bien lire la question. On demande ici dedémontrer la convergence d’une série. Il n’est donc pas demandé explicitement de calculer sa somme. Dans ce cas, il faut privilégier l’utilisation d’un critère de comparaison / équivalence / négligeabilité des séries à termes positifs. Au passage, si ce cacul n’est pas demandé c’est certainement parce qu’il est très technique ou impossible à réaliser dans le cadre du programme ECE.

Commentaire

7. Montrer : ∀n∈N^∗,

S−

n

P

k=1

1 f(k)

6 1 (e−1)eⁿ. Démonstration.

Soit n∈N^∗.

• Tout d’abord : S−

n

P

k=1

1 f(k) =

+∞

P

k=1

1 f(k) −

n

P

k=1

1 f(k) =

+∞

P

k=n+1

1 f(k) =

+∞

P

k=n+1

1 k³e^k

• SoitN >n+ 1. Soitk∈Jn+ 1, NK. k>n+ 1>1

donc k³ >1 (par croissance de la fonction x7→x³ sur R)

d’où k³e^k>e^k (car e^k>0)

ainsi 1

k³e^k 6 1 e^k =

1 e

k

(par décroissance de la fonction inverse sur ]0,+∞[)

(6)

En sommant les encadrements précédents pourk variant entren+ 1etN, on obtient :

N

P

k=n+1

1 k³e^k 6

N

P

k=n+1

1 e

k

(?)

• Or la série P

k>n+1

1 e

k

est une série géométrique de raison 1

e ∈ ]−1,1[.

Elle est donc convergente et :

+∞

P

k=n+1

1 e

k

=

+∞

P

k=0

1 e

k+n+1

(par décalage d’indice)

= 1

e

n+1 +∞

P

k=0

1 e

k

= 1

eⁿ⁺¹ × 1 1−¹_e

= 1

eⁿ⁺¹ × 1

e−1 e

= 1

eⁿ⁺¹ × e

e−1 = 1

eⁿ (e−1)

• On en déduit, par passage à la limite dans l’inégalité (?) (ce qui est autorisé car les sommes partielles en présence convergent) :

+∞

P

k=n+1

1

k³e^k 6 1 eⁿ (e−1)

• Or, pour toutk>1 : 1

k³e^k >0. D’où :

S− Pⁿ

k=1

1 f(k)

=

+∞

P

k=n+1

1 k³e^k

=

+∞

P

k=n+1

1 k³e^k

On en déduit : ∀n∈N^∗,

S−

n

P

k=1

1 f(k)

6 1 (e−1)eⁿ

8. En déduire une fonction en Scilabqui calcule une valeur approchée de S à 10⁻⁴ près.

Démonstration.

• On cherche ici à trouver un entierntel que

n

P

k=1

1

f(k) est une valeur approchée deS à 10⁻⁴ près.

Autrement dit, on souhaite exhibern∈N^∗ tel que :

S− Pⁿ

k=1

1 f(k)

6 10⁻⁴

(7)

• Or, d’après la question précédente, pour toutn∈N^∗ :

S− Pⁿ

k=1

1 f(k)

6 1 eⁿ (e−1) Il suffit alors de trouvern∈N^∗ tel que : 1

eⁿ (e−1) 610⁻⁴. En effet, par transitivité, on aura alors :

S− Pⁿ

k=1

1 f(k)

6 1

eⁿ (e−1) 6 10⁻⁴

• On commence alors par coder la fonctionf.

1 function y = f(x)

2 y = 1 / (x^∧^∧^∧3 ? exp(x))

3 endfunction

• On propose ensuite la fonction suivante :

1 function S = approx()

2 n = 0

3 S = 0

4 while 1 / ((%e - 1) ? exp(n)) > 10^∧^∧^∧(-4)

5 n = n + 1

6 S = S + 1 / f(n)

7 end

8 endfunction Détaillons les éléments de ce script.

× Début de la fonction

On commence par préciser la structure de la fonction : - cette fonction se nommeapprox,

- elle ne prend pas de paramètre en entrée, - elle admet pour variable de sortie la variableS.

1 function S = approx() La variable n est initialisée à0.

La variable S, qui contiendra les valeurs successives de

n

P

k=1

1

f(k), est initialisée à 0 (choix naturel d’initialisation lorsqu’on souhaite coder une somme puisque 0 est l’élément neutre de l’opérateur de sommation).

2 n = 0

3 S = 0

× Structure itérative

Les lignes 4à 8consistent à :

1) déterminer un entiern tel que : 1

eⁿ (e−1) 610⁻⁴,

2) calculer les valeurs successives de Pn k=1

1 f(k).

(8)

On doit donc :

1) incrémenter la variable n de 1 jusqu’à ce que : 1

eⁿ (e−1) 6 10⁻⁴. Autrement dit, on doit incrémenter la variablen de1 tant que : 1

eⁿ (e−1) >10⁻⁴. Pour cela, on met en place une structure while:

4 while 1 / ((%e - 1) ? exp(n)) > 10^∧^∧^∧(-4) Puis on met à jour la variablen :

5 n = n + 1

2) calculer les valeurs successives de la somme

n

P

k=1

1 f(k) :

6 S = S + 1 / f(n)

× Fin du programme

À l’issue de cette boucle, la variable S contient la somme

n

P

k=0

1

f(k) vérifiant :

S− Pⁿ

k=1

1 f(k)

6 10⁻⁴

Autrement dit,S contient une valeur approchée deS à10⁻⁴ près, ce qui était souhaité.

• Afin de permettre une bonne compréhension des mécanismes en jeu, on a détaillé la réponse à cette question. Cependant, proposer un programmeScilabcorrect démontre la bonne com- préhension de ces mécanismes et permet certainement d’obtenir la majorité des points alloués à cette question.

• Le programme précédent propose de déterminer la valeur de n et de

n

P

k=1

1

f(k) en procédant par itération. On peut aussi remarquer :

1

(e−1)eⁿ 6 10⁻⁴ ⇔ eⁿ > 10⁴ (e−1)

⇔ n > 4 ln(10)−ln(e−1) (par stricte croissance de lnsur ]0,+∞[) Ainsi,

n

P

k=1

1

f(k) est une approximation deS pour tout n>N, où N =d4 ln(10)−ln(e−1)e.

On en déduit la fonctionScilabsuivante :

1 function ^S = approx()

2 N = ceil(4 ? log(10) - log(%e - 1))

3 S = 0

4 for k = 1:N

5 S = S + 1 / f(k)

6 end

7 endfunction Commentaire

(9)

Partie IV : Étude d’une fonction de deux variables

On considère l’ouvertU = ]0,+∞[×Rde R² et l’application de classeC² suivante : g:U →R,(x, y)7→g(x, y) = 1

x+e^x−y²e^y 9. Représenter graphiquement l’ensemble U.

Démonstration.

x y

U

x y

10. Calculer, pour tout (x, y) de U, les dérivées partielles premières de gen (x, y).

Démonstration.

• D’après l’énoncé, la fonction g est de classe C² sur U. Elle admet donc des dérivées partielles premières (et secondes).

• Soit(x, y)∈U.

∂₁(g)(x, y) = −1 x² +e^x

∂₂(g)(x, y) = − (2y)e^y+y²e^y

= −(2 +y)ye^y

∀(x, y)∈U, ∂1(g)(x, y) =− 1

x² +e^x et ∂2(g)(x, y) =−(2 +y)ye^y

L’énoncé admet que la fonction g est de classe C² surU. Il n’est donc pas question de le démontrer. Cepdendant, si l’énoncé le demandait, on aurait procéder de la façon suivante :

• La fonction g1 : (x, y)7→ 1

x est de classe C² surU car elle est l’inverse h1 : (x, y)7→x qui :

× est de classe C² surU en tant que fonction polynomiale,

× ne s’annule pas sur U.

• La fonctiong₂: (x, y)7→e^x est de classeC² surU car elle est la composéeg₂= Ψ₂◦h₂ de :

× h2 : (x, y)7→xqui :

- est de classeC² surU en tant que fonction polynomiale, - vérifie :h2(U)⊂R.

× ψ₂:u7→e^u qui est de classeC² surR.

• De même, la fonction(x, y)7→e^y est de classeC² sur U.

• Finalement, la fonction g est de classe C² sur U en tant que somme et produit de fonctions de classeC² surU.

Commentaire

(10)

11. Montrer quegadmet deux points critiques et deux seulement, et que ceux-ci sont (α,0)et(α,−2), où α est le réel défini à la question2.

Démonstration.

Soit (x, y)∈U.

(x, y)est un point critique de g ⇔ ∇(g)(x, y) = 0_M_2,1₍_R₎

⇔

( ∂₁(g)(x, y) = 0

∂₂(g)(x, y) = 0 Ainsi, d’après la question précédente :

(x, y) est un point critique de g ⇔







−1

x² +e^x = 0

−(2 +y)ye^y = 0

⇔







e^x = 1 x² (2 +y)y = 0

(car e^y 6= 0)

⇔







e^x = 1 x² y = −2

OU







e^x = 1 x² y = 0

⇔







x = α y = −2

OU







x = α y = 0

(car, d’après 2., l’équation e^x= 1 x² admet une unique solution, α, sur ]0,+∞[)

On en déduit queg admet exactement deux points critiques : (α,−2)et(α,0).

• La difficulté de la recherche de points critiques réside dans le fait qu’il n’existe pas de méthode générale pour résoudre l’équation∇(g)(x, y) = 0_M_2,1_(R).

On est donc confronté à une question bien plus complexe qu’une résolution de système d’équa- tions linéaires (que l’on résout aisément à l’aide de la méthode du pivot de Gauss).

• Lors de la recherche de points critiques, on doit faire appel à des méthodes ad hoc. Ici, on obtient deux équations du type :

ψ(x) = 0 et ϕ(y) = 0

Ces deux équations ne dépendent que d’une seule variable, on peut donc utiliser toutes les techniques usuelles de résolution d’équation.

Commentaire

(11)

12. Est-ce que g admet un extremum local en(α,0)? Démonstration.

• La fonction g est de classe C² sur U d’après l’énoncé. Elle admet donc des dérivées partielles secondes.

• Soit(x, y)∈U. Tout d’abord :

∂_1,1² (g)(x, y) = 2 x³ +e^x Ensuite :

∂_1,2² (g)(x, y) = ∂_2,1² (f)(x, y) = 0

La première égalité est obtenue en vertu du théorème de Schwarz puisque la fonction f est de classeC² sur l’ouvertU.

Enfin :

∂_2,2² (g)(x, y) = −

1×y+ (2 +y)×1

×e^y+ (2 +y)y×e^y

= − (2 + 2y)e^y+ (2 +y)ye^y

= − (2 + 2y) + (2 +y)y e^y

∀(x, y)∈U,∂²_1,1(g)(x, y) = 2 x³ +e^x

∂_1,2² (g)(x, y) =∂_2,1² (g)(x, y) = 0

∂_2,2² (g)(x, y) =−(2 + 4y+y²)e^y

× Il faut penser à utiliser le théorème de Schwarz dès que la fonction à deux variables considérée est de classe C² sur un ouvertU ⊂R².

× Ici, le calcul de∂_1,2² (g)(x, y)et∂_2,1² (g)(x, y)est aisé. Il faut alors concevoir le résultat du théorème de Schwarz comme une mesure de vérification : en dérivant par rapport à la 1^ère variable puis par rapport à la 2^ème, on doit obtenir le même résultat que dans l’ordre inverse.

Commentaire

• On rappelle que la matrice hessienne deg en un point (x, y) de R² est :

∇²(g)(x, y) =





∂_1,1² (g)(x, y) ∂_1,2² (g)(x, y)

∂_2,1² (g)(x, y) ∂_2,2² (g)(x, y)



 =



 2

x³+e^x 0

0 −(2 + 4y+y²)e^y





On en déduit :

H0 = ∇²(g)(α,0) =



 2

α³+e^α 0

0 −2





H0 =



 2

α³+e^α 0

0 −2





• La matriceH0 est diagonale. Ses valeurs propres sont donc ses coefficients diagonaux.

Ainsi :Sp(H₀) ={ 2 α³,−2}.

Enfin, commeα >0 :

2

α³ +e^α >0 et −2<0

La fonctiong n’admet donc pas d’extremum local en (α,0)(c’est un point selle).

(12)

13. Est-ce que g admet un extremum local en(α,−2)? Démonstration.

• D’après les calculs effectués à la question précédente : H−2 = ∇²(g)(α,−2) =



 2

α³+e^α 0

0 −(2 + 4×(−2) + (−2)²)e⁻²





H0 =



 2

α³+e^α 0 0 2e⁻²





• La matriceH−2 est diagonale. Ses valeurs propres sont donc ses coefficients diagonaux.

Ainsi :Sp(H0) ={ 2

α³,2e⁻²}.

Enfin, commeα >0 :

2

α³ +e^α>0 et 2e⁻² >0

La fonction gadmet donc un minimum local en(α,−2).

14. Est-ce que g admet un extremum global surU? Démonstration.

• D’après les questions précédentes, la fonctiongn’admet pas de maximum local surU. Elle n’admet donc pas de maximum global surU.

• La fonctiong n’admet pas de minimum global sur U. En effet : lim

y→+∞g(1, y) =−∞.

On en déduit que la fonctiong n’admet pas d’extremum global sur U.

• On pouvait également démontrer que la fonction g n’admet pas de maximum global surU avec l’argument suivant : lim

x→+∞g(x,0) = +∞.

• Pour démontrer que le point (α,−2) n’est pas un minimum global de g, il est aussi très fréquent de chercher un point(x0, y0)∈U tel que :

g(x₀, y₀) < g(α,−2) Pour cela :

1) on commence par calculer g(α,−2),

2) puis on cherche un point (x₀, y₀) (simple) tel que :g(x₀, y₀)< g(α,−2).

Comme le réel α n’a pas de valeur explicite ici, on a privilégié la méthode présentée plus haut.

Commentaire

(13)

Exercice 2 (HEC 2008)

Étant donné un entiernsupérieur ou égal à2, on considère un nuage denpoints du plan, c’est-à-dire un n-uplet (x₁, y₁),(x₂, y₂), . . . ,(x_n, y_n)

d’éléments de R². On suppose que les réels x₁, x₂, . . .,x_n (resp.y₁,y₂,. . .,y_n) ne sont pas tous égaux.

On appelle moyenne arithmétiquex et écart-typeσx du n-upletx= (x1, . . . , xn), les réels suivants : x = 1

n

P

k=1

x_k et σ_x = s1

n

P

k=1

(x_k−x)²

On définit de même la moyenne arithmétiquey et l’écart-type σy dun-uplety= (y1, . . . , yn).

La covariance cov(x, y)et le coefficient de corrélation linéairer(x, y)du couple(x, y)sont donnés par : cov(x, y) = 1

n

P

k=1

(x_k−x) (y_k−y) et r(x, y) = cov(x, y) σx×σy

Soit f la fonction définie surR² à valeurs réelles qui, à tout couple(a, b) de R², associe le réelf(a, b) tel que :

f(a, b) = Pn k=1

(a x_k+b−y_k)² 1. Justifier quef est de classeC² surR².

Démonstration.

• Soit(a, b)∈R². f(a, b)

=

n

P

k=1

(a x_k+b−y_k)²

=

n

P

k=1

a²(x_k)²+b²+ (y_k)²+ 2a b x_k−2a x_ky_k−2b y_k

= _n

P

k=1

(x_k)²

a²+n b²+ 2 _n

P

k=1

x_k

a b−2 _n

P

k=1

x_ky_k

a−2 _n

P

k=1

y_k

b+

n

P

k=1

(y_k)²

• La fonctionf est donc polynomiale.

On en déduit que la fonction f est de classeC² surR².

(14)

2. a) Écrire le système d’équations(S) permettant de déterminer les points critiques def. Démonstration.

• Comme f est de classe C² sur R², elle admet des dérivées partielles d’ordre 1 (et 2) sur R². Déterminons les.

• Soit(a, b)∈R².

× Tout d’abord :

∂1(f)(a, b) =

n

P

k=1

2xk(a xk+b−yk)

= 2

a

n

P

k=1

(x_k)²+b

n

P

k=1

x_k−

n

P

k=1

x_ky_k

= 2

a Pn k=1

(x_k)²+b×(nx)¯ − Pⁿ

k=1

x_ky_k

(par définition de x)¯

Exprimons maintenant Pn k=1

(x_k)² et Pn k=1

x_ky_k en fonction de x,¯ y,¯ σ_x et cov(x, y) pour simplifier l’expression de ∂1(f)(a, b).

- Comme σ_x = s1

n

P

k=1

(x_k−x)¯ ², on obtient :

σ_x² = 1 n

n

P

k=1

(x_k−x)¯ ²

= 1 n

n

P

k=1

(x_k)²−2 ¯x x_k+ ¯x²

= 1 n

_n P

k=1

(xk)²−2 ¯x

n

P

k=1

xk+nx¯²

= 1 n

Pn k=1

(x_k)²−2 ¯x× 1

n Pn k=1

x_k

+ ¯x²

= 1 n

n

P

k=1

(x_k)²−2 ¯x²+ ¯x²

= 1 n

n

P

k=1

(x_k)²−x¯²

Ainsi : 1 n

n

P

k=1

(x_k)² =σ²_x+ ¯x². D’où :

n

P

k=1

(x_k)² =n σ_x²+ ¯x² .

(15)

- De plus :

cov(x, y) = 1 n

n

P

k=1

(xk−x) (y¯ k−y)¯

= 1 n

n

P

k=1

(xkyk−y x¯ k−x y¯ k+ ¯xy)¯

= 1 n

_n P

k=1

x_ky_k−y¯

n

P

k=1

x_k−x¯

n

P

k=1

y_k+nx¯y¯

= 1 n

n

P

k=1

x_ky_k−y¯ 1

n

P

k=1

x_k

−x¯ 1

n

P

k=1

y_k

+ ¯xy¯

= 1 n

n

P

k=1

x_ky_k−y¯x¯−x¯y¯+ ¯xy¯

= 1 n

n

P

k=1

x_ky_k−x¯y¯

Ainsi : 1 n

n

P

k=1

x_ky_k =cov(x, y) + ¯xy.¯ D’où :

n

P

k=1

x_ky_k =n cov(x, y) + ¯xy¯ . On en déduit :

∂1(f)(a, b) = 2

a

n

P

k=1

(x_k)²+nx b¯ −

n

P

k=1

x_ky_k

= 2

n σ_x²+ ¯x²

a+nx b−,¯ cov(x, y) + ¯xy¯

∀(a, b)∈R²,∂1(f)(a, b) = 2n

σ_x²+ ¯x²

a+ ¯x b−cov(x, y)−x¯y¯

× Soit (a, b)∈R².

∂₂(f)(a, b) =

n

P

k=1

2×1×(a x_k+b−y_k)

= 2

a

n

P

k=1

xk+n b−

n

P

k=1

yk

= 2 a×(nx) +¯ n b−ny¯ (par définition dex¯ et y)¯

= 2n(ax¯+b−y)¯

∀(a, b)∈R²,∂₂(f)(a, b) = 2n (ax¯+b−y)¯

(16)

• Soit(a, b)∈R².

(a, b) est un point critique def ⇔ ∇(f)(a, b) = 0_M_2,1₍_R₎

⇔

( ∂₁(f)(a, b) = 0

∂₂(f)(a, b) = 0 Ainsi, d’après la question précédente :

(a, b) est un point critique de f ⇔





 2n

σ_x²+ ¯x²

a+ ¯x b−cov(x, y)−x¯y¯

= 0 2n(ax¯+b−y) = 0¯

⇔







σ²_x+ ¯x²

a+ ¯x b−cov(x, y)−x¯y¯ = 0 ax¯+b−y¯ = 0

Le système(S) souhaité est le système :







σ_x²+ ¯x²

a+ ¯x b−cov(x, y)−x¯y¯ = 0 ax¯+b−y¯ = 0

.

b) Résoudre le système (S). En déduire que f admet un unique point critique (ˆa,ˆb) que l’on exprimera en fonction dex,y,σ_x² et cov(x, y).

Démonstration.

Soit(a, b)∈R².

(a, b) est un point critique de f ⇔

( σ²_x+ ¯x²

a+ ¯x b−cov(x, y)−x¯y¯ = 0 ax¯+b−y¯ = 0

⇔

( σ²_x+ ¯x²

a+ ¯x b = cov(x, y) + ¯xy¯ b = ¯y−ax¯

⇔

( σ²_x+ ¯x²

a+ ¯x(¯y−ax) =¯ cov(x, y) + ¯xy¯ b = ¯y−ax¯

⇔

( σ²_x+ ¯x²−x¯²

a+ ¯xy¯ = cov(x, y) + ¯xy¯ b = ¯y−ax¯

⇔







a = cov(x, y) σ²_x b = ¯y−ax¯

⇔











a = cov(x, y) σ²_x b = ¯y−cov(x, y)

σ²_x x¯

cov(x, y) cov(x, y)

(17)

• La difficulté de la recherche de points critiques réside dans le fait qu’il n’existe pas de méthode générale pour résoudre l’équation ∇(f)(a, b) = 0_M_2,1₍_R₎.

On est donc confronté à une question bien plus complexe qu’une résolution de système d’équations linéaires (que l’on résout aisément à l’aide de la méthode du pivot de Gauss).

• Lors de la recherche de points critiques, on doit faire appel à des méthodes ad hoc. Ici, on fait apparaître une équation du type :

b=ψ(a)

En injectant cette égalité dans la seconde équation, on obtient une nouvelle équation qui ne dépend plus que d’une variable et qu’il est donc plus simple de résoudre.

C’est la stratégie qu’on a adoptée ci-dessus.

Commentaire

c) Montrer que ce point critique correspond à un minimum local def. Démonstration.

• La fonctionf est de classe C² surR². Elle admet donc des dérivées partielles secondes surR².

• Soit(x, y)∈R².

× Tout d’abord :

∂_1,1² (f)(a, b) = 2n (σ_x²+ ¯x²)

× Ensuite :

∂_1,2² (f)(a, b) = ∂_2,1² (f)(a, b) = 2nx¯

La première égalité est obtenue en vertu du théorème de Schwarz puisque la fonction f est de classe C² sur l’ouvertR².

× Enfin :

∂_2,2² (f)(a, b) = 2n

∀(a, b)∈R², ∂_1,1² (f)(a, b) = 2n(σ²_x+ ¯x²)

∂_1,2² (f)(a, b) = ∂_2,1² (f)(a, b) = 2nx¯

∂_2,2² (f)(a, b) = 2n

• Il faut penser à utiliser le théorème de Schwarz dès que la fonction à deux variables considérée est de classe C² sur un ouvertU ⊂R².

• Ici, le calcul de ∂_1,2² (f)(a, b)et∂_2,1² (f)(a, b)est aisé. Il faut alors concevoir le résultat du théorème de Schwarz comme une mesure de vérification : en dérivant par rapport à la 1^ère variable puis par rapport à la 2^ème, on doit obtenir le même résultat que dans l’ordre inverse.

Commentaire

(18)

• Soit(a, b)∈R². On rappelle que la matrice hessienne def en (a, b) est :

∇²(f)(a, b) =





∂_1,1² (f)(a, b) ∂_1,2² (f)(a, b)

∂_2,1² (f)(a, b) ∂_2,2² (f)(a, b)



 =





2n(σ_x²+ ¯x²) 2nx¯ 2nx¯ 2n





On en déduit : H = ∇²(f)(ˆa,ˆb) =





2n(σ_x²+ ¯x²) 2nx¯ 2nx¯ 2n



.

• Soitλ∈R.

det(H−λ I₂) = det





2n(σ_x²+ ¯x²)−λ 2nx¯ 2nx¯ 2n−λ





!

= 2n(σ_x²+ ¯x²)−λ) (2n−λ)−(2nx)¯ ²

= λ²− 2n(σ²_x+ ¯x²) + 2n

λ+ 4n²(σ_x²+ ¯x²)−4n²x¯²

= λ²−2n(σ_x²+ ¯x²+ 1)λ+ 4n²σ_x² On en déduit :

λest valeur propre deH ⇔ H−λ I₂ non inversible

⇔ det(H−λ I₂) = 0

⇔ λ²−2n(σ_x²+ ¯x²+ 1)λ+ 4n²σ²_x= 0

⇔ λest racine deQ oùQ est le polynôme de degré2 défini par :

Q(X) = X²−2n(σ²_x+ ¯x²+ 1)X+ 4n²σ_x²

À ce stade de l’étude de la nature d’un point critique, le calcul dedet(H−λ I₂) nous fournit toujours un polynôme de degré 2 enλ. Notons le Q. Deux cas se présentent alors :

× l’expression deQest « simple » (c’est par exemple le cas lorsque les coefficients deQsont numériques). Dans ce cas :

1) on détermine explicitement les racines de Qpar factorisation ou calcul de discriminant.

2) les racines de Qsont les valeurs propres deH d’après les équivalences ci-dessus.

3) on en déduit le signe des valeurs propres deHet ainsi la nature du point critique étudié.

× l’expression de Q est « compliquée » (c’est par exemple le cas lorsque l’expression de Q dépend de plusieurs paramètres, comme ici). Dans ce cas, on ne cherchera pas à déterminer les racines de Qexplicitement. On procèdera de la manière suivante :

1) on justifie l’existence de valeurs propres λ1 etλ2 deH (la matriceH est symétrique).

2) les valeurs propres de H sont racines de Q d’après les équivalences ci-dessus. On en déduit la factorisation deQ suivante :Q(X) = (X−λ₁) (X−λ₂)

3) on identifie les coefficients des deux expressions de Qpour en déduire des relations sur λ₁ etλ₂ (elles sont appelées relations coefficients / racines).

4) on détermine le signe de λ₁ et λ₂ (valeurs propres de H) grâce à ces relations, et on Commentaire

(19)

• La matriceH est une matrice symétrique (réelle). Elle est donc diagonalisable. On noteλ₁ etλ₂ ses valeurs propreséventuellement égales.

• D’après les équivalences précédentes, on en déduit queλ₁ etλ₂ sont racines de Q. Ainsi : Q(X) = (X−λ1) (X−λ2)

= X²−(λ₁+λ₂)X+λ₁λ₂ D’où, par définition deQ:

X²−2n(σ_x²+ ¯x²+ 1)X+ 4n²σ_x² = X²−(λ₁+λ₂)X+λ₁λ₂

Par identification des coefficients de ces polynômes de degré2, on en déduit le système d’équations suivant :







λ₁+λ₂ = 2n(σ_x²+ ¯x²+ 1) (∗) λ1λ2 = 4n²σ²_x (∗∗)

× L’équation(∗∗) implique :λ1λ2 >0.

On en déduit que λ₁ etλ₂ ont même signe. Le point (ˆa,ˆb) est donc un extremum local de f surR².

× L’équation(∗) implique :λ₁+λ₂ >0.

Or λ1 etλ2 ont même signe. D’où :λ1>0 etλ2>0.

On en conclut que la fonctionf admet un mimimum local en (ˆa,ˆb).

d) Établir la formule suivante :f(ˆa,ˆb) =n σ_y² 1−r²(x, y) . Démonstration.

• Soit(a, b)∈R². D’après1. : f(a, b)

= _n

P

k=1

(x_k)²

a²+n b²+ 2 _n

P

k=1

x_k

a b−2 _n

P

k=1

x_ky_k

a−2 _n

P

k=1

y_k

b+

n

P

k=1

(y_k)²

= n(σ²_x+ ¯x²)a²+n b²+ 2nx a b¯ −2n cov(x, y) + ¯xy¯

a−2ny b¯ +n(σ_y²+ ¯y²) La deuxième égalité est obtenue grâce aux relations démontrées en2.a). Ainsi :

f(a, b) = n

(σ²_x+ ¯x²)a²+b²+ 2 ¯x a b−2 cov(x, y) + ¯xy¯

a−2 ¯y b+ (σ²_y+ ¯y²)

• D’après2.b) :ˆb= ¯y−x¯ˆa. On obtient alors : f(ˆa,ˆb)

= n

(σ_x²+ ¯x²) â²+ (¯y−x¯a)ˆ ²+ 2 ¯xâ(¯y−x¯â)−2 cov(x, y) + ¯xy¯ ˆ a

− 2 ¯y(¯y−x¯ˆa) +σ²_y+ ¯y²

= n σ²_xâ²+ ¯x²â² + ¯y²−2 ¯xy¯â+ ¯x²â² + 2 ¯xy¯â−2 ¯x²â²−2cov(x, y) â−2 ¯xy¯â

− 2 ¯y²+ 2 ¯xy¯aˆ+σ_y²+ ¯y²

= n σ²_xˆa²−2cov(x, y) ˆa+σ_y²

(20)

• Or, toujours d’après 2.b) :ˆa= cov(x, y)

σ²_x . Ainsi : f(ˆa,ˆb) = n σ_x² cov(x, y)2

σ⁴_x −2cov(x, y) cov(x, y) σ²_x +σ²_y

!

= n σ_y² cov(x, y)2

σ_x²σ_y² −2 cov(x, y)2

σ²_xσ²_y + 1

!

= n σ_y² 1− cov(x, y)2

σ_x²σ_y²

!

Et finalement : f(ˆa,ˆb) =n σ_y²

1− r(x, y)2 . 3. a) Montrer que l’on a :|r(x, y)|61.

Démonstration.

• Tout d’abord, par définition de f : f(ˆa,ˆb) =

n

P

k=1

(ˆa x_k+ ˆb−y_k)² > 0

• On en déduit, d’après la question précédente : n σ_y²

1− r(x, y)2

>0 donc 1− r(x, y)2

>0 (car : n σ²_y >0) d’où 1> r(x, y)2

ainsi 1>|r(x, y)| (par croissance de la fonction√

·sur [0,+∞[)

|r(x, y)|61

b) Que peut-on dire du nuage de points lorsque|r(x, y)|= 1? Démonstration.

Supposons :|r(x, y)|= 1.

• Alors : r(x, y)2

= 1. Et donc :

f(ˆa,ˆb) = n σ_y²

1− r(x, y)2

= 0

• Par définition def, on en déduit : Pn k=1

(ˆa x_k+ ˆb−y_k)² = 0

(21)

• Or une somme de carrés est nulle si et seulement si chacun des termes de la somme est nul.

On en conclut :

∀k∈J1, nK, ˆa x_k+ ˆb−y_k = 0 ou encore :

∀x∈J1, nK, y_k= ˆa x_k+ ˆb

On en déduit que tous les points (x1, y1),. . .,(xn, yn) sont situés sur la droite d’équationy= ˆa x+ ˆb.

Cet exercice met en place une régression linéaire : le problème consiste à identifier une droite y=a x+bqui ajuste bien le nuage de points (x₁, y₁),. . .,(x_n, y_n).

L’erreur que l’on commet en utilisant la droite de régression pour prédirey_k à partir de xk est : yk−(a xk+b).

Une idée naturelle pour déterminer la valeur des coefficientsaetbest donc de chercher la droite (donc le couple(a, b)) qui minimise la somme des carrés de ces erreurs :

n

P

k=1

yk−(a xk+b)2

=

n

P

k=1

(a xk+b−yk)² (on appelle d’ailleurs cette procédure « méthode des moindres carrés ») On en déduit, après calculs, que l’unique droite rendant minimale l’erreur

n

P

k=1

(a xk+ b−y_k)² est la droite d’équation :

y = ˆa x+ ˆb = cov(x, y)

σ²_x (x−x) + ¯¯ y Commentaire