1 Barycentre, partie convexe

(1)

Convexit ´e

par Emmanuel AMIOT 13 mai 2020

La notion de convexité permet de formaliser une certaine idée deplénitude, d’être bien rempli : s’il y a des points alors il y a aussi des points entre les points. C’est aussi une notion mathématique fine pour l’étude des fonctions. Tout le chapitre se place dans un espace vectorielEsurRou C.

1 Barycentre, partie convexe

1.1 Barycentre

La notion de barycentre généralise celle de milieu, ou de moyenne. Ce n’est rien d’autre qu’une moyenne pondérée, comme celle qui détermine votre classement à un concours (sans vouloir vous mettre la pression).

oooo oooo oooo oooo oooo oooo oo

DEFINITION^´ 1. Le barycentre dex, y∈Eaffect´es des coefficientsλ, µest le point

z= 1

λ+µ(λx+µy)

Plus généralement, le barycentre de la famille (x₁. . . x_n) affectés des coefficients

λ₁, . . . λ_nest Pn i=1

λ_ix_i

Pn i=1

λ_i .

Bien entendu il faut que la somme des coefficients soit non nulle. D’ailleurs, multiplier tous les coefficients par une même constante ne change pas le barycentre. On peut donc décider que leur somme vaut 1 (cf. infra la définition d’un segment) : λ

λ+µ + µ

λ+µ =1!. oooo

oooo oooo oooo oooo oooo oooo oooo o

REMARQUE 1.

— Dans certains contextes on peut voir les λ_i comme les masses des points mat´eriels situ´es en x_i, le barycentre est alors le centre de masse.

— Quand tous les coefficients sont ´egaux on parle d’isobarycentre.

— L’isobarycentre de deux points est leur milieu.

— Six, yrestent fixes etλ, µvarient alors

z= λ

λ+µx+ µ

λ+µy= λ+µ−µ

λ+µ x+ µ

λ+µy=x+κ(y−x)

et ceci décrit la droite affine passant par xety. Cela se généralise à des sous- espaces de plus grande dimension.

(2)

oooo oooo o

PROPOSITION (ASSOCIATIVIT ´E DU BARYCENTRE).

Un barycentre de barycentres est encore un barycentre. Plus pr´ecis´ement, six(resp.

y, z . . .) est un barycentre des x_i (resp. des y_i, z_i. . .) alors tout barycentre de x, y . . . est un barycentre desx_i, y_i. . ..

D ´emonstration. V´erifions-le pour deux points, pour simplifier les notations :

1

λ+µ(λx+µy) = 1 λ+µ

λP

i

λ_ix_i P

i

λ_i +µ P

j

µ_jy_j P

j

µ_j

=

P

i λλi

P

i

λix_i+P

j µµ_j P

j

µjy_j

λ+µ =

P

i λλi

P

i

λix_i+P

j µµ_j P

j

µjy_j P

i λλi

P

i

λi +P

j µµj

P

j

µj

ce qui est bien un barycentre desx_i ety_j.

Le plus souvent en pratique on a affaire `a des coefficients positifs. Ainsi

ooo

DEFINITION^´ 2. Lesegment[x, y]est l’ensemble des barycentres `a coefficients positifs dex ety. On peut donc param´etrer par[x, y] ={λx+ (1−λ)y|λ∈[0, 1]}.

EXERCICE 1.Pour quelle valeur de λa-t-onz=x, z=y, z= leur milieu ?

ooo

EXERCICE 2. Soit Xune v.a. à valeurs réelles telle que ∀i= 1 . . . n, P(X= x_i) = p_i; de quoi l’espérance deXest-elle un barycentre ?

Sous l’´ecriturez=y+λ(x−y), on voit bien qu’onpart dexet qu’on fait une fraction du chemin versy.

1.2 Partie convexe ooo

DEFINITION^´ 3. Une partie non vide A ⊂ E est convexe ssi A contient tout barycentre `a coefficients positifs de toute famille finie deA.

On a une d´efinition ´equivalente, en prenant seulement des barycentres de paires de points :

DEFINITION^´ 4. Une partie non videA⊂Eest convexe ssi∀x, y∈A,[x, y]⊂A.

D émonstration de l’ équivalence. Par associativité du barycentre et récurrence sur le nombre

d’´el´ements de la famille.

En termes d’´ecole primaire, si on a deux points on peut tracer la ligne qui les joint. Si on a trois points, on peut noircir le triangle, etc. . . En pratique on prend x, y ∈ A, on pose z=y+λ(x−y), λ∈[0, 1], et on d´emontre que z∈A.

Exemple:Les parties convexes de Rsont les intervalles. Tout sous-espace vectoriel de E est convexe. Un point isol´e est convexe. Une boule (topologie des evn) est convexe. Une droite, un plan, priv´es d’un point, ne sont plus convexes. Une paire de points distincts n’est pas convexe.

EXERCICE 3.Quand vous dites un triangle, parlez-vous d’une partie convexe ?

oooo oooo o

EXERCICE 4.Montrer qu’il existe un plus petit convexe du plan contenant une partie finie (voire une partie bornée) donnée. Dessinez une vingtaine de points au hasard sur une feuille et trouvez cetteenveloppe convexe(sa détermination informatique est un problème classique mais pas évident).

(3)

Convexe Pas convexe x

y

z z’

- m

x

y

FIGURE 1 – Partie convexe, ou pas

2 Fonctions convexes

Dorénavant nous considérons des fonctions d’un intervalleI à valeurs dans R.

oooo oo

DEFINITION^´ 5. fest convexe ⇐⇒ ∀x, y∈I ∀λ∈ [0, 1]f(λx+ (1−λ)y) 6 λf(x) + (1−λ)f(y) i.e. si l’image du barycentre ( `a coefficients positifs) de deux points est inf´erieure au barycentre des images i.e. si la courbe est sous toutes sescordes.

x ! x + µ y y

f(! x + ^µ y)

! f(x) + µ f(y)

f(x)

f(y)

FIGURE 2 – graphe d’une fonction convexe

Exemple:La fonction x 7→ |x| est convexe. La fonction x 7→ x² aussi : on le voit sur son graphe (parabole) ou par le calcul :

∀λ∈[0, 1] (λx+(1−λ)y)²=λ²x²+(1−λ)²y²+2λ(1−λ)xy6λ²x²+(1−λ)²y²+λ(1−λ)(x²+y²) =λx²+(1−λ)y²! Ne parlons pas de la fonctionx7→√

x²+1, avec un calcul encore plus rus´e (mais cf. infra).

EXERCICE5. Une fonction convexe est-elle forc´ement continue ? (essayez sur un segment)

(4)

oooo oooo oooo oooo ooo

PROPOSITION.Une fonction est convexe ssi l’image de TOUT barycentre à coefficients positifs est en dessous du barycentre des images. Numériquement, pour toute famille λ₁. . . λ_n de réels positifs tels que

Pn i=1

λ_i= 1et toute famille(x₁, . . . x_n) de points deI on doit avoir

f(

Xn i=1

λ_ix_i)6 Xn

i=1

λ_if(x_i)

D émonstration. Par associativité du barycentre et récurrence.

Une fonction dont l’oppos´ee est convexe est dite concave. . .

oooo oo

DEFINITION^´ 6. On appelle épigraphede la fonctionfl’ensemble des points situés au dessus du graphe def, i.e.{(x, y)|y>f(x)}(on peut penser à la réunion des demi-droites verticales issues des points du graphe).

PROPOSITION.fest convexe ⇐⇒ son ´epigraphe est une partie convexe du plan.

D émonstration. SoientA= (x, y), A⁰ = (x⁰, y⁰)deux points de l’épigraphe. On a doncy>f(x) et y⁰ > f(x⁰), au minimum. Donc si la fonction est convexe, le segment [A, A⁰] est au dessus de la corde [(x, f(x)),(x⁰, f(x⁰)] donc reste dans l’épigraphe. Réciproque immédiate en prenant le cas particuliery=f(x), y⁰ =f(x⁰). Cf. Fig. 2.

oooo oooo oooo ooo

TH ´EOR `EME DES PENTES.

Pour toute fonction convexe, la pente des cordes augmente de gauche `a droite (cf.

figure 3). Plus pr´ecis´ement, six < y < zalors

f(y) −f(x)

y−x 6 f(z) −f(x)

z−x 6 f(z) −f(y) z−y

D ´emonstration. Introduisons λ∈]0, 1[tel quey=λx+ (1−λ)z: on aλ= z−y

z−x. Alors f(y) =f(λx+ (1−λ)z)6λf(x) + (1−λ)f(z) = z−y

z−xf(x) + y−x z−xf(z) d’o `u (et c’est ´equivalent)

f(y) −f(x)6 y−x

z−x f(z) −f(x) et de même pour l’autre inégalité.

La réciproque est vraie, on peut même affaiblir son énoncé : si l’une de ces inégalités est toujours vraie, alors la fonction est convexe. C’est en fait assez évident sur le dessin 3, même si ce n’est pas un style de démonstration recommandé. . . Mieux vaut remonter le

calcul.

En faisant décroˆıtreyversx, la pente décroˆıt aussi d’après le théorème, et on obtient donc

`a la limite (quand elle existe)f⁰(x)6 f(z) −f(x)

z−x . On en déduit, puisque la tangente au point (x, f(x))a une pente inférieure à la droite passant par le même point et par(z, f(z)), que le segment[(x, f(x)),(z, f(z))] est au dessus de la courbe et donc

(5)

x y

z

FIGURE3 – Le th´eor`eme des pentes

oooo oo

COROLLAIRE1. Sif, convexe, est d´erivable en un point, alors la tangente en ce point est sous la courbe : le graphe d’une fonction convexe est au dessus de toutes ses tangentes.

De même l’augmentation des taux d’accroissement entraˆıne la croissance de la dérivée, car le raisonnement ci-dessus peut aussi se faire en faisant tendrey verszce qui donne f(z) −f(x)

z−x 6f⁰(z). Doncf⁰(x)6f⁰(z). On a mˆeme une ´equivalence :

x = y z

z’

FIGURE 4 – La dérivée d’une fonction convexe croˆıt TH ´EOR ÈME2.Une fonction fdérivable est convexe ⇐⇒ f⁰ est croissante.

D émonstration. La réciproque se montre par contraposition : supposons quefne soit pas convexe, d’après la réciproque du théorème des cordes il existe x < y = λx+ (1−λ)z < z tels que f(y) −f(x)

y−x > f(z) −f(y) z−y .

Or d’après le théorème des accroissements finis, il existe un pointc∈]x, y[(resp.d∈]y, z[)

(6)

tel quef⁰(c) = f(y) −f(x)

y−x (resp.f⁰(d) = f(z) −f(y)

z−y ). Cf. Fig. 5.

Doncf⁰(c)> f⁰(d)etf⁰ n’est pas croissante.

x c y d z

FIGURE 5 – Sifest non convexe. . . On en déduit un critère très commode :

ooo

COROLLAIRE 2.Une fonction f deux fois dérivable est convexe ⇐⇒ sa dérivée seconde, f⁰⁰, est positive.

Ce dernier résultat est bien évidemment la caractérisation la plus commode en pratique, c’est comme cela qu’on établira la convexité/concavité d’une fonction, en général pour en déduire des inégalités.

Exemple:puisque ln⁰⁰(t) = −1/t² < 0, la fonction logarithme estconcave, i.e. c’est l’oppos´e d’une fonction convexe. Donc son graphe (et ses cordes) est au dessous de ses tangentes.

On en déduit en prenant la fonction entre 1 et1+tl’inégalité fameuse

∀t >−1 ln(1+t)6t.

Exemple:Par concavit´e on a donc 1 n

Pn i=1

lnx_i666ln

1

n Pn i=1

x_i

, et en prenant l’exponentielle on en déduit l’inégalité arithmético-géométrique :

pour toute famille de r´eelsx_i> 0 on a

(x₁. . . x_n)^1/n6 x₁+. . . x_n

n .

EXERCICE 6.Est-ce encore vrai pour desx_i >0?

ooo

EXERCICE 7.D´emontrer par un argument de convexit´e que ∀x∈R, e^x>1+x.

De mˆeme trouver une minoration de la formesinx>α x sur l’intervalle[0, π/2].

oooo oooo ooo

EXERCICE 8.(pour 5/2 ou en r´evision).

SoitS une matrice sym´etrique `a valeurs propres positives, montrer que

(DetS)^1/n6 1 nTr S.