Convexit ´e
par Emmanuel AMIOT 13 mai 2020
La notion de convexit´e permet de formaliser une certaine id´ee depl´enitude, d’ˆetre bien rempli : s’il y a des points alors il y a aussi des points entre les points. C’est aussi une notion math´ematique fine pour l’´etude des fonctions. Tout le chapitre se place dans un espace vectorielEsurRou C.
1 Barycentre, partie convexe
1.1 Barycentre
La notion de barycentre g´en´eralise celle de milieu, ou de moyenne. Ce n’est rien d’autre qu’une moyenne pond´er´ee, comme celle qui d´etermine votre classement `a un concours (sans vouloir vous mettre la pression).
oooo oooo oooo oooo oooo oooo oo
DEFINITION´ 1. Le barycentre dex, y∈Eaffect´es des coefficientsλ, µest le point
z= 1
λ+µ(λx+µy)
Plus g´en´eralement, le barycentre de la famille (x1. . . xn) affect´es des coefficients
λ1, . . . λnest Pn i=1
λixi
Pn i=1
λi .
Bien entendu il faut que la somme des coefficients soit non nulle. D’ailleurs, multiplier tous les coefficients par une mˆeme constante ne change pas le barycentre. On peut donc d´ecider que leur somme vaut 1 (cf. infra la d´efinition d’un segment) : λ
λ+µ + µ
λ+µ =1!. oooo
oooo oooo oooo oooo oooo oooo oooo o
REMARQUE 1.
— Dans certains contextes on peut voir les λi comme les masses des points mat´eriels situ´es en xi, le barycentre est alors le centre de masse.
— Quand tous les coefficients sont ´egaux on parle d’isobarycentre.
— L’isobarycentre de deux points est leur milieu.
— Six, yrestent fixes etλ, µvarient alors
z= λ
λ+µx+ µ
λ+µy= λ+µ−µ
λ+µ x+ µ
λ+µy=x+κ(y−x)
et ceci d´ecrit la droite affine passant par xety. Cela se g´en´eralise `a des sous- espaces de plus grande dimension.
oooo oooo o
PROPOSITION (ASSOCIATIVIT ´E DU BARYCENTRE).
Un barycentre de barycentres est encore un barycentre. Plus pr´ecis´ement, six(resp.
y, z . . .) est un barycentre des xi (resp. des yi, zi. . .) alors tout barycentre de x, y . . . est un barycentre desxi, yi. . ..
D ´emonstration. V´erifions-le pour deux points, pour simplifier les notations :
1
λ+µ(λx+µy) = 1 λ+µ
λP
i
λixi P
i
λi +µ P
j
µjyj P
j
µj
=
P
i λλi
P
i
λixi+P
j µµj P
j
µjyj
λ+µ =
P
i λλi
P
i
λixi+P
j µµj P
j
µjyj P
i λλi
P
i
λi +P
j µµj
P
j
µj
ce qui est bien un barycentre desxi etyj.
Le plus souvent en pratique on a affaire `a des coefficients positifs. Ainsi
ooo
DEFINITION´ 2. Lesegment[x, y]est l’ensemble des barycentres `a coefficients positifs dex ety. On peut donc param´etrer par[x, y] ={λx+ (1−λ)y|λ∈[0, 1]}.
EXERCICE 1.Pour quelle valeur de λa-t-onz=x, z=y, z= leur milieu ?
ooo
EXERCICE 2. Soit Xune v.a. `a valeurs r´eelles telle que ∀i= 1 . . . n, P(X= xi) = pi; de quoi l’esp´erance deXest-elle un barycentre ?
Sous l’´ecriturez=y+λ(x−y), on voit bien qu’onpart dexet qu’on fait une fraction du chemin versy.
1.2 Partie convexe ooo
DEFINITION´ 3. Une partie non vide A ⊂ E est convexe ssi A contient tout barycentre `a coefficients positifs de toute famille finie deA.
On a une d´efinition ´equivalente, en prenant seulement des barycentres de paires de points :
DEFINITION´ 4. Une partie non videA⊂Eest convexe ssi∀x, y∈A,[x, y]⊂A.
D ´emonstration de l’ ´equivalence. Par associativit´e du barycentre et r´ecurrence sur le nombre
d’´el´ements de la famille.
En termes d’´ecole primaire, si on a deux points on peut tracer la ligne qui les joint. Si on a trois points, on peut noircir le triangle, etc. . . En pratique on prend x, y ∈ A, on pose z=y+λ(x−y), λ∈[0, 1], et on d´emontre que z∈A.
Exemple:Les parties convexes de Rsont les intervalles. Tout sous-espace vectoriel de E est convexe. Un point isol´e est convexe. Une boule (topologie des evn) est convexe. Une droite, un plan, priv´es d’un point, ne sont plus convexes. Une paire de points distincts n’est pas convexe.
EXERCICE 3.Quand vous dites un triangle, parlez-vous d’une partie convexe ?
oooo oooo o
EXERCICE 4.Montrer qu’il existe un plus petit convexe du plan contenant une partie finie (voire une partie born´ee) donn´ee. Dessinez une vingtaine de points au hasard sur une feuille et trouvez cetteenveloppe convexe(sa d´etermination informatique est un probl`eme classique mais pas ´evident).
Convexe Pas convexe x
y
z z’
- m
x
y
FIGURE 1 – Partie convexe, ou pas
2 Fonctions convexes
Dor´enavant nous consid´erons des fonctions d’un intervalleI `a valeurs dans R.
oooo oo
DEFINITION´ 5. fest convexe ⇐⇒ ∀x, y∈I ∀λ∈ [0, 1]f(λx+ (1−λ)y) 6 λf(x) + (1−λ)f(y) i.e. si l’image du barycentre ( `a coefficients positifs) de deux points est inf´erieure au barycentre des images i.e. si la courbe est sous toutes sescordes.
x ! x + µ y y
f(! x + µ y)
! f(x) + µ f(y)
f(x)
f(y)
FIGURE 2 – graphe d’une fonction convexe
Exemple:La fonction x 7→ |x| est convexe. La fonction x 7→ x2 aussi : on le voit sur son graphe (parabole) ou par le calcul :
∀λ∈[0, 1] (λx+(1−λ)y)2=λ2x2+(1−λ)2y2+2λ(1−λ)xy6λ2x2+(1−λ)2y2+λ(1−λ)(x2+y2) =λx2+(1−λ)y2! Ne parlons pas de la fonctionx7→√
x2+1, avec un calcul encore plus rus´e (mais cf. infra).
EXERCICE5. Une fonction convexe est-elle forc´ement continue ? (essayez sur un segment)
oooo oooo oooo oooo ooo
PROPOSITION.Une fonction est convexe ssi l’image de TOUT barycentre `a coefficients positifs est en dessous du barycentre des images. Num´eriquement, pour toute famille λ1. . . λn de r´eels positifs tels que
Pn i=1
λi= 1et toute famille(x1, . . . xn) de points deI on doit avoir
f(
Xn i=1
λixi)6 Xn
i=1
λif(xi)
D ´emonstration. Par associativit´e du barycentre et r´ecurrence.
Une fonction dont l’oppos´ee est convexe est dite concave. . .
oooo oo
DEFINITION´ 6. On appelle ´epigraphede la fonctionfl’ensemble des points situ´es au des- sus du graphe def, i.e.{(x, y)|y>f(x)}(on peut penser `a la r´eunion des demi-droites verticales issues des points du graphe).
PROPOSITION.fest convexe ⇐⇒ son ´epigraphe est une partie convexe du plan.
D ´emonstration. SoientA= (x, y), A0 = (x0, y0)deux points de l’´epigraphe. On a doncy>f(x) et y0 > f(x0), au minimum. Donc si la fonction est convexe, le segment [A, A0] est au dessus de la corde [(x, f(x)),(x0, f(x0)] donc reste dans l’´epigraphe. R´eciproque imm´ediate en prenant le cas particuliery=f(x), y0 =f(x0). Cf. Fig. 2.
oooo oooo oooo ooo
TH ´EOR `EME DES PENTES.
Pour toute fonction convexe, la pente des cordes augmente de gauche `a droite (cf.
figure 3). Plus pr´ecis´ement, six < y < zalors
f(y) −f(x)
y−x 6 f(z) −f(x)
z−x 6 f(z) −f(y) z−y
D ´emonstration. Introduisons λ∈]0, 1[tel quey=λx+ (1−λ)z: on aλ= z−y
z−x. Alors f(y) =f(λx+ (1−λ)z)6λf(x) + (1−λ)f(z) = z−y
z−xf(x) + y−x z−xf(z) d’o `u (et c’est ´equivalent)
f(y) −f(x)6 y−x
z−x f(z) −f(x) et de mˆeme pour l’autre in´egalit´e.
La r´eciproque est vraie, on peut mˆeme affaiblir son ´enonc´e : si l’une de ces in´egalit´es est toujours vraie, alors la fonction est convexe. C’est en fait assez ´evident sur le dessin 3, mˆeme si ce n’est pas un style de d´emonstration recommand´e. . . Mieux vaut remonter le
calcul.
En faisant d´ecroˆıtreyversx, la pente d´ecroˆıt aussi d’apr`es le th´eor`eme, et on obtient donc
`a la limite (quand elle existe)f0(x)6 f(z) −f(x)
z−x . On en d´eduit, puisque la tangente au point (x, f(x))a une pente inf´erieure `a la droite passant par le mˆeme point et par(z, f(z)), que le segment[(x, f(x)),(z, f(z))] est au dessus de la courbe et donc
x y
z
FIGURE3 – Le th´eor`eme des pentes
oooo oo
COROLLAIRE1. Sif, convexe, est d´erivable en un point, alors la tangente en ce point est sous la courbe : le graphe d’une fonction convexe est au dessus de toutes ses tangentes.
De mˆeme l’augmentation des taux d’accroissement entraˆıne la croissance de la d´eriv´ee, car le raisonnement ci-dessus peut aussi se faire en faisant tendrey verszce qui donne f(z) −f(x)
z−x 6f0(z). Doncf0(x)6f0(z). On a mˆeme une ´equivalence :
x = y z
z’
FIGURE 4 – La d´eriv´ee d’une fonction convexe croˆıt TH ´EOR `EME2.Une fonction fd´erivable est convexe ⇐⇒ f0 est croissante.
D ´emonstration. La r´eciproque se montre par contraposition : supposons quefne soit pas convexe, d’apr`es la r´eciproque du th´eor`eme des cordes il existe x < y = λx+ (1−λ)z < z tels que f(y) −f(x)
y−x > f(z) −f(y) z−y .
Or d’apr`es le th´eor`eme des accroissements finis, il existe un pointc∈]x, y[(resp.d∈]y, z[)
tel quef0(c) = f(y) −f(x)
y−x (resp.f0(d) = f(z) −f(y)
z−y ). Cf. Fig. 5.
Doncf0(c)> f0(d)etf0 n’est pas croissante.
x c y d z
FIGURE 5 – Sifest non convexe. . . On en d´eduit un crit`ere tr`es commode :
ooo
COROLLAIRE 2.Une fonction f deux fois d´erivable est convexe ⇐⇒ sa d´eriv´ee seconde, f00, est positive.
Ce dernier r´esultat est bien ´evidemment la caract´erisation la plus commode en pratique, c’est comme cela qu’on ´etablira la convexit´e/concavit´e d’une fonction, en g´en´eral pour en d´eduire des in´egalit´es.
Exemple:puisque ln00(t) = −1/t2 < 0, la fonction logarithme estconcave, i.e. c’est l’oppos´e d’une fonction convexe. Donc son graphe (et ses cordes) est au dessous de ses tangentes.
On en d´eduit en prenant la fonction entre 1 et1+tl’in´egalit´e fameuse
∀t >−1 ln(1+t)6t.
Exemple:Par concavit´e on a donc 1 n
Pn i=1
lnxi666ln
1
n Pn i=1
xi
, et en prenant l’exponentielle on en d´eduit l’in´egalit´e arithm´etico-g´eom´etrique :
pour toute famille de r´eelsxi> 0 on a
(x1. . . xn)1/n6 x1+. . . xn
n .
EXERCICE 6.Est-ce encore vrai pour desxi >0?
ooo
EXERCICE 7.D´emontrer par un argument de convexit´e que ∀x∈R, ex>1+x.
De mˆeme trouver une minoration de la formesinx>α x sur l’intervalle[0, π/2].
oooo oooo ooo
EXERCICE 8.(pour 5/2 ou en r´evision).
SoitS une matrice sym´etrique `a valeurs propres positives, montrer que
(DetS)1/n6 1 nTr S.