Le principe de moindre action et quelques calculs
historiques
Séminaire 11 et 18 février 2014
Anne SINQUIN
2
3
LE PRINCIPE DE MOINDRE ACTION ET QUELQUES CALCULS HISTORIQUES SUR LES VARIATIONS
Le principe de moindre action prend ses racines sur un principe philosophique d’économie naturelle :
" La nature agit toujours par les voies les plus courtes et les plus simples ". Il a évolué au cours des siècles par la mathématisation de cette phrase et deviendra un instrument mathématique sans justification ni morale, ni théologique. Cependant, même s’il a été très controversé et s’il pose toujours des questions gênantes à cause de ses origines métaphysiques souvent très floues, il est aujourd’hui parfaitement inséré dans un cadre scientifique moderne, et formulé rigoureusement. Il va s’étendre à toute la nature, c’est-à-dire à toutes les branches de la physique et il revêt aujourd’hui un caractère universel. Il constitue le seul point commun de toute la physique. Il est donc unificateur. Il est devenu totalement incontournable pour les physiciens d’aujourd’hui. D’aucuns pensent même le voir un jour s’étendre au-delà de la physique, il pourrait peut-être s’appliquer aux sciences naturelles, voire aux sciences humaines et sociales. Il s’applique déjà à l’économie. Au XXème siècle, les calculs de variations sont sans cesse appliqués.
LES ORIGINES DU PRINCIPE DE MOINDRE ACTION
L’origine de ce principe remonte à la plus haute Antiquité.
Les Problèmes isopérimétriques
Les problèmes isopérimétriques sont connus depuis près de 3000 ans1. Ils posent des questions géométriques relevant de processus de minimisation ou de maximisation, c’est-à-dire les voies les plus simples et les plus courtes qui sont au cœur même du futur principe de moindre action. Les historiens des sciences en relèvent une première évocation dans la légende de Didon : Vers 814 avant J.-C., cette princesse phénicienne fuyant probablement la guerre civile de sa ville natale de Tyr après l’assassinat de son mari, atteignit les côtes de l’actuelle Tunisie et chercha à y fonder une nouvelle capitale pour son peuple : Carthage. Elle parvint à obtenir un territoire auprès du maître des lieux par un accord pacifiste très astucieux : la surface de ses terres devait "tenir dans la peau d’un bœuf". Alors, elle fit découper la peau en lamelles extrêmement fines. Mises bout à bout, celles-ci formèrent une lanière étonnamment longue de quatre kilomètres qui délimita l’emplacement de la grande Carthage. S’appuyant sur le long de la côte presque rectiligne, la très rusée Didon a intuitivement tracé un demi-cercle. Cette belle légende, certainement écrite bien plus tard qu’en 814 avant J.-C., pose le problème géométrique suivant appelé problème isopérimétrique et qui s’énonce plus précisément comme suit : quelle est la courbe fermée plane de longueur donnée qui maximise la valeur de la surface entourée ? Le problème inverse est : quelle est la courbe fermée plane qui minimise la longueur pour une valeur de surface donnée ?
1 "A History of Greek Mathematics", Vol. 2, T. Heath, Dover Publications, (1981)
4 L’école milésienne et l’école pythagoricienne
Au VIIème avant J.-C, l’école milésienne prône que le cosmos est issu d’une substance unique, summum de la simplicité. Plus tard, au VIème siècle avant J.-C, l’école pythagoricienne allie beauté et simplicité, et affirme que la nature se comporte selon ces deux critères. Seuls les résultats des processus de minimisation ou de maximisation sont retenus, les processus eux-mêmes sont oubliés. Ainsi, le cercle, la sphère et d’autres figures considérés comme parfaites doivent nécessairement décrire les lois de la nature. Dès lors, les considérations philosophiques prennent le pas sur les processus de minimisation ou de maximisation qui ne réapparaîtront qu’au Ier siècle après J.-C avec Héron, puis plus précisément au XVIIème siècle avec Fermat. Pour le moment, au VIème siècle avant notre ère, le cercle et la sphère, figures pures sont donc agencées pour construire un univers tel un organisme, ces figures régissent le mouvement des planètes observées. Dans le domaine de la musique, Pythagore observe expérimentalement que les sons sont directement reliés à la longueur des cordes qui les produisent. En les étudiant, il montre que les intervalles consonants résultent de rapports simples entre les nombres de la fameuse "tretraktys" 1, 2, 3, 4 dont la somme vaut le nombre parfait 10. Il découvre la quarte, la quinte et l’octave en divisant la longueur de la corde par ces nombres. Puis, après une étude des différentes harmonies, Pythagore invente les gammes2, dont la très connue gamme pythagoricienne qui présente une esthétique largement supérieure aux autres.
La gamme pythagoricienne ne contient que deux intervalles : le ton et le demi-ton. Pythagore constate que les rapports de fréquence entre deux différentes notes quelconques de sa gamme ne comprennent que des puissances de 2 et 3. Ainsi, l’harmonie des sons concorde avec l’harmonie des nombres3. Cette étude des sons est considérée comme le premier raisonnement rationnel moderne de physique comprenant observation, expérience et établissement d’une interprétation mathématique expliquant les résultats expérimentaux. Frappée par une telle simplicité et beauté, l’école pythagoricienne étend à tout élément du cosmos le fait d’être régi par les nombres, surtout ceux qui sont parfaits. La nature est alors merveilleusement cadencée.
C’est ainsi qu’un pan entier de philosophie, né il y a 2500 ans, va fasciner et inspirer la pensée scientifique. Sur ses fondements qui prennent une tournure purement métaphysique, il va être possible de formuler les expressions des lois physiques via les mathématiques au sens actuel avec des notions d’axiome, d’hypothèses, de preuve et de théorie.
Premières démonstrations des problèmes isopérimétriques
Aux IIème et IIIème siècles avant J.-C., Euclide, Archimède, Zénodore et Hypsiclès ont étudié les problèmes isopérimétriques dans leurs travaux géométriques. On attribue à Zénodore les premières démonstrations prouvant par exemple que parmi tous les polygones à n côtés et de même périmètre, seul celui qui est régulier maximise la surface. Il montre que le disque possède une surface maximale pour un périmètre donné et que la sphère possède un volume maximal pour une surface donnée. Les textes originaux ayant disparus, tout ceci nous a été relaté par Pappus d’Alexandrie au IVème siècle après J.-C.
2 Il s’agit bien là d’une construction théorique et rationnelle qui reproduit effectivement les sons, mais elle est arbitraire et artificielle.
3 "Le principe de moindre action et les principes variationnels en physique" J. L. Basdevant, Vuibert (2010), p.5.
5 Héron d’Alexandrie : la réflexion de la lumière
Au Ier siècle après J.-C., le géomètre et ingénieur Héron d’Alexandrie étudie dans "Catoptrica" la propagation des rayons lumineux. Héron pose que la lumière suit le chemin le plus court : un rayon suit donc une droite. Puis, vient l’étude de la réflexion sur un miroir.
Héron montre qu’à partir de l’observation de l’égalité des angles d’incidence et de réflexion , le trajet suivi par la lumière est le plus court de tous les trajets possibles pour la réflexion.
Soient le trajet réellement suivi par la lumière et, pour tout point sur le miroir différent de , soit un autre chemin possible. Construisons la droite perpendiculaire au miroir et son intersection avec .
De on déduit que et
De l’inégalité triangulaire , on déduit que, quelque soit , ( ) ( ), donc ( ) est le plus court de tous les chemins possibles de réflexion.
C’est la première démonstration mathématique et scientifique d’un principe physique de minimisation.
L’optique au Moyen-Orient aux IXème et Xème siècles
Au Moyen-Orient, Ibn Sahl (940-1000) et surtout Alhazen (965-1039) dans son traité d’optique (1015- 1021), une œuvre capitale, jettent les bases de l’optique moderne avec une méthode comprenant l’observation, les hypothèses, l’expérience, l’analyse des résultats et des conclusions. Alhazen montre que les rayons lumineux se propagent en ligne droite. Il étudie la réflexion avec des miroirs de géométries différentes, il écrit le passage des rayons lumineux à travers les lentilles. Enfin, il découvre la loi de la réfraction, mais peut-être de manière non quantitative. Après la traduction du traité d’optique en latin au XIIème ou au XIIIème siècle, l’étude de l’optique géométrique se répand en Occident.
En Europe à partir du XVIème siècle
Kepler reprend ce savoir oriental dans son livre Astronomia pars Optica publié en 1604. Suivant la même inspiration, Kepler (1571-1630) observe la réfraction et va en énoncer une loi approximative valable
6
pour les petits angles : l’angle d’incidence est proportionnel à l’angle de réfraction , ce qui ne manquera pas par ailleurs d’inspirer Descartes.
En dehors de l’optique, il a fallu attendre plusieurs siècles pour noter une avancée significative dans la description de notre Univers. Copernic (1473-1543) regarde le cosmos comme un corps divin et sphérique.
Son révolutionnaire système héliocentrique contient des hypothèses moins nombreuses et plus simples que le modèle de Ptolémée. Il est mathématique et comprend des mesures quantitatives. Pour Kepler (1571- 1630), les lois doivent être soumises à l’expérience et à l’observation. Il établit ses trois lois en construisant une théorie fondée sur des faits, contrairement à Pythagore qui invente un système arbitraire, mais plus dans la vision de Ptolémée. En allant plus loin que les savants grecs, Kepler considère ses trois lois comme remarquables parce qu’elles démontrent une relation mathématique entre phénomènes auparavant sans lien4. Etrangement, la superstition et la religion sont très présentes chez Kepler, encore plus que chez Copernic. Plus près de nous, Galilée (1564-1642) propose une compréhension mécaniste de la nature avec la conviction d’un ordre simple sans arbitraire. Il n’y a plus de religion. Notons que les Principia (1687) de Newton (1643-1727) sont aussi emprunts de ces idées de beauté et de simplicité. Dans tous ces progrès scientifiques importants, les processus de minimisation ou de maximisation ou principes d’économie semblent avoir disparu.
C’est dans le domaine de l’optique géométrique qu’on va les retrouver, mais ils n’ont pu réapparaître que parce que les connaissances en optique étaient déjà bien avancées par ailleurs.
A l’époque de Descartes (1596-1650), nous nous situons à l’aube des très passionnantes observations du ciel grâce aux toutes nouvelles lunettes. Avec un grand succès, Galilée découvre les nombreuses étoiles de la voie lactée invisibles à l’œil nu, les satellites de Jupiter, les irrégularités de la lune… Mais les instruments optiques ne sont fabriqués que de manière empirique, et il devenait incontournable et nécessaire d’en connaître le bon fonctionnement si l’on voulait en construire de manière fiable de plus performants et de meilleure qualité. Pour cela, il fallait comprendre comment la lumière se propage dans le verre.
La Dioptrique de Descartes (1637)
Descartes s’attelle à la tâche et selon sa méthode et ses convictions philosophiques, il commence par attaquer la difficile question de la nature de la lumière dans La Dioptrique publiée en 16375. La nature même de la lumière est traitée assez brièvement dans le discours premier, puis Descartes énonce ses propriétés en s’appuyant essentiellement sur des métaphores, son raisonnement étant celui de l’analogie6. Il en déduit que la lumière se transmet instantanément du soleil à notre œil, que la transmission de la lumière se fait sans déplacement de matière, que la lumière suit des chemins rectilignes.
4 " Variational principles in Dynamics and Quantum Theory " W. Yourgrau, S. Mandelstam, Third edition, London Sir Isaac Pitman & Sons Ltd. (1968), p.5.
5 discours premier. Version PDF disponible sur le site http://www.irem.univ- montp2.fr/IMG/pdf/Descartes_la_dioptrique.pdf.
6 "Histoire du principe de moindre action" de F. MARTIN-Robine, Vuibert, 2006, p. 23
7
Pour ce qui est de l’étude quantitative de la réflexion et de la réfraction, Descartes compare la lumière à une balle frappée par une raquette dans le jeu de paume. Il procède donc par une analogie mécanique 7: les lois du mouvement de la balle sont comparées au trajet de la lumière. Le mouvement de la balle n’obéit pas aux lois des corps pesants, mais à une "inclination à se mouvoir". La vitesse de la balle est décomposée selon deux directions8 horizontale et verticale.
La réflexion.
Figure 5 du discours second, De la réfraction de La Dioptrique
HF = AH car selon Descartes, l’horizontale ne rencontre pas la terre qui n’a ainsi aucune action sur ce mouvement.
AB = BF car avant et après la réflexion, les vitesses sont les mêmes par conservation des vitesses.
S’ensuit par symétrie, que l’angle d’incidence est égal à l’angle de réfraction.
La réfraction.
Une balle lancée en A pénètre en B dans de l’eau dans laquelle elle est ralentie. Le problème est de décrire sa trajectoire dans l’eau. Pour être concret, Descartes prend comme exemple le cas où la balle va deux fois moins vite dans l’eau que dans l’air. Il considère le point I de la trajectoire réfractée tel que AB=BI.
Ce point I définit complètement la trajectoire réfractée et le problème consiste à le déterminer.
7 "Histoire du principe de moindre action" de F. MARTIN-Robine, Vuibert, 2006, p.28.
8 La décomposition du trajet de la lumière en deux composantes horizontale et verticale a été effectuée pour la première fois par Alhazen. "Kepler’s near discovery of the sine law: A qualitative computational model”, Claudio Delrieux & Javier Legris, (eds.) Computer Modeling of Scientific Reasoning, Universidad Nacional Del Sur. EDIUNS, Bahia Blanca, Argentinia, 2003, pp. 93-102.
8
Figure 6 du discours second, De la réfraction de La Dioptrique.
On a où et sont les temps respectifs de parcours de la balle pour aller de en et de en ; B est le centre du cercle de rayon AB.
Descartes trace le point F de la composante horizontale du mouvement : la vitesse horizontale restant toujours inchangée pour les mêmes raisons que pour la réflexion, on a donc HF=2AH9. On trace les composantes verticales. L’intersection du cercle et de la verticale passant par F donne le point I cherché.
Enfin, puisque HF=BE et AH=CB, on a BE=2 CB.
Regardons maintenant le problème optique. La lumière est "action" ou "inclination à se mouvoir".
L’analogue de la vitesse de la balle devient la "facilité" avec laquelle la lumière se déplace et traverse un milieu. Appelons et les facilités respectives dans les milieux incidents et émergents. A l’instar de la mécanique, on écrit (cas général, on remplace le 2 par )
Avec et , on obtient bien la loi usuelle de la réfraction.
Cependant, Descartes ne manque pas de remarquer un problème important : comme la balle ralentit dans l’eau, , donc , la trajectoire réfractée de la balle s’écarte de la normale. Or, c’est exactement le contraire qui est observé puisque le rayon lumineux réfracté se rapproche de la normale lorsqu’il passe de l’air dans l’eau. Toujours par des métaphores sur les lois des chocs à cause desquels la balle subit frottements et résistances sur son trajet, Descartes trouve des arguments justifiant que la lumière
9 On est toujours dans le contexte de cette époque où la définition de la décomposition d’un mouvement est encore incertaine.
9
subit elle aussi frottements et résistances, mais qui agissent de telle sorte que la lumière va plus vite dans les milieux denses, ce qu’il obtient de manière cohérente. C’est l’idée de rigidité qui le guide, un milieu rigide laissant passer plus facilement le son par exemple. Descartes en conclut naturellement que l’eau ou le verre laissent plus facilement passer la lumière que l’air10.
Fermat (160?-1665) contestera violemment la Dioptrique. Pourtant, c’est bien lui qui en continuera le travail.
LE PRINCIPE DE FERMAT, UN PRINCIPE DE MOINDRE TEMPS
Les critiques (1637-1638) de Fermat à Descartes
Fermat va rejeter la décomposition du mouvement de Descartes. Pourquoi en proposer une seulement selon les composantes horizontale et verticale ? Et pourquoi la vitesse horizontale resterait inchangée ? Fermat propose alors d’autres décompositions générant de nombreux calculs fastidieux, analysant l’interprétation mécaniste et les calculs de Descartes dans les moindres détails.
Une deuxième contestation de Fermat concerne le fait que la lumière traverse les milieux denses plus facilement que les milieux rares, ce qui le choque11. Mais plus important encore, la lumière se propage instantanément selon Descartes, comment peut-on alors parler de "facilités" finies ? Bien que Descartes ne les interprète pas en termes de vitesses de la lumière dans les milieux, Fermat, lui, le fait sans le dire.
Enfin, Fermat refuse l’analogie. Comment peut-on comparer le mouvement d’une balle avec
"l’inclination au mouvement de la lumière" ? Fermat ne voit pas de point commun entre ces deux notions.
La réfraction selon les voies les plus simples : le principe de Fermat (dans Analyse pour les réfractions Synthèse pour les réfractions, environ vers 1660-1662)
A la demande de partisans de Descartes, Fermat reprend le débat qui l’opposait à Descartes.
Retravaillant assidûment les figures de La Dioptrique, Fermat décide d’étudier la réfraction en suivant une toute autre piste que celle de la mécanique. Il s’inspire de la loi de la réflexion dans le cadre du principe ancien de Héron d’Alexandrie, "la nature agit toujours par les voies les plus courtes", qui est ici un principe de moindre longueur. Convaincu qu’il est possible d’établir rigoureusement la loi de la réfraction à partir de ce même principe jugé fondamental, Fermat commence par poser le problème.
10 Rappelons qu’Alhazen avait prouvé que la vitesse de la lumière est plus lente dans les corps les plus denses que dans les corps les plus rares.
11 "Histoire du principe de moindre action" de F. MARTIN-Robine, Vuibert, 2006, p.42.
10
La longueur ADC est inférieure à la longueur ABC. Pourtant, c’est bien le trajet ABC plus long passant par un point B autre que D que la lumière emprunte. Pour résoudre le problème, il faut tenir compte des
"résistances" des milieux. La "résistance" est en fait l’inverse de la vitesse v de propagation de la lumière.
Pour Fermat, si les deux milieux sont uniformes, le plus simple est d’écrire que les "résistances" sont proportionnelles. Pour illustrer la situation, Fermat imagine que la résistance du milieu supérieur soit le double de celle du milieu inférieur. Alors, 2AB + BC mesure la somme des résistances le long du trajet brisé ABC. De même, 2AD +DC mesure celle du trajet rectiligne ADC. On peut vérifier qu’il existe bien un point B sur l’axe de séparation des milieux tel que 2AB + BC <2AD +DC.
Le problème devient un problème de géométrie pure car une résistance plus grande a exactement le même effet qu’une distance plus grande. Les points A et C étant donnés, où se situe le point B de réfraction de telle sorte que la quantité 2AB + BC soit minimale ? Comme la quantité 2AB + BC est en réalité la distance parcourue par la lumière divisée par sa vitesse de propagation, elle mesure aussi le temps de parcours de la lumière. La question de la réfraction devient alors celle du moindre temps mis par la lumière pour aller de A en C.
Résolution du problème.
Fermat considère un cercle (ABCI) de centre D, dont le diamètre AB sépare deux milieux de densités différentes. Le milieu le moins dense est au-dessus, le plus dense en dessous. Le rayon incident CD se réfracte en D. Le problème consiste à chercher le rayon réfracté DI, c’est-à-dire à trouver le point I.
11
Soient et les projections orthogonales respectives de et sur .
De même que pour les "facilités" de Descartes, Fermat suppose que les résistances sont proportionnelles, . Or, une longueur peut être la mesure d’une résistance et Fermat choisit la longueur DF comme mesure de la résistance dans le milieu dense. Alors il lui correspond une longueur qui est la mesure de la résistance dans le milieu moins dense.
Fermat affirme selon ses convictions profondes héritées de Héron d’Alexandrie que le trajet effectivement suivi par la lumière minimise le temps. Calculons donc ce temps :
qui est proportionnel à soit, avec les notations ,
Le problème consiste à chercher la longueur pour laquelle est minimale.
A cette époque, le calcul différentiel n’existait pas et Fermat va appliquer sa méthode de détermination des maxima et des minima qu’il avait développée dès 162912. Ce sont de véritables prémisses du calcul différentiel comme Lagrange le dira plus tard en 1806 avec grande admiration.
Fermat déplace le point D d’une petite distance et obtient le point O tel que D . Le temps le long du trajet voisin est
et s’expriment en fonction de et
Fermat "adégalise"
√ √ En élevant au carré
+2√ √
=
D’où
12 H.H. Goldstine, A history of the calculus of variations from the 17th through the 19th Century (Springer-verlag, New York, 1980), p.3. Voir aussi dans Œuvres de Fermat , Méthode pour la recherche du maximum et du minimum,
traduction française de Paul Tannery.Et aussi Variationnal Principles in Dynamics and Quantum theory, W.Yourgrau, S.
Manelstam,Third edition,1968, p.12.
12
√ √
Elevant à nouveau au carré
( )
=
En négligeant les termes en d’ordre supérieur ou égal à 2, Fermat obtient
( )
, soit ( )( ) d’où la solution , c’est-à-dire Finalement
avec et
( )
Avec étonnement, Fermat constate qu’il retrouve la loi de Descartes à ceci près que les "facilités" de Descartes sont inversement proportionnelles aux résistances. Cela résout le problème de Descartes du rayon réfracté : en passant d’un milieu moins dense à un milieu plus dense, selon Fermat, le rayon réfracté se rapproche bien de la normale.
Fermat a donc établi que la variation entre le temps de parcours d’un trajet réellement suivi par la lumière et le temps de parcours d’un trajet virtuel voisin est nulle. C’est une condition nécessaire pour que le temps soit minimal. Fermat a établi la condition suffisante dans Synthèse pour les réfractions13,
Critiques du principe de Fermat
Le temps de parcours est le même pour tout rayon réfracté issu de , étant sur le cercle, alors pourquoi, le rayon ne se dirige-t-il pas vers ce point quelconque?
Le principe de Fermat suppose que les extrémités et du trajet de la lumière soient connues, ce qui pose problème aux cartésiens. Le débat est d’autant plus acharné qu’on ne savait pas mesurer la vitesse de la lumière dans les milieux14. Nous avons vu que les lois physiques sont complètement absentes du principe de
13A history of the calculus of variations from the 17th through the 19th Century (Springer-verlag, New York, 1980), p.4.
14 La première mesure de la vitesse de la lumière a été effectuée en 1849-1850 par L. Foucault, puis par H. Fizeau qui a définitivement tranché la question : la lumière se propage moins vite dans l’eau que dans l’air.
13
Fermat et il s’agit bien de les réintégrer si l’on veut interpréter le fameux rapport de la loi de Descartes ( ), soit le facteur de Fermat. Ce sera ce que vont tenter de faire Newton et Huygens.
Les deux théories de la lumière : Newton et Huygens
Dans les Principia (1687) et dans son Traité d’optique (1721) Newton entreprend de démontrer les lois de Descartes dans une théorie corpusculaire de la lumière. Des corps pesants se meuvent dans différents fluides. Il commence par utiliser la méthode des maxima et minima, puis utilise une sorte de calcul de variations15, toutefois moins avancé que celui que Lagrange formulera plus tard. Il conclut que la lumière va plus vite dans les milieux les plus denses. Dans les mêmes années, Huygens (1629-1695) développe une théorie ondulatoire de la lumière. Dans son Traité de la lumière (écrit en 1678 et publié en 1691), il redémontre le principe de Fermat. Il conclut contre Newton, que les ondes se propagent moins vite dans les milieux denses. La démonstration de Huyghens est un peu plus complète que celle de Fermat, en ce sens qu’elle donne le rapport des indices de réfraction égal au rapport des vitesses de la lumière dans les deux milieux.
Parallèlement à ces recherches physiques, entre 1664 à 1684, Leibniz et Newton développent des techniques mathématiques nouvelles qui conduiront au calcul infinitésimal.
LA BRACHISTOCHRONE
Acta Eruditorum, Juin 1696 et Mai 1697, Jacques (1654-1705) Jean Bernoulli (1667-1748)
Alors Jean Bernoulli reprend le principe de Fermat, mais en considérant que le rayon lumineux se propage à travers un milieu constitué d’une séquence infinie de couches planes horizontales d’épaisseur très fine. Le point I de Descartes décrit maintenant un rayon lumineux qui se propage en suivant une courbe ( ).
15 Plusieurs exemples sont mentionnés dans, A history of the calculus of variations from the 17th through the 19th Century ,H.H. Goldstine (Springer-verlag, New York, 1980), p.7.
14
On a , soit en passant à la limite pour un très grand nombre de couches
( )
( ) où est une constante. Si ( ) qui est la vitesse de la lumière, augmente avec , le milieu est de densité décroissante et le rayon s’écarte de plus en plus de la normale. Pour faire l’analogie avec la mécanique, Jean Bernoulli prend ( ) √ , qui est maintenant la vitesse d’un corps en chute libre partant du repos en . Déterminer la courbe ( ), c’est trouver la courbe qui minimise le temps lorsqu’une perle soumise à la pesanteur glisse sur cette dernière sans frottement, partant d’un point et parvenant à un point d’altitudes différentes. C’est le très célèbre problème de la brachistochrone lancé en défi par Jean Bernoulli en 1696 et dont il donnera lui-même une solution en 169716.
Le temps mis par la perle pour aller de en est donné par
( ( )) ∫ ∫
( ( )) ∫ √ ( ( ))
√ √ ( )
où est l’abscisse curviligne. Avec les notations simplifiées pour ( ),
16 Jean reçut quatre réponses : de Newton, de Jacques, de Leibniz et de L’Hôpital. Elles sont toutes différentes, mais s’appuyant toutes sur la géométrie. Elles ne sont pas généralisables.
15 On a
√ √ ( )
On obtient finalement
√ √ ( ) soit ( ( ) ) , est une constante. Bernoulli conclut avec émerveillement que la courbe cherchée est une cycloïde17.
La cycloïde avait déjà été remarquée par Huygens en 1673 pour une autre propriété remarquable : la cycloïde est tautochrone, et Huygens a découvert la formule de l’isochronisme. La boule d’un pendule parfaitement isochrone doit suivre une cycloïde et il faut modifier sa longueur en conséquence.
La démonstration de la brachistochrone de Jean Bernoulli est entièrement issue du principe de Fermat, qui est un cas particulier puisque la variable n’est pas explicite. Pour tenter de généraliser le problème, la brachistochrone a été la source d’un nouveau défi entre les deux frères Jacques et Jean. Le problème de la brachistochrone a constitué une véritable introduction à ce qu’on appellera plus tard le
17 Pour une analyse de la version originale de la solution donnée par Jean Bernoulli, voir A history of the calculus of variations from the 17th through the 19th Century ,H.H. Goldstine (Springer-verlag, New York, 1980), p.38.
16
calcul des variations18.Enfin, les problèmes isopérimétriques sont à nouveau traités par Jacques. Le point important est qu’il prend conscience qu’il faut rajouter un degré de liberté19. Par des calculs géométriques longs et fastidieux, il tente ainsi de trouver une solution générale à tous les problèmes particuliers, mais c’est Euler, très certainement influencé par ces calculs, qui établira la formule fondamentale des variations.
LE PRINCIPE DE MOINDRE ACTION SELON MAUPERTUIS
"Accord de différentes lois de la nature qui avaient jusqu’ici paru incompatibles ", lu le 15 avril 1744, publié en 1748. Mémoires de l’Académie Royale des Sciences de Paris .
Avec Fermat, puis avec les frères Bernoulli, le principe de moindre temps a pris essentiellement une tournure mathématique. Les deux théories de la lumière ne s’appuient plus sur ce principe pour tenter de prouver tel ou tel résultat physique et prennent leur indépendance. L’absence cruelle de mesure de la vitesse de la lumière et le succès grandissant des théories de Newton consolident les attaques cartésiennes qui placent de plus en plus le principe de Fermat comme étant "moral", donc non physique. C’est de ce débat violent que va naître le principe de moindre action.
Pour Maupertuis (1698-1759), la lumière ne suit ni le chemin le plus court, ni celui du temps minimum, mais elle suit le chemin dépendant d’un nouveau concept plus abstrait, appelé action qui assure tout simplement l’existence du phénomène physique, c’est à dire l’action de la Nature. Selon son intuition et ses convictions profondes, l’action doit être minimale pour tout changement dans la Nature. Maupertuis s’emploie à la définir.
« En méditant profondément sur cette matière, j’ai pensé que la lumière, lorsqu’elle passe d’un milieu dans un autre, abandonnant déjà le chemin le plus court, qui est celui de la ligne droite, pouvait bien ne pas suivre celui du temps le plus prompt ; en effet, quelle préférence devait-il y avoir ici du temps sur l’espace ? La lumière ne pouvant aller à la fois par le chemin le plus court et par le temps le plus prompt, pourquoi irait-elle par un de ces chemins plutôt que par l’autre ? Aussi ne suit-elle aucun des deux ; elle prend une route qui a un avantage plus réel : le chemin qu’elle tient est celui par lequel la quantité d’action est la moindre. Il faut maintenant expliquer ce que j’entends par quantité d’action. Lorsqu’un corps est porté d’un point à un autre, il faut pour cela une certaine action : cette action dépend de la vitesse qu’a le corps et de l’espace qu’il parcourt ; mais elle n’est ni la vitesse ni l’espace pris séparément. La quantité d’action est d’autant plus grande que la vitesse du corps est plus grande, et que le chemin qu’il parcourt est plus long, elle est proportionnelle à la somme des espaces multipliés chacun par la vitesse avec laquelle le corps les parcourt. 20»
18 Pour une écriture moderne du principe de Fermat dans le cadre du principe de moindre action actuel, voir le séminaire de Guy Laville du 7 février 2012, Université de Caen, Laboratoire LMNO, p.11.
19 A history of the calculus of variations from the 17th through the 19th Century ,H.H. Goldstine (Springer-verlag, New York, 1980), p.51.
20 "Mémoires de l’Académie des Sciences", 1744, p.573.
17
Ainsi, Maupertuis comprend qu’il faut associer vitesse et longueur parcourue dans son action21. Son expression est ∑ et elle doit être minimale en vertu du principe de la moindre action à laquelle les lois de la nature sont censées obéir.
Maupertuis donne alors une autre démonstration du principe de Fermat avec son action : un rayon lumineux issu d’un point A émerge en B après avoir été réfracté sur le dioptre CD au point R qui est à déterminer ; m et n sont les vitesses respectives dans le premier, puis dans le deuxième milieu.
L’action totale le long du trajet ARB est
√ √
Elle doit être minimale lorsque le point R varie :
√
√
C et D sont fixes, alors , ce qui donne et on retrouve la loi des sinus22.
En réalité, ce n’est pas exactement la même loi des sinus que Fermat, pour la bonne raison que le principe de Fermat minimise ∑ alors que le principe de Maupertuis minimise ∑ où est la distance parcourue et la vitesse. Qu’à cela ne tienne ! L’essentiel est de trouver un invariant, et c’est chose faite.
Dans le mémoire de 1744, Maupertuis énonce le principe de moindre action uniquement pour les lois concernant la lumière. Cependant, le but recherché était d’exprimer un principe de moindre action en mécanique, pour le mouvement des corps.
Maupertuis est connu pour sa mission en Laponie où il a montré que la terre est aplatie aux pôles, confirmant ainsi magistralement la théorie de Newton. Il est donc naturellement amené à vouloir concilier les idées de Newton et la réfraction de Fermat. A celle-ci, il va essayer de rattacher les lois des chocs. Ces dernières étaient alors très prisées, car elles étaient considérées, selon les idées de Descartes, comme le
21 L’attribution du principe de moindre action à Maupertuis a été violemment contestée à partir de 1751 par S. König qui l’attribuait à Leibniz. Défendu par Euler, Maupertuis sortit gagnant, mais meurtri, de ce célèbre différend qui a pris une tournure politique. Selon les historiens, la pensée de Leibniz sur la moindre action, très différente de celle de Maupertuis, ne pouvait pas s’appliquer aux corps, car elle s’exprimait uniquement dans le domaine de la métaphysique.
De surcroît, l’original de la lettre de Leibniz sur le principe de moindre action n’a jamais été retrouvée malgré de longues recherches assidues. Enfin, Maupertuis avait énoncé dès 1740 un principe de minimum pour les corps au repos.
22 Cette démonstration de Maupertuis est donnée dans le livre de F. Martin-Robine, Histoire du principe de moindre action (Vuibert, 2006), p.60.
18
fondement même du mouvement des corps. Ainsi, un rayon lumineux est l’analogue de la trajectoire d’une particule, le passage de la lumière au niveau d’un dioptre est l’analogue d’un choc. Continuant l’analogie, une suite des chocs revient à interposer plusieurs dioptres sur le trajet d’un rayon lumineux.
Les chocs agissent sur de très courtes durées sous l’effet de forces intenses qui naissent et s’évanouissent. Maupertuis s’attelle à la tâche et étudie les chocs en les partageant entre deux cas limites, les chocs parfaitement durs et les chocs parfaitement élastiques23. Son étude est obscure et fait intervenir la loi de conservation des "forces vives" de Leibniz, pas très claire non plus. Finalement, après quelques échanges avec Euler, Maupertuis complète en 1746 sa précédente définition de l’action, car cette dernière n’était valable que pour des corps sans masse :
« La quantité d’action est le produit de la masse des corps par leur vitesse et par l’espace qu’il parcourent.
Lorsqu’un corps est transporté d’un lieu dans un autre, l’action est d’autant plus grande que la masse est plus grosse, que la vitesse est plus rapide, que l’espace par lequel il est transporté est plus long 24»
∑
C’est assurément de la volonté de concilier optique et mécanique qu’est née cette quantité qui est censée pouvoir expliquer les résultats expérimentaux.
On sait aujourd’hui que la quantité que minimise Maupertuis présente des défauts : les forces sont absentes, le corps se déplace en ligne droite, ce qui a comme conséquence de ne pas utiliser le calcul différentiel.
Mais, dans le domaine philosophique, ce qu’on a appelé les causes finales a déclenché une polémique d’une extrême dureté : le principe de moindre action doit se munir d’hypothèses sur les conditions finales pour être appliqué. Si d’aucuns acceptent la finalité en biologie, en philosophie, en religion, et parfois en physique, d’autres la refusent. Le principe de causalité et son caractère local sont aussi au cœur du débat. Le débat philosophique est de première importance et il n’est toujours pas clos aujourd’hui.
Toujours est-il que sur le plan scientifique, plus particulièrement en mathématiques, on continue d’avancer. C’est Euler (1707-1793) qui va appliquer mathématiquement l’expression de Maupertuis au mouvement des corps. Mais auparavant, voyons comment Euler a obtenu sa relation fondamentale qui apporte un outil très puissant et général dans le calcul de la minimisation d’une intégrale.
LE CALCUL D’EULER : CALCUL DE VARIATION D’UNE INTÉGRALE
"Methodus Inveniendi Lineas Curvas Maximi Minimive Proprietate Gaudentes ", 1744, Lausanne
Depuis la fin du XVIIème siècle, il y avait plusieurs problèmes physiques différents qui s’exprimaient mathématiquement sous forme variationnelle, c’est-à-dire par une fonction apparaissant dans une intégrale qu’il fallait rendre extrémale. Ce ne sont plus les problèmes d’extrémum qui peuvent être traités par le calcul
23 Pour plus de détails sur la loi des chocs vue par Maupertuis, voir "Histoire du principe de moindre action" de F.
MARTIN-Robine, Vuibert, 2006, p.64.
24 Edition des Œuvres, IV p. 36.
19
différentiel ordinaire de Leibniz et Newton. Chacun de ses nouveaux problèmes avait sa propre fonction caractéristique et ceux qui étaient résolus possédaient leur calcul particulier non généralisable. Euler chercha une méthode générale purement mathématique permettant de les résoudre tous. Son calcul repose entièrement sur la discrétisation de la fonction apparaissant dans l’intégrale et sur des calculs élémentaires de géométrie.
Nous donnons ici un aperçu historique du calcul d’Euler.
Soit une fonction "algébrique déterminée " selon les termes d’Euler25 qui pose ensuite que est fonction de plusieurs variables où est la variable indépendante, est une fonction de et sont les dérivées successives. Elles sont aujourd’hui notées ( ) et ̇( ) ( )
( )
( )
( )
, etc …, mais nous garderons les notations originales d’Euler. En physique, doit être interprétée comme une fonction caractéristique du problème physique posé.
Dire que 26 est fonction de c’est dire que est fonction d’une courbe ( ) { ( ) }. Le problème consiste alors à déterminer la courbe particulière (a est le point de départ de la courbe, il faut ici imaginer la prolongation vers la gauche de la courbe de la figure 2 d’Euler, voir page 20) dont les extrémités sont fixées et qui rend l’intégrale ∫ ( ( ) ̇( ) ) ∫ ( ) ∫ extrémale. La courbe solution représentera la trajectoire réelle et physique du problème étudié.
La méthode utilisée par Euler est la suivante.
Euler va introduire une courbe voisine de la courbe réelle particulière , cette courbe voisine étant construite pour tendre de manière infinitésimale vers la courbe stationnaire.
( ) ( ) ( ) ( ) ( ) ( )
Il calcule ensuite la variation de ∫ due à la différence entre ∫ calculée sur la courbe particulière et ∫ calculée sur cette courbe voisine . Par hypothèse, les extrémités sont invariantes.
Pour rendre ∫ extrémale, il faudra imposer que sa variation au sens donné ci-dessus soit nulle.
Pour ce faire, Euler discrétise la courbe comme indiqué ci-dessous et définit les variables à considérer.
25 "Methodus inveniendi … "§ 38 p. 17 dans "propositio II, theorema", voir H.H. Goldstine, A history of the calculus of variations from the 17th through the 19th Century (Springer-verlag, New York, 1980), p.68.
26 Il y a une confusion de notation entre le Z qui désigne la courbe et le Z qui désigne le point d’extrémité supérieure de la courbe.
20
L’axe des abscisses de la variable indépendante est divisé en intervalles infinitésimaux réguliers tous égaux à . Les points sont les points de la courbe qui ont pour abscisse . est le point courant d’abscisse . Son ordonnée est . Euler écrit les ordonnées contigües : . Les pentes de la courbe sont
̇
Puis :
etc.
En continuant, ( ) Soit
21
etc.
etc.
Construction de la courbe voisine , variations des ordonnées et des dérivées successives entre les deux courbes.
Euler propose de construire une courbe voisine de la courbe particulière de la manière suivante :
Toutes les ordonnées restent inchangées, excepté celle du point pour lequel est augmentée de n. Alors, en ce qui concerne les pentes, seules et subissent une modification. Notons , et les variations ou incrémentations entre ces deux courbes pour en , pour en et pour en .
22
Euler suit la même logique de notation pour les ordres supérieurs et calcule aussi les incrémentations correspondantes dont les valeurs sont indiquées dans le tableau original d’Euler reproduit ci-dessous.
variation de
On note ( ), ( ), ( ), … La variation de est égale à au point d’abscisse et à au point d’abscisse , etc., ce qui s’écrit : au point d’abscisse 27 au point d’abscisse L
27 M est aujourd’hui noté N est noté . P est noté ̇
23
au point d’abscisse M au point d’abscisse N
On prendra puisqu’on se place successivement en chaque point qui est considéré comme fixe.
En reportant les incrémentations ci-dessus, nous obtenons:
variation de ∫
La variation de ∫ ∫( ) est
Elle doit être nulle, d’où
Euler a noté , ( ) ( ) , etc. qu’il considérait comme des différentielles. Le passage à la limite donne
Au premier ordre
( ) Ceci est l’expression fondamentale qu’Euler a obtenue. Aujourd’hui, on l’écrit sous la forme
( ̇)
24
Maintenant, la généralisation est faite : on sait désormais déterminer la courbe qui rend extrémale l’intégrale de toute fonction caractéristique d’un problème donné. C’est un progrès considérable.
Il se trouve que les passages à la limite, sous-jacents à ses résultats et relevant d’une intuition phénoménale, étaient impossibles à prouver du temps d’Euler. Par la suite, ses calculs se sont révélés justes, parfaitement généraux et très puissants. Ils n’ont été démontrés qu’à la fin du XIXème siècle. Ils constituent le fondement même de ce qu’Euler a appelé après coup "calcul variationnel" lorsqu’il a lu le travail de Lagrange qui en apportait une autre interprétation.
Euler utilise ensuite son équation à beaucoup de questions résolues et non résolues, prouvant sa puissance et sa grande généralité. En particulier, parmi les nombreux exemples qu’Euler donne pour l’application de son équation fondamentale ( ), figure celui de la brachistochrone.28
Avec les notations originales, cet exemple s’écrit
∫ √
√ avec
√
√ Alors
√
√
√ ( )
D’où
√
√
√ ( )
L’équation fondamentale ( ) donne
En intégrant
√ ( )
√
d’où et en factorisant
√
ce qui nous donne l’équation de la cycloïde pour la courbe cherchée.
28 Voir annexe I.
25
Cependant Euler demeure extrêmement intrigué par un fait qu’il remarque et qu’il ne parvient pas à expliquer : annuler la différentielle donne . Quand on y remplace par – au numérateur, on retrouve l’équation fondamentale ( ). Euler utilise ce "raccourci" comme moyen mnémotechnique, mais est persuadé et écrit que son équation fondamentale doit pouvoir s’obtenir par une autre méthode, certainement plus profonde et libérée de tout aspect géométrique. Euler a par ailleurs conscience de la lourdeur de ses calculs. C’est le mathématicien Joseph Louis Lagrange (1736-1813) qui apportera une réponse en inventant le calcul des variations, véritable nouvelle interprétation fondée sur l’équation fondamentale du calcul d’Euler.
LE PRINCIPE DE MOINDRE ACTION SELON EULER
Dans" l’Additamentum II" de "Methodus Inveniendi Lineas Curvas Maximi Minimive Proprietate Gaudentes ", 1744.
Dès 1728, Daniel Bernoulli et Euler étudient de nombreux problèmes de corps à l’équilibre qu’ils résolvent grâce à des méthodes touchant les isopérimètres, donc minimisant une certaine quantité. Puis, en 174129, Daniel Bernoulli suggère à Euler de s’attaquer aux corps en mouvement et en 1743, Euler résout le problème des forces centrales par la méthode des isopérimètres. Alors, bien que la grandeur physique à minimiser ou à maximiser ne soit pas encore claire dans tous ces problèmes, Euler a la conviction profonde que les lois pour des corps soumis à des forces quelconques doivent a priori obéir à un principe de moindre action.
Euler définit la grandeur physique à minimiser : c’est ∫ ou bien la somme des force vives
∫ en introduisant le temps30. est la masse. Euler considère que c’est bien cette quantité qui est à minimiser car il peut vérifier qu’il obtient bien les mêmes trajectoires avec sa formule fondamentale qu’avec les calculs déjà connus. Euler effectue l’application mathématique du principe de Maupertuis. Sa puissance est d’y associer une méthode mathématique féconde. Euler retrouve les résultats suivants31
la trajectoire rectiligne du mouvement inertiel, pour la minimisation de ∫ lorsque est constante.
la trajectoire parabolique de la chute libre d’un corps dans un champ gravitationnel constant.
29 Etude historique sur le principe de la moindre action, Pierre Brunet, p.31.
30 Voir annexe II pour le texte d’Euler numérisé d’après l’édition originale. On y retrouve à la fin de la première page de cet Additamentum II le passage intéressant "Iam ico lineam ….". On remarque que les notations n’étaient pas encore bien fixées, √ désigne la vitesse . Pour un commentaire sur cette imprécision, voir Etude historique sur le principe de la moindre action, Pierre Brunet, p.99.
31 H.H. Goldstine, A history of the calculus of variations from the 17th through the 19th Century (Springer-verlag, New York, 1980), p.102.
26
la trajectoire pour une particule soumise à l’action d’une force se décomposant de manière générale en deux composantes constantes horizontales et verticales.
les trajectoires des particules soumises aux forces centrales et la loi des aires de Kepler.
Donnons à titre d’exemple le calcul d’Euler concernant la chute libre.
Euler note . La seule force agissant sur la particule est la force de gravitation. La loi de conservation des forces vives donne ( ) avec la vitesse dans nos notations modernes.
Euler note . Alors qui s’intègre en , où est une constante, est la vitesse initiale selon .
Le chemin suivi par la particule s’obtient en minimisant l’intégrale
∫ √ ∫ √( )( )
avec
Euler applique sa formule fondamentale : et
(√( )( )) √
√ √ où est une constante. Des calculs élémentaires donnent √
√ et par intégration √ ( )
En d’où et √ qui est bien la parabole attendue.
On la reconnait mieux avec nos notations modernes : on obtient √
27
Enfin, Euler s’attelle à unifier par le principe de moindre action les processus de minimisation pour les corps au repos et pour ceux qui sont en mouvement, ce qui est le sujet d’un de ses mémoires32.
Il y parvient en retravaillant l’étude de Maupertuis sur l’équilibre des corps au repos que nous interprétons aujourd’hui comme la découverte du minimum de potentiel. On peut alors affirmer qu’une première universalité du principe de moindre action est atteinte, mais Euler fait des remarques quant à sa généralité : Il ne s’applique que dans les cas où le théorème des forces vives de Leibniz est vérifié, où l’action ne dépend que de la position seule. Le principe de moindre action ne peut donc pas être appliqué dans les milieux résistants dans lesquels il existe une force de freinage dépendant de la vitesse.
Par ailleurs, Euler pense que le principe de moindre action est valable non plus pour une particule, mais pour un ensemble de particules interagissant entre elles, mais il ne le formulera pas précisément. La généralisation du principe de moindre action à tous ces cas sera entreprise par Lagrange à qui revient le mérite d’en donner une formulation correcte.
32 L’Harmonie entre les principes généraux de repos et mouvement de M. de Maupertuis, Mémoires de l’académie des sciences de Berlin, 1751, p.175. La numérisation de la version originale est disponible sur le site http://www.math.dartmouth.edu/~euler/docs/originals/E197.pdf
28
ANNEXE I
Dans cette annexe est présenté l’extrait du chapitre II de "Methodus Inveniendi Lineas Curvas Maximi Minimive Proprietate Gaudentes sive Solutio Problematis Isoperimetrici Latissimo Sensu Accepti " reproduit d’après l’original. Le chapitre II s’intitule " De Methodo maximorum ac minimorum ad lineas curvas invienendas absoluta ", et l’exemple III concerné se situe en p. 49 et 50.
___________________________________________________________________________________
29
30
ANNEXE II
31