G ERGONNE
Analise. Application de la méthode des moindres quarrés à l’interpolation des suites
Annales de Mathématiques pures et appliquées, tome 6 (1815-1816), p. 242-252
<http://www.numdam.org/item?id=AMPA_1815-1816__6__242_0>
© Annales de Mathématiques pures et appliquées, 1815-1816, tous droits réservés.
L’accès aux archives de la revue « Annales de Mathématiques pures et appliquées » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale.
Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
242
ANALISE.
Application de la méthode des moindres quarrés à l’interpolation des suites ;
Par M. GERGONNE.
LORSQU’UNE
fonction d’une seulevariable
estdonnée ,
onpeut toujours
déterminerrigoureusement
et directement lesvaleurs ,
tantde la fonction que de ses divers coefficiens
différentiels , répondant
à une valeur donnée de la variable
indépendante ;
tout comme, lors-qu’une ligne
courbe estdonnée ,
onpeut toujours,
pour l’unequel-
conque de ses
abscisses ,
construirel’ordonnée,
latangente ,
lecercle
osculateur t
etc.Mais,
de mêmequ’au
lieu de donner unecourbe ,
onpeut
donnerseulement un certain nombre de ses
points ,
onpeut aussi ,
au lieude donner une fonction d’une
variable,
donner seulement les valeurs queprend
cette fonction pour un certain nombre de valeurs de la variableIndépendante ;
et demander ensuited’assigner
lesvaleurs ,
tant de cette fonction
que
de ses divers côefficiensdifférentiels ,
pour une autre valeur
quelconque
de cettevariable ;
tout commeon
pourrait
demanderquelles
sont , pour une abscissedonnée,
l’or-donnée,
latangente,
le cercleosculateur,
etc., d’une courbe donton connaitrait seulement un certain nombre de
points.
C’est en celaque consiste le
problème
del’interpolation
des suites.Ce
problème
se réduit évidemment à remonterdes
valeurs données a celle de la fonction àlaquelle
ellesappartiennent,
ou despoints
donnés au trace de la courbe sur
laquelle
on lessuppose situés :
243
or , par là même il est
indéterminé ;
car , par despoints donnés ,
lion
consécutifs ,
même en nombreinfini ,
on peuttoujours
fairepasser une infinité de courbes différentes
(*).
Ces courbes
pourront
fortbien ,
dans certainesparties
de leurcours , différer les unes des autres d’une manière
notable ;
et la même différencedevra
se faire remarquer aussi dans lesordonnées ,
tan-gentes,
cerclesosculateurs , etc., qui répondront
a une même abs-cisse. On
conçoit pourtant
que , si lespoints
donnés sont assez voisinsles uns des autres , les courbes
qui
lescomprendront
nepourront
différer
notablement ,
dans l’intervalle embrassé par cespoints ,
dumoins si aucune d’elles n’a dans cet intervalle une
asymptote paral-
lèle à l’axe des
ordonnées ;
onconçoit
même que cespoints pourront
toujours
êtresupposés
assezmultipliés,
et , en mêmetemps ,
assez voisins les uns des autres, pour que les différences entre ces courbes deviennent pour ainsi dire insensibles. Les ordonnéesqui répondront
à une même
abscisse , comprise
dans les limites de cespoints ,
serontdonc sensiblement
égales ;
mais la différence entre lestangentes
pourra êtreplus sensible,
celle entre les cercles osculateurs encore d’avan-tage,
et ainsi de suite.Concluons de là que , si des
fonctions
de formes diversesprennent
les mêmesvaleurs ,
pour certaines valeursdéterminées,
et voisinesles unes des autres , de la
variable indépendante ,
sans devenir in-finies pour aucune valeur
comprise
entrecelles-là ;
ces fonctionsprendront
des valeurs peudifférentes ,
pour d’autres valeurs decette
variable , comprises
dans les limitesqu’embrassent
lespremières ;
mais
il n’en seraplus
de même des coefficiens différentiels successifsqui ,
d’une fonction àl’autre , pourront
différer de_plus
enplus,
à mesure que l’ordre en sera
plus
élevé.On pourra
donc,
sans erreursensible , adopter
indistinctement etarbitrairement l’une des fonctions pour la fonction
cherchée ;
tout(*) On peut consulter sur ce
sujet
une dissertationqui
se trouve à la page 252 du V.e volume de ce recueil.244
comme,
lorsque plusieurs
courbesqui passent
par les mêmespoints
ne
présentent
entre elles que des différencesinsensibles ,
onpeut
en
regarder
unequelconque
comme étant réellement celle dont cespoints
fontpartie.
aLa courbe et la fonction
pouvant
ainsi être choisies d’une infinité de maruèresdifférentes ,
il sera convenable de s’arrêter auxplus simples, c’est-a-dire,
à la courbeparabolique
et à la fonction ra-tionnelle et entière
qu"elle représente graphiquement.
Ce choix serad’autant mieux fondé
qu’il
est connu que toute fonctionqui ne
devientinfinie pour aucune valeur finie de la variable dont elle
dépend,
est
toujours développable
en sérieprocédant
suivant lespuissances
ascendantes
de
cette variable.Le
procédé auquel
nous venons d’être conduit est aussi celui-qu’on
suitcommunément ;
on suppose que l’ordonnée de la courbe cherchée estune fonction
complète,
rationnelle et entière del’abscisse dans laquelle
on admet autant de termes
qu’il
y a desystèmes
de valeurdonnés ;
les coefficiens de ces termes sont
inconnus ,
et on les détermineen,exprimant
que la courbe passe par lespoints
donnés. Ces coefficiensune fois
déterminés ,
rien n’estplus
facile ensuite qued’assigner
l’ordonnée et les coefficiens différentiels
qui répondent
à une abscissequelconque ;
mais on nepeut compter
sur les valeurs que la formule leurassignera qu’autant qu’on
n’en feral’application qu’à
une abscissecomprise
entre celles despoints donnés ,
et même ne serapprochant
pas
trop
de laplus grande
ni de laplus petite.
Cette méthode
qui ,
enparticulier,
a étéemployée
par M.Laplace,
dans son mémoire sur la
Recherche
des orbites des comètes(*) ,
renferme une source
d’erreur ,
dans lasupposition ,
tout i fait gra-tuite,
d’une courbe du genreparabolique. Néanmoins,
si l’onpouvait compter
en touterigueur
sur les valeurs données de lafonction ,
et si ces valeurs étaient
très-multipliées
ettrès-voisines ,
ce que(*)
Voyez
les Mémoires de l’académie des sciences de Paris, pourI780.
nous
245
nous avons dit
ci-dessus,
montre assez que l’erreurrésultant
de cettesupposition
ne seraitjamais
bien considérable.Mais il n’en va pas ordinairement
ainsi ;
les valeurs discontinues de lafonction,
surlesquelles
ons’appuie
pour construire laformule,
sont communément déduites
d’expériences
ou d’observations suscep- tibles d’une exactitude assezbornée ;
et il arrivealors,
comme M.Legendre
l’a fort bien observé(*),
que les erreursqui
les affectentpeuvent
avoir d’autantplus
d’influence sur la formule finale et sur. les résultats
qu’on
endéduit ,
que ces valeurs sont enplus grand
nombre.
Concevons,
eneffet, qu’on
ait tracé une courbequelconque,
etqu’on
lui ait menéplusieurs
ordonnées peu distantes les unes desautres ; si l’on vient à faire subir à ces ordonnées des
altérations, très-légères d’ailleurs
, tantôt enplus
et tantôt enmoins,
etqu’en-
suite on tente de faire passer une courbe continue par les extrémités de ces ordonnées ainsi
altérées,
ons’apercevra
aisément que , si les altérationsqu’elles
ont subi n’ontqu’une
faible influence sur fagrandeur
des ordonnéesintermédiaires ,
il n’en estplus
ainsi àl’égard
de la direction de la
tangente qui
souvent pour une même abscisseaura pu subir un
changement très-notahle ;
la différence pourra êtreplus
sensible encore àl’égard
de lagrandeur
du cercle osculateur.Ces aperçus
graphiques peuvent
facilement être confirmés par le calcul.Supposons,
eneffet
, un nombreimpair
d’ordonnéesdonnées,
toutes
équidistantes ,
et dont la distance commune soitprise
pour unité. Soient o l’abscisse et b t’ordonnée dumilieu;
I, 2,3 ,
...les abscisses et
bl , bll , b’’’, ...
les ordonnéesqui
lessuivent ;
-I,-2, -3,
.... les abscisses etbl , b, b,
... les ordonneesqui
lesprécèdent ;
et cherchons les coefficiens différentielsqui repondent à
l’ordonnée du
milieu ;
nous trouverons, pour lecas de
trois ordonnéesseulement
,(*) Voyez ses Nouvelles méthodes pour la détermination des orbites des comètes.
Paris, I806 , ( pag. iv )
Tam.
VI.36
pour
le cas decinq
ordonnéespour le cas de
sept
coordonnéeset ainsi de suite.
Or ,
supposons que , toutes les autres ordonnées étant d’ailleursexactes, l’ordonnée bl seule soit en erreur d’une
quantité 03B2 ,
et dé-signons
parE.dy dx , E. d2y dx2
les erreursqui
en résulteront sur les coefficiensdifférentiels ;
il est aisé de voirqu’on
aura , dans le casde trois
ordonnées ,
dans le cas de
cinq
coordonnéesdans le cas de
sept
ordonnéesde sorte que les erreurs sur le coefficient différentiel du
premier
ordre
croissent comme lesnombres 7 ? 1 3 ) - 1 *1 5- 4 ;, ....
et tendent ainsisans cesse à devenir
égales
à l’erreur même commise surl’ordonnée b’ ;
247
et que l’erreur commise sur le coefficient différentiel du second ordre
est constamment double de
celle-là.
M.
Legendre a
donc été iondé à direqu’en multipliant
les donnéeson
s’exposait
à faire croître aussi les erreurs dans la même propor- tion. Il estpourtant juste
de remarquer que c’est ensupposant qu’il n’y
aqu’une
seule ordonnéefautive ,
cequi
exclut toutepossibilité
de
compensation d’erreurs ;
et ensupposant de plus
que l’ordonnée fautive estprécisément
celle dont lavaleur ,
exacte ou non, exercel’influence la
plus
notable sur nos deux coefficiens différentiels.Quoi qu’il
ensoit,
cette source d’erreurparait
n’avoirpoint échappe
à l’attention de M.
Laplace. Voici
, eneffet,
comment iIs’exprime ( Mécanique céleste,
tom.1 ,
pag.201 ) :
« Cesexpressions
sont» d’autant
plus précises, qu’il
y aplus d’observations,
et que les»
intervalles qui
lesséparent
sontplus petits ;
onpourrait
donc»
employer
toutes les observations voisines del’époque choisie, si
» elles étaient exactes ; mais les erreurs dont elles sont
toujours
»
susceptibles
conduiraient à un résultatfautif; ainsi,
pour diminuer»
l’influence
de ces erreurs,il faut augmenter
l’intervalle des obser-» vations extrêmes, à rnesure que l’on
ernploie plus
d’observations. » Il seraitpeut-être plus
exact dL direqu’ilfaut employer
des obser-vations de
plus
enplus
distantes entreelles , à
mesurequ’on
enemploie
unplus grand nombre ;
et nous allonsvoir,
eneffet , qu’avec
cette
attention,
onpeut ,
àvolonté,
atténuer les erreurs. Soit al’intervalle , supposé
constant ,qui sépare
les valeurs consécutivesde x ;
intervalle que,ei.dessus,
nous avionspris
pour unité. Nos- résultats deviendront alors248 INTERPOLATION
Pourvu donc
que
nousprenions
pour a desnombres qui croissent
plus rapidement
que ceux de lasuite I 2, 2 3, 3 4,
.... nos erreurs Irontcontinuellement en
décroissant, à
mesure que nous aurons recours à unplus grand
nombre d’observations.Supposons,
parexemple ,
que nous fassions croître les valeurs de a suivant les nombres de la suite
naturelle ;
et prenons pour unité la valeur de cettequantité qui répond
au cas de troisobservations ,
nous aurons alorsPour 3
observations, E.I 203B2 , E.I 203B2 ;
Pour 5
observations , E.I 303B2 , E.I 303B2 ; Pour 7 observations , E.I 403B2 , E.I 603B2 ;
d’où l’on voit
qu’alors
les erreurs sur lescoefficiens
différentiels dupremier
ordre décroîtront comme les inverses des nombres na-turels,
et que cellesqui affecteront
les coefficiens différentiels du second ordre décroîtront suivant laprogression, plus rapide
encore,des inverses des nombres
triangulaires.
La méthode de M.Laplace
est
donc,
du moins de cecôté,
tout à fait à l’abri dureproche.
Mais,
supposonsqu’on ait ,
entre deux limites fixesdonnées,
desobservations
assez nombreuses pour rendretrès-petite
la différence entreles valeurs consécutives de x. Suivant ce
qui-
vient d’êtredit ,
ondevra rejeter
un d’autantplus grand
nombre de ces observationsqu’on
en voudraemployer davantage
dans la recherche dedy dx
etd2y dx2 .
Or,
c’est là un inconvénient assez grave , sur-tout si l’on n’a aucun motif desuspecter plutôt
les données que l’onrejette
que celles donton se propose dé faire exclusivement usage ;
puisqu’on
seprive
ainsides
compensations
d’erreurs surlesquelles
onpourrait compter
enles
employant
toutes.En réfléchissant sur ce
sujet ,
il m’a paruqu’il
étaitpossible
detout
concilier,
aumoyen
de la méthode des moindresquarrés (*),
(*) On sait que la méthode des moindres
quarrés
repose sur ceprincipe
quela valeur moyenne
, la
plus probablement
voisine de l’exactitude , d’unequantité
249
et
d’arriver
par elle à toute laprécision qu’il
estpossible d’espérer
dans
la recherchequi
nous occupe.. Voici pour cela dequelle
ma-nière
je conçois qu’on
en doit faire usage.Soient a,
al , a" ,
.... des valeurs de x, en nombrequelconque,
et soient
b, b’, b"
.... les valeurs données etcorrespondantes
de y.Soit
posé
en
prenant
dans cette fonction autant de termes seulementqu’on
en admettrait
si ,
suivant cequi
vient d’être ditci-dessus,
on nese
proposait d’employer qu’une partie
des valeurscorrespondantes
de x et
de y ;
ils’agira
de déterminer les valeurs des coefficiensA, B, C, D, ...
Si leur nombre étaitégal à
celui des obser-vations ,
onpourrait
leurassigner
des valeursqui
rendissent leserreurs tout à fait
nulles ;
mais la chose seraimpossible
dans le casac-tuel ,
et il faudra se contenter de rendreminimum
la somme deleurs
quarrés.
Ces erreurs étant
respectivement
il faudra faire
dont on a
plusieurs
valeursapprochées,
est cellequi,
étantsupposée
tout à fait exacte , rendrait minimum la somme desquarrés
des erreurs dont les autres seraientalors affectées. Le
premier
ouvrageimprimé
danslequel
il ait été fait mention de cette méthode est le mémoire de M.Legendre, déjà
cité dans uneprécé-
dente note ( 1806). Dans un ouvrage
publié
euI809,
M. Gauss a déclaré faireusage d’une semblable méthode
depuis 1795 ;
et M.Laplace a
démontréposté-
rarement que cette méthode est
rigoureusement
conforme à la doctrine de.probabilités.
c’est-à-dire ,
en différentiant parrapport
àA, B, C, D, ...
A
cause del’indépendance
entreA, B, C,
lesniultiplicateurs
de
dA , dB, dC ,....
devrontséparément
êtrenuls ;
faisant doncen
général,
pourabréger ,
en aura cette suite
d’équations
en nombre
pré
sémentégal à
celui des coefficiens4.4 , B, C, D,....
qu’il s’agit
dedéterminer ;
et, tantlis que les methodes ordinaires donnent pour y et ses coefficiens diffierentiels des valeurs d’unepré-
cision
toujours
un peu inférieure à celle des donneesd’apres
les-quelles
on lescalcule ,
on pourra leplus
souventespérer
ici del’emporter
enprecision
sur ces données elles-mêmes.Le cas le
plus simple ,
et en mêmetemps
leplus fréquent ,
estcelui où les valeurs de x sont en
progression
pardifferences;
il estalors
permis
desubstituer
à cetteprogression
ia suite naturelle desnombres. Soit
2n+I
le nombre des valeurs connues et correspon- dantes de x et y, on pourra numéroter o la valeur de xqui se
trouvera
occuper
lemilieu,
de manière que lenumérotage
soitsi alors on
désigne
par 03A3nm la somme des m.mespuissances
desnombres de la suite
naturelle ,
on auraau moyen de
quoi
leséquations (I)
deviendrontainsi,
outre que les sommes depuissances
semblables des nombres naturels sont données par des formules connues etgénérales,
onaura ici
l’avantage
depouvoir
calculerséparément
les coefficiens de rangspairs
et ceux de rangsimpairs ,
cequi simplifiera
letravail
d’une manière notable.
Dans le cas même où ni les valeurs de x ni celles
de y
nemarcheraient
enprogression
pardifférences,
onpourrait
encoreprofiter
de ces
simplifications,
enprocédant
comme il suit : onsupposerait
que x et y sont toutes deux fonctions d’une troisième variable z, dont les
valeurs,
tout à faitarbitraires , pourraient
être numérotéescomme nous l’avons dit ci-dessus à
l’égard de x
; on chercherait p ar no treprocédé,
les valeurs dedx dz , dy dz , d2x dz2 , d2y dz2 ,...; et
on aurait ensuite par les formules connues, relatives au
changement
de la
variable indépendante,
cette méthode me semblerait
préférable à
cellequi consiste à
inter-poler
entre lesobservations,
afin de les rendreéquidistantes ;
attenduqu’il peut
êtredangereux
, dans unproblème
d’une nature aussidclicate ,
de dénaturer les données avant -d’en faire usage.Il nous
parait
que l’introduction. desprocédés
que nous venonsd’indiquer ,
dans la méthode de M.Laplace ,
pour la détermination des orbites descomètes ,
nepeut qu’ajouter beaucoup
a saprécision ,
du moins dans le cas où l’on
peut disposer
d’ungrand
nombre d’ob-servations ;
mais cetteméthode ,
commebeaucoup d’autres ,
auratoujours
le grave inconvénient den’être ,
aufond p qu’un
tatonne-ment bien
dirigé.
Il resterait ici au
surplus
un autreproblème
àrésoudre , lequel pourrait
être énoncé comme il suit : On sait que despoints donnés,
en nombre
quelconque,
sont peuprès
situés sur une courbe para-bolique
d’undegré déterminé ,
maisinconnu ;
et l’on demande de découvrirquel
est leplus probablement
ledegré
de cettecourbe ?
La solution de ce
problème
lèveraitcomplètement
l’incertitude du calculatenrqui ,
voulantappliquer
la méthode de M.Laplace,
setrouve