• Aucun résultat trouvé

1.3 Les objectifs de C.R.E.A.T.I.O.N. et l’organisation du projet

2.1.3 La construction de lois statistiques

2.1.3.1 Problématique et cadre théorique

Les lois statistiques du niveau 0 que nous établissons permettent, à partir de quelques spécifica-tions, de définir les paramètres principaux de la modélisation de niveau 1. Trois paramètres peuvent être choisis comme spécification par exemple :

– Wpay : la masse de charge utile – RA : le rayon d’action maximal

– Vmax : la vitesse maximale d’évolution ou la vitesse économique de croisière (Veco)

Ces trois paramètres sont typiques d’une mission de transport. Nous pourrions en choisir d’autres comme la masse maximale au décollage, la puissance requise au stationnaire ou le plafond opérationnel. L’intérêt de cette partie est d’illustrer une méthode et non de présenter tous les modèles de niveau 0. Dans la base de données, les informations sur la masse de charge utile, le rayon d’action et la vitesse maximale sont soumises à une incertitude non quantifiable : la validité des informations. Comme nous l’avons expliqué plus en amont, les valeurs de la base de données sont indiquées sans information sur la quantité de carburant prise en compte ou la masse de charge utile. Or les spécifications choisies sont dépendantes de ces paramètres. Il faut donc prendre du recul sur les lois établies dans la suite. Les motivations du niveau 0 sont de donner des tendances. Le tableau2.1 présente quelques statistiques sur la base de données au regard des spécifications choisies.

Figure 2.1: Vue globale de la base de données giravions. Le tableau du bas indique pour chaque paramètre le pourcentage de complétion de la base de données, c’est-à-dire le pourcentage d’appareil pour laquelle le paramètre est renseigné.

Statistiques Vmax (m/s) RA (km) Wpay (kg)

Nb d’observations 140 140 73 Minimum 28,9 208 200 Maximum 88,9 1 295 20 000 Médiane 67 620 1 272 Moyenne 67 689 761 Écart-type 13,6 205 3 705

Tableau 2.1: Statistiques de la base de données par rapport à la masse de charge utile Wpay, la vitesse maximale Vmax (en général en vol en palier à la puissance maximale continue), le rayon d’action maximal RA.

2.1. MODÉLISATION DE NIVEAU 0 69

La technique utilisée est la régression linéaire mono ou multi-variables. Les régressions polyno-miales de degré n ne sont pas écartées, mais elles présentent un risque de « sur-apprentissage », c’est-à-dire qu’une loi permettra de retrouver très, voire trop, fidèlement les individus de la base de données ayant servi à sa création. En revanche la capacité de prédiction sera faussée, ce qui est contraire à la robustesse souhaitée. Bien entendu, c’est à l’utilisateur de fixer un degré raisonnable. La figure 2.2 illustre le sur-apprentissage possible avec les régressions polynomiales en montrant le diamètre du rotor en fonction de la masse pour les individus de la base de données.

Figure 2.2: Cette figure illustre le surapprentissage qui peut éventuellement se produire avec des régressions polynomiales sur la base de données. La régression présentée donnant le diamètre du rotor principal en fonction de la masse maximale au décollage. Elle n’est donc bien sûr pas utilisée dans la suite.

La régression linéaire est un modèle permettant d’établir une relation entre un ensemble de va-riables recherchées Y de dimension (n, 1), et des vava-riables explicatives X de dimension (n, p + 1). La valeur n correspond au nombre d’individus considérés, donc le nombre d’hélicoptères et p le nombre de variables explicatives. Dans le cas présent, p est égal à 3 : Wpay, RA, Vmax. Pour chaque individu il faut donc résoudre l’équation matricielle suivante :

Y1 . . Yn = 1 x1,1 ... x1,p . . ... . . . ... . 1 xn,1 ... xn,p a0 . . ap + ǫ1 . . ǫn (2.2) Soit :

Y = a · X + ǫ (2.3) Dans ces équations, a est un ensemble de coefficients à déterminer pour chaque variable et ǫ l’erreur ou le résidu exprimant l’information manquante dans le modèle. Cette erreur peut être due aux différences technologiques, aux manques d’informations dans la base de données, à l’effet d’une variable méconnue ... Les valeurs de a sont donc recherchées en minimisant ǫ par la méthode des moindres carrés. Il existe alors une solution de la forme :

ˆa = XTX−1

XTY où le vecteur ˆa = a si ǫ = 0 (2.4) Pour des raisons de robustesse de la loi établie, les variables de X ne doivent pas être corrélées. Une première étape consiste donc à étudier les relations existantes entre les paramètres choisis. Le calcul de coefficients de corrélation peut aussi permettre de juger la pertinence d’une régression linéaire entre deux variables. Plus le coefficient de corrélation est proche de 1, plus les séries de données sont linéairement dépendantes. A contrario si la corrélation tend vers 0, il n’y a aucune dépendance entres les grandeurs observées. Le tableau 2.2 montre que les corrélations mises en évidence sont toutes inférieures à 0,5. Le maximum est atteint entre Vmax et RA alors que le minimum est entre RA et Wpay. La faible colinéarité entre le rayon d’action et la masse de charge utile s’explique par le fait que les appareils de la base de données n’ont pas tous les mêmes missions donc le rapport quantité de carburant ou rayon d’action sur masse de charge utile n’a aucune raison d’être semblable. Les graphiques de la figure2.3 montrent la répartition des appareils par rapport à chaque entrée du niveau 0. On remarque une corrélation diffuse entre Vmax et RA avec le coefficient de corrélation le plus important. Ceci justifie la construction de régression à partir des variables de spécifications choisies.

Wpay RA Vmax Wpay 1 0,248 0,307

RA 1 0,497

Vmax 1

Tableau 2.2: Matrice de corrélation entre les entrées du niveau 0.

2.1.3.2 Modélisation de la masse maximale au décollage à partir des spécifications