Informatique commune MPSI Thomas MEGARBANE

(1)

Informatique commune MPSI 2021–2022

Thomas MEGARBANE

(2)

(3)

Table des mati` eres

1 Repr´esentation des nombres 1

I Point de vue général . . . 1 II Représentation des entiers . . . 1 III Représentation des flottants . . . 5

(4)

Chapitre 1

Repr´ esentation des nombres

I Point de vue g´ en´ eral

Le premier intérêt de la programmation est de pouvoir faire descalculssur ordinateur plus rapidement qu’à la main. Et les calculs les plus élémentaires sont ceux que l’on fait avec des nombres réels. Le problème, c’est qu’il faut pouvoir définir les nombres qu’on fait manipuler à un ordinateur :

— les entiers ne posent pas de problème : on se ramène à des additions ou des soustraction itérées de l’entier 1, qui est la brique élémentaire des entiers ;

— les rationnels se ram`enent aux entiers ´egalement, en tant que quotient d’entiers ;

— pour les irrationnels, il y a deux cas :

— soit il est racine d’un polynôme (à coefficients entiers) : on parle alors de nombres algébriques et on peut les travailler comme les entiers. Par exemple, pour√

2, on travaille dans l’ensemble : Q[√

2] ={a+√

2b|a, b∈Q} qu’on assimile `a Q² avec l’addition et la multiplication suivantes :

(a, b) + (a^′, b^′) = (a+a^′, b+b^′) et (aa^′+ 2bb^′, ab^′ +ba^′)

et on se ramène donc à l’addition et à la multiplication sur les rationnels. L’idée derrière est que

√2 est racine du polynˆome X²−2, et donc d`es que l’on voit des √

2² on les remplace par 2, et on retombe dansQ.

Plus généralement, si αest racine du polynômeP de degrén pourn∈N^∗, pour faire des calculs avecα on va se ramené à des calculs surQⁿ muni de l’addition coordonnée par coordonnée, et d’une multiplication un peu étrange qui provient des coefficients de P.

— soit il n’est pas racine d’un polynôme : et on ne peut plus faire de calculs exacts. Par exemple, si on veut travailler avecπ, on ne pourra pas bien multiplier les quantités, comme les puissances deπ ne sont pas reliées par des rationnels. On est obligés de faire des calculs approchés, et tout l’enjeu est alors de déterminer les erreurs possibles pour en estimer les conséquences.

II Repr´ esentation des entiers

Les entiers sont représentés de deux manières dans les programmes :

— lespetits entiers: directement manipulable sans problème de représentation, qui sont codés par un nombre fixé et fini de caractère, sous forme detableaux. Par exemple, sur un processeurs 64 bits, il s’agit des éléments de J0,2⁶⁴−1K ou deJ−2⁶³; 2⁶³−1K (selon le choix du programmeur). Il y a un champ d’action limité (car on ne peut pas représenter ainsi tous les entiers), mais les calculs sont très rapides (que ce soit pour +,−,×et même la division euclidienne).

1

(5)

2 CHAPITRE 1. REPR ´ESENTATION DES NOMBRES

— lesgrands entiers: exprimés dans une base choisie (par exemple en base 2 qui est la plus classique, en base 2⁴ pour la représentation hexadécimale, ou en base 2⁶⁴si on veut travailler avec des éléments qui sont des petits entiers). Les entiers sont alors donnés par des listes de petits entiers, appelés digits. Les opérations sont plus complexes, mais des entiers arbitrairement grands peuvent être représentés.

Et les deux notions sont liées, dans la mesure où les digits d’un grand entier sont des petits entiers, et à l’inverse qu’un petit entier n’est rien d’autre qu’un grand entier dont on a bloqué la taille (d’où la présence d’un tableau au lieu d’une liste).

II.1 Repr´ esentation suivant une base

Les entiers exprimés dans une base donnent des calculs assez facile, avec des systèmes de retenues (pour le produit ou pour l’addition), à la manière de ce qu’on fait en base 10 quand on pose une opération.

L’existence de l’´ecriture repose sur les r´esultats suivants :

Théorème-Définition II.1. Etant donn´´ e n ∈ N et b ∈ N avec b > 1, il existe une unique suite (a_k) ∈ J0, b−1K^N telle que :

n=

+∞

X

k=0

a_kb^k.

La suite (a_k) ainsi définie est nulle à partir d’un certain rang (en particulier la somme ci-dessus est finie, donc a bien un sens). Ses premiers termes forment l’écriture de n en base b, notée n_(b). Plus précisément, si on note p∈N tel que : ∀k > p, a_k = 0, alors :

n_(b) =a_pap−1. . . a₀.

Démonstration. Pour l’existence et l’unicité, on peut voir que la suite (a_k) est la suite définie par :

— a₀ est le reste de la division euclidienne de n par b;

— pour tout k∈N : a_k+1 est le reste de la division euclidienne de n−Pk l=0a_lb^l

b^k+1 par b.

La suite des (u_k) =

n−Pk

l=0a_lb^l

k∈N

´

etant une suite décroissante d’entiers naturels : elle converge (car décroissante minorée par 0) et elle est stationnaire (car c’est une suite convergente d’entiers). Une récur- rence immédiate montre que pour toutk∈N,u_k est un multiple deb^k+1, donc sa limite est nécessairement nulle (soit par un argument d’ordre arithmétique, soit en regardant la suite d’entiers de _bk+1û^k

qui est une suite d’entiers tendant vers 0 par opérations sur les limites, donc stationnaire à 0, et de même pour (u_k)).

Corollaire II.2. Soit x∈Q avec x >0qui s’´ecrit de la forme : x= n

b^m pourn, n∈N et b∈N avec b >1.

Alorsx s’´ecrit de mani`ere unique sous la forme :

x=

p

X

k=−m

akb^k

o`u les a_k sont dans J0, b−1K.

On dit alors que x_(b) =a_pap−1. . . a₀, a−1a−2. . . a−p est l’´ecriture de x en base b.

Démonstration. On applique le résultat précédent àn =x·b^m ∈N.

Remarque II.3. Il y a des nombres rationnels privil´egi´es suivant le choix de b :

— si b= 10 : on retrouve les nombres d´ecimaux (et l’´ecriture est celle dont on a l’habitude) ;

— si b= 2 : on obtient les nombres dyadiques.

(6)

II. REPR ÉSENTATION DES ENTIERS 3 Plus généralement, un rationnel x = ^p_q sous forme irréductible s’exprime bien en base b si, et seulement si, tous facteurs premiers deq divisentb. Par exemple, un nombre dyadique est aussi un nombre décimal.

Exemple II.4. Choisissons n∈N et b∈N avec b >1. Pour déterminer l’écriture de n en base b, on peut reprendre la suite donnée dans le théorème, ce qui donnerait :

def base(n,b):

L=[]

if n<b:

L=[n]

else :

L=(base(n//b,b)) L.append(n%b) return L

Le problème est qu’un telle méthode peut être très longue, à cause de la première division euclidienne.

Par exemple, sin = 10¹⁰⁰ et b= 10, alors on va perdre beaucoup de temps à calculer le reste de la division euclidienne de n par b, puis b², etc., chaque calcul étant à la fois long et inutile.

On préfère donc raisonner à l’envers :

— on d´etermine d’abord p;

— on calcule a_p;

— on descend ensuite.

ce qui donne :

def base2(n,b) : B=1

L=[]

N=n

while n >= B : B*=b

while B!=1 : B=B//b q= N//B L.append(q) N=N-q*B return L

II.2 Entiers sign´ es sur des mots de taille fixe

Les petits entiers sont représentés dans des tableaux de taille finie : la structure “fixe” des tableaux laisse moins de liberté que les listes (utilisées pour les grands entiers) mais permet des calculs plus rapides puisque, en imposant une mémoire limitée, les calculs “digit par digit” peuvent se faire simultanément par un même processeur.

On fixe ici une taille n, ce qui veut dire qu’un entier est représenté par la chaˆıne bn−1. . . b0. En système binaire, lesb_ivalent tous 0 ou 1, ce qui permet d’avoir 2ⁿentiers, et qu’on utilise en général pour représenter les entiers entre 0 et 2ⁿ−1.

Laconvention sign´ee change un peu la donne :

— bn−1 code pour le signe de l’entier (0 s’il est positif et −1 s’il est n´egatif) ;

— b_n−2. . . b₁b₀ code pour la valeur absolue (avec l’´ecriture en base 2).

Ceci pose quelques probl`emes :

(7)

— l’entier 0 possède deux écritures : 10. . .0 et 00. . .0, et donc on “perd” un entier en cours de route (on de représente que 2ⁿ−1 entiers au lieu de 2ⁿ, puisqu’on représente en fait l’ensemble J−2n−1 + 1; 2ⁿ⁻¹−1K;

— la soustraction et l’addition sont deux opérations totalement différentes, et doivent donc être codées

`

a part l’une de l’autre.

Mais ceci cache une subtilité des entiers que l’on représente : ils sont en fait connus modulo 2ⁿ. Donc on peut transposer nos calculs deJ−2ⁿ⁻¹+ 1; 2ⁿ⁻¹−1KàJ0; 2ⁿ−1K, avec la convention du complément à2 :

— les nombres positifs s’écrivent comme avant de la forme 0bn−1. . . b₁b₀ (ce qui correspond à l’écriture en base 2) ;

— un nombre négatifm est codé par l’écriture en base 2 de 2ⁿ+m: cette écriture se déduit facilement l’écriture de |m|, puisque cela revient à changer tous les chiffres de |m| (les 0 deviennent des 1 et inversement), puis on ajoute 1.

Exemple II.5. Si n= 5, c’est-`a-dire qu’on repr´esente les entiers avec4 chiffres (en base 2) :

— on code 7 = 0·2⁴+ 0·2³+ 1·2²+ 1·2¹ + 1·2⁰ par 00111;

— pour coder −4 : on code 2⁵ −4 = 32−4 = 28 = 16 + 8 + 4 + 0 + 0 ce qui donne 11100. Si on reprend `a partir du code de 4, `a savoir 00100, alors : en inversant ce code on obtient 11011, puis en rajoutant 1 on obtient bien (avec les retenues) 11100.

Et alors l’addition et la soustraction se codent d’une seule manière, avec un “passage à l’opposé” quand on fait une soustraction. La seule chose à laquelle il faut prendre garde est que les calculs ne sont vérifiés que

“modulo 2ⁿ” du fait du choix de repr´esentation.

Exemple II.6. Prenons n= 8 et codons 37−18 comme une addition :

— on code 37 = 0 + 32 + 0 + 0 + 4 + 0 + 1 et 18 = 0 + 0 + 16 + 0 + 0 + 2 + 0respectivement par00100101 et 00010010;

— on laisse 37 tel quel, et on détermine la représentation de −18 à l’aide de celle de 18 : on inverse les chiffres ce qui donne 11101101, puis on rajoute 1 pour obtenir : 1110110;

— on se retrouve `a poser l’addition suivante :

37 0 0 1 0 0 1 0 1

18 0 0 0 1 0 0 1 0

−18 1 1 1 0 1 1 1 0

37−18 0 0 0 1 0 0 1 1

où en théorie il y aurait un 1 à rajouter au début de la première ligne, mais qui disparaˆıt comme on fait nos calculs modulo 2ⁿ, alors que ce 1 correspondrait justement à rajouter 2ⁿ.

II.3 Entiers multi-pr´ ecision en Python

Les entiers dans Python sont représentés (par défaut) comme des grands entiers : toutes les opérations doivent ainsi prendre en compte la taille des entiers (c’est-à-dire le nombre de digits pour les écrire dans la base choisie, qui est un petit entier). Et ainsi leur temps de calculs dépend de la taille des entiers considérés.

Ce n’est pas le cas pour les entiers de petite taille, où on peut voir que toutes les opérations se font par des boucles forde même taille (donc toutes les complexités sont les mêmes).

On fixe b > 1 un entier qui désignera l’entier dans la base duquel Python fait ses calculs. On considère n, m∈N, de tailles respectives p etq, c’est-à-dire que :

n=

p

X

i=0

n_ibⁱ etm =

q

X

j=0

m_jb^j

o`u les n_i, m_j sont des petits entiers.

Proposition II.7. Avec les mˆemes notations, on a : p = ⌊log_b(n)⌋. Donc la taille de n en base b est :

⌊log_b(n)⌋+ 1.

(8)

III. REPR ÉSENTATION DES FLOTTANTS 5 Démonstration. On anp ̸= 0, donc on déduit l’encadrement : b^p ≤n < b^p+1. Et en appliquant lnb (qui est strictement croissante comme b >1) : p≤log_b(n)< p+ 1, ce qui donne bien l’égalité par définition de la partie entière.

Et la taille est le nombre de digits de n, donc p+ 1.

Proposition II.8. Avec les mˆemes notations, on a :

n+m=

max(p,q)

X

k=0

(n_k+m_k)·b^k et n×m=

p+q

X

k=0

X

i+j=k

n_im_j

! b^k

où on a complété les suites des chiffres par des 0 pour qu’elles soient bien définies pour tous les indices supplémentaires qui apparaissent ci-dessus.

Remarque II.9. Le point important est que les écritures ci-dessus sont un passage obligé, mais ne sont pasles écritures en base b. Car rien de dit que les les (n_k+m_k) ou les

P

i+j=kn_im_j

soient des entiers de J0, b−1K. On a donc un problème de retenue à prendre en compte quand on écrit les algorithmes.

Proposition II.10. Si on consid`ere que l’addition et la multiplications avec les petits entiers ont des complexit´es de 1, alors :

— la complexit´e de l’addition est de l’ordre de max(p, q);

— la complexité de la multiplication “na¨ıve” précédente est de l’ordre de p×q.

Démonstration. Il suffit de compter le nombre d’opérations élémentaires :

— pour l’addition : il y a max(p, q) additions de petits entiers, puis au plus max(p, q) soustractions et additions pour g´erer les retenues ; donc au plus 3×max(p, q) additions ;

— pour la multiplication : on préfère calculer la complexité en utilisant l’écriture : n×m=

p

X

i=0 q

X

j=0

n_im_jb^i+j

qui donne au plus (car il y a éventuellement des termes nuls) (p+ 1)(q+ 1) multiplications, et autant d’additions, ce qui donne le résultat (aux corrections près sur les retenues, mais qui sont de l’ordre de p+q).

Remarque II.11. Pour la multiplication, il y a d’autres méthodes plus efficaces qui permettent d’abaisser la complexité en calculant astucieusement certains termes. Les plus connues reposent sur des découpages ha- biles de sommes (la méthode de Karatsuba) ou alors des systèmes de divisions euclidiennes puis remontées (avec la transformée de Fourier rapide,abrégée en FFT).

III Repr´ esentation des flottants

III.1 L’impossibilit´ e de repr´ esenter tous les nombres

Les autres nombres que les entiers (ou les nombres qui s’y ramènent, comme les rationnels ou les nombres algébriques) peuvent être manipulés de manière exacte dans les calculs. Mais il y a en fait un double problème lié à cela :

— déjà cela a un certain coût de manipuler de manière exacte des nombres : un coût de mémoire

´

evidemment (par exemple pour stocker un rationnel on doit stocker 2 entiers, qui peuvent vite devenir grands, pour une racine d’un polynôme de degré n on manipule n rationnels à chaque

´

etape), et un coˆut de calcul (les op´erations usuels demandent de nombreux calculs auxiliaires et prennent beaucoup plus de temps) ;

(9)

— et ensuite car ils ne représentent que très peu de nombres : l’infinité des nombres rationnels ou algé- brique est infiniment plus petite que celle des autres nombres (on parle d’ensembles dénombrables, et d’ensemble non dénombrable ayant la puissance du continu).

De fait, il est raisonnable de chercher une autre manière de représenter tous les nombres, qui ne pourra donc se faire de manière exacte.

Définition III.1. On appelle nombre flottant ou nombre à virgule flottante un nombre de la forme : x=s×m×bê

o`u :

— s est le signe (±1) ;

— m est la mantisse (dont les formes peuvent varier) ;

— e est l’exposant (qui est un entier) ;

— b est la base (dans laquelle sont faits les calculs, souvent2 ou 10).

Remarque III.2. La mantisse peut avoir des formes très variables, mais il s’agit le plus souvent d’un entier, ou d’un nombre de l’intervalle[1;b[ (codé en base b, éventuellement arrondi).

Dans le second cas, on parlera de virgule flottante normalis´ee : par exemple, si b = 10, c’est ce qui correspond `a la notation scientifique

III.2 Repr´ esentation de flottants sur des mots de taille fixe

Représenter des flottants sur des mots de taille fixe, c’est se fixer des limites sur la mémoire qu’on alloue pour représenter un nombre. Il s’agit surtout de calibrer la mémoire allouée aux composants informatiques utilisés pour que les calculs soient optimisés.

Exemple III.3. Si on raisonne en base 2, et qu’on d´ecide de repr´esenter des flottants par des mots de taille n, alors on fixe :

— un caract`ere pour le signe ;

— n₁ caractères pour la mantisse : un dyadique à n₁ chiffres après la virgule de [1,2[;

— n₂ caract`eres pour l’exposant : un entier entre −2ⁿ²⁻¹+ 1 et 2ⁿ²⁻¹−1; avec 1 +n1+n2 =n.

Et on représente ainsi tous les nombres dyadiques possédant au plusn₁+1chiffres non nuls, nécessairement consécutifs, dont la valeur absolue est comprise entre 2ⁿ²

On va donc en pratique arrondir un r´eel au dyadique le plus proche parmi ceux qui sont repr´esentables.

On a alors le problème de représentation de 0, qui est généralement représenté par la plus petite mantisse et le plus petit exposant, donc dans notre cas on a :

0 = ± 1,00. . .00

| {z }

´ecriture en base2

×2⁻²ⁿ²⁻¹⁺¹.

Remarque III.4. Si on raisonne en base10, et qu’on garde le même type d’encodage, on retrouve l’écriture scientifique avec n₁ chiffres significatifs (donnés par la mantisse).

Remarque III.5. Avec des petites astuces de convention, on peut représenter davantage de nombres avec des mots de même taille : on parle alors de nombres dénormalisés. On peut par exemple rajouter des notations pour représenter ±∞ en leur réservant par exemple le plus grand exposant possible.

III.3 Limites des calculs en flottants

Il y a un double problème avec le calcul en flottants sur mots de taille fixe : on ne peut pas représenter tous les nombres, et les calculs sont approchés.

(10)

III. REPR ´ESENTATION DES FLOTTANTS 7

— certains nombres ne peuvent être représentés (des nombres trop grands ou trop petits), et on peut se retrouver à des débordements (ou overflows) quand le résultat d’une opération est trop grand ou des sous-passements (ou underflows) lorsqu’ils sont trop petits ;

— on y perd en précision, car des nombres différents seront représentés d’une même manière, et on peut par exemple se trouver avec des cancellations(des soustractions de deux nombres très grands et très proches qui peuvent donner des valeurs nulles) ou des absorptions(des additions de nombres d’ordre de grandeur différents qui font disparaˆıtre le nombre le plus petit).

Selon les conventions choisies, on peut se prévenir de trop grandes erreurs avec la définition de NaN(”not a number”) qui peut être la sortie d’une opération interdite (du type une division par 0), et qui, à défaut de donner un résultat qui devrait être erroné, dit qu’il n’y a pas de résultat fiable à une opération.

Proposition III.6. L’addition sur les flottants n’est pas associative.

Démonstration. Par exemple avec une représentation en base 2 avec une mantisse à 20 chiffres : 1 + 2¹⁰⁰ = 2¹⁰⁰. Et donc :

(1 + 2¹⁰⁰)−2¹⁰⁰= 2¹⁰⁰−2¹⁰⁰ = 0 1 + (2¹⁰⁰−2¹⁰⁰) = 1 + 0 = 0

Remarque III.7. Ainsi, pour calculer des sommes ou des différences en flottants, il faut commencer par regrouper ensemble les petits termes, pour être sûr qu’ils ne soient pas absorbés par les plus grands trop vite.

Proposition III.8. On ne peut estimer numériquement des approximations de formes indéterminées avec des flottants.

Exemple III.9. Prenons un calcul du type ⁰₀ fréquent en calcul numérique : le calcul d’une dérivée par limite de taux d’accroissement du type f(x+h)−f(x)

h . Alors on a deux probl`emes li´es aux arrondis :

— pour h trop petit, son approximation comme flottant sera h= 0, et le calcul ne sera pas faisable ;

— même s’il est faisable, les arrondis du numérateurs pourront conduire à des éléments absorbants et donner de nombreuses erreurs.

Remarque III.10. Il y a en principe deux méthodes pour éviter ce genre de problèmes :

— utiliser des techniques de calcul littéral : on simplifie alors les expressions pour lever les indéter- minations en amont des applications numériques pour limiter les erreurs dues à l’utilisation de flottants ;

— accepter son destin, mais en avoir conscience : estimer précisément les erreurs, et surtout les répercussions d’erreurs.