Season 01 • Episode 01 • Codage et compression
0Codage et compression Episode Season 01 01
Time frame 1 periods
Pré-requis :
Souresutilisées:•
Codagebinaire:http://sienesphy.free.f r/ly ee /MPI /Co dage Bina ire .htm•
Codageoudéodageenasii:http://www.dode.fr/asii•
Codageoudéodageavehuman:http://www.dode.fr/o dage -hu ffma n- omp ress ion•
CodeAsii:http://fr.wikipedia.org/w iki/ Cod age_ de_ ara tèr es•
Compressiondedonnées:http://fr.wikipedia.org/ wiki /Co mpre ssi on_d e_do nné es•
Human:http://fr.wikipedia.org/w iki/ Cod age_ de_H uff manthèmespourpoursuivre:systèmedenumeration,odagedesouleurs(systemeRGB,...),ompressionjpeg,
Objectifs :
•
Déouvrir le odage binaireet l'interet de la base 2.•
Déouvrir un algorithmede ompressionet l'interet des arbres.Matériels :
•
Table ASCII.•
Fihier Xaspour onvertir mot en binaire.•
Liste de mots à oder en asii puis à ompresser ave algorithme RLE et ensuite avel'algorithme de Human.
•
Diaporama.1 – Présentation 25 mins
A l'aide d'un diaporama, le professeur présente le odage binaire. Ensuite, les élèves
pratiquent le odage de diérentmots hoisis par eux-même.
2 – Pratique 35 minutes
Al'aided'undiaporama,leprofesseurprésentelaompressionRLEpuisellede Human.
Ensuite, lesélèves pratiquent le odage de diérent mots donnés par le professeur.
Codage et compression Episode Season 01 01
Document Leçon
Codage binaire
Les ordinateursne omprennentque deux états(représentés par leshires 0et1).Ainsi
tout texte outoute image doit être onverti en binaire pour pouvoir être oder.
•
Pour du texte, à haque aratère est assoié un nombre ompris entre 0 et 127 (enutilisantleode ASCII).Ce nombre déimalest ensuiteonverti en nombrebinairesur
7 bits de manièrea être omprispar l'ordinateur.Toutefois, lesordinateurs travaillant
presque tous sur un multiplede huitbits (multiple d'un otet) depuis lesannées 1970,
haque aratère d'un texte en ASCII est stoké dansun otetdontle 8ebitest 0.Les
aratères de numéro 0 à 31 et le 127 ne sont pas ahables; ils orrespondent à des
ommandes de ontrle de terminalinformatique.Le aratère numéro32 est l'espae.
Lesautresaratèressontleshiresarabes,leslettreslatinesmajusulesetminusules
et quelques symboles de pontuation.
•
Pour une image, elle-iest déoupéen pixel(de l'anglaispiture element, quisignieélément d'image). Chaque pixel est odé sur un ou plusieurs bits selon la pro-
fondeur,'est-à-dire du nombre de ouleurs ahables.
⋄
noir etblan : un bit;⋄
16ouleurs (standard VGA) : 4bits;⋄
256 ouleurs : 8 bits (1otet);⋄
65536 ouleurs (milliersde ouleurs) :16 bits;⋄
16777 216 ouleurs (16.7 millions de ouleurs, true olors) :24 bits.La plae mémoire réelle utilisée peut être plus importante. Par exemple, en mode 16
millions de ouleurs, le pixel oupe parfois 32 bits (4 otets), l'otet supplémentaire
étantinutilisé,ou utilisépour oder la transparene.
Compression RLE
LeslettresRLEsignientrun-length enoding.Ilest appeléodagepar plages en français.
Il s'agit d'un mode de ompression parmi les plus simples : toute suite de bits ou de
aratèresidentiquesestremplaéeparunouple(nombred'ourrenes;bitouaratère
répété).
Lerésultatomporteengénéralmoinsdearatères,bienqueenesoitpasuneobligation.
•
AAAAAAAAZZEEEEEER donne : 8A2Z6E1R,e quiest beauoup plus ourt.•
WBWBWBWBWB donne : 1W1B1W1B1W1B1W1B1W1B e qui est deux fois plus long.Compression Huffman
Le odage de Human est un algorithme de ompression de données sans perte élaboré
par David Albert Human vers 1950.
Season 01 • Episode 01 • Codage et compression
2L'idée qui présideauodage de Human est voisine de elle utiliséedans leode Morse :
oder e qui est fréquent sur peu de plae, et oder en revanhe sur des séquenes plus
longues e qui revient rarement (entropie). En morse le e, lettre très fréquente, est
odé par un simple point, leplus brefde tous lessignes.
Le prinipedu odage de Human repose sur la réation d'un arbre omposé de n÷uds.
On reherhe tout d'abord le nombre d'ourrenes de haque aratère. Chaque ara-
tère onstitue une des feuillesde l'arbreàlaquelle onassoieun poids valant son nombre
d'ourrenes. Puis l'arbre est réé en suivant un prinipe simple : on assoie à haque
fois les deux n÷uds de plus faiblespoids pour donnerun n÷ud dont le poids équivaut à
la sommedes poids de ses lsjusqu'àn'en avoirplus qu'un, laraine. On assoieensuite
par exemplele ode 0 à labranhe de gauhe et leode 1à la branhe de droite.
Le défaut du odage Human est qu'ildoit onnaître la fréquene des aratères utilisés
dansunhieravantde hoisirlesodesoptimaux.Ilfautdonliretoutlehieravantde
omprimer. Une autre onséquene est que pour déomprimeril faut onnaître les odes
etdonlatable,quiest ajoutée devantlehier, aussibien pourtransmettrequestoker,
e qui diminue la ompression, surtout pour les petits hiers. Ce problème est éliminé
par leodage Human adaptatif,qui modiesatable aulde l'analyseetqui ommene
don ave une table de base.
Exemple:Voirdiaporamapourune expliationplusdétailléeave lesétapes.Onsouhaite
oder lemot abraadabra.
On ommenepar établirtrier les lettrespar nombres d'ourrenes déroissants :
a b r d
5 2 2 1 1
L'arbre est don :
Season 01 • Episode 01 • Codage et compression
3Lettre a b r d
frequene 4 2 2 1 1
ode 0 10 110 1110 1111
Au total, onutilise
(4 × 1 + 2 × 2 + 2 × 3 + 1 × 4 + 1 × 4) = 22
bits au lieude 10aratères de 8bits soit80bits.
Codage et compression Episode Season 01 01
Document Table ASCII
Season 01 • Episode 01 • Codage et compression
5mathematique
109-97-116-104-101-109-97-116-105-113-117-101
0 1 1 0 1 1 0 1 0 1 1 0 0 0 0 1 0 1 1 1 0 1 0 0 0 1 1 0 1 0 0 0 0 1 1 0 0 1 0 1 0 1 1 0 1 1 0 1 0 1 1 0 0 0 0 1 0 1 1 1 0 1 0 0 0 1 1 0 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 1 0 1 0 1 0 1 1 0 0 1 0 1
journee
106-111-117-114-110-101-101
0 1 1 0 1 0 1 0 0 1 1 0 1 1 1 1 0 1 1 1 0 1 0 1 0 1 1 1 0 0 1 0 0 1 1 0 1 1 1 0 0 1 1 0 0 1 0 1 0 1 1 0 0 1 0 1
repos
114-101-112-111-115
0 1 1 1 0 0 1 0 0 1 1 0 0 1 0 1 0 1 1 1 0 0 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0 0 1 1
vaane
118-97-99-97-110-99-101
0 1 1 1 0 1 1 0
0 1 1 0 0 0 0 1
0 1 1 0 0 0 1 1
0 1 1 0 0 0 0 1
0 1 1 0 1 1 1 0
0 1 1 0 0 0 1 1
0 1 1 0 0 1 0 1
Codage et compression Episode Season 01 01
Document Huffman
DCODEMOI
D O C E M I
2 2 1 1 1 1
8
4
D : 2 O : 2
4
2
C : 1 E : 1
2
M : 1 I : 1
D O C E M I
00 01 100 101 110 111
0010001101110111(16 bits)
A B C D E
24 12 10 8 8
62
A : 24 38
22
B : 12 C : 10
22
D : 8 E : 8
A B C D E
0 100 101 110 111