Essai sur la théorie de l'information (logodynamique statistique)

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

J. O SWALD

Essai sur la théorie de l’information (logodynamique statistique)

Revue de statistique appliquée, tome 20, n

^o

1 (1972), p. 25-65

<http://www.numdam.org/item?id=RSA_1972__20_1_25_0>

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.

sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

ESSAI SUR LA THÉORIE DE L’INFORMATION

(Logodynamique Statistique)

J. OSWALD

Directeur

des Laboratoires de

MARCOUSSIS

(C.G.E.)

SOMMAIRE

Pages

AVANT-PROPOS 27

CHAPITRE I DEFINITIONS FONDAMENTALES RELATIVES A

L’INFORMATION ...

30

Information et états

discernables...

30

Quantité

d’information ou

énergie diacritique...

³¹

Message

^et^travail

sémiodynamique...

33

CHAPITRE II ENERGIE

DIACRITIQUE

^MOYENNE^D’UN^SYSTEME ET D’UN MESSAGE... 38

Pression

diacritique

moyenne d’un

système...

³⁸

Puissance

diacritique

d’un message - Théorème de Shannon... ^O 40 CHAPITRE III RELATIONS ENTRE ENERGIE

DIACRITIQUE

^ET TRAVAIL

SEMIODYNAMIQUE...

^o 45 Relation fondamentale... 45

Théorème... 50

Problème de Shannon... 51

Comparaison

^avec^la

Thermodynamique ...

⁵³

CHAPITRE IV DEVELOPPEMENT ET EXEMPLES SIMPLES... 55

Groupement

^ou

"multiplexage"

^desInformations ... 55

Premier

exemple

d’une distribution

simple...

56

Deuxième

exemple

élémentaire... 59

Troisième

exemple : Alphabet

Morse... 60 CHAPITRE V INFORMATION INCERTAINE : ^. CORRECTION ET

DETECTION DES ERREURS ... ^O Correction des erreurs...

Détection des erreurs ...

(3)

26

Pages

CHAPITRE VI APPLICATION DE LA THEORIE DES ERREURS

AUX MESSAGES BINAIRES ...

Système

à deux états...

Système

^à^l^étatsdifférents...

- Définition des erreurs...

- Correction des erreurs...

- Détection des erreurs...

ANNEXE 1 MAXIMUM DE H = X

pi log-. ^pi

^.

ANNEXE II DEMONSTRATION DE

L’INEGALITE

^1...

ANNEXE III ADAPTATION DU MESSAGE AU SYSTEME LORS-

QUE

^LE^NOMBRE^DE^SYMBOLES N’EST PAS IMPOSE ...

ANNEXE IV MAXIMUM DE

HI = L pi 7~jj log

^{Pi ni} ^...

ij ¹

Pi TC i j

ANNEXE V DETERMINATION DU GRADIENT SEMIODYNAMI-

QUE...

BI B LI OGRA PHI E ...

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(4)

AVANT - PROPOS

C’est courir un

grand risque

que de créer de nouveaux termes, ^surtout pour

remplacer

^ceuxque

l’usage

^a

déjà

consacrés. Les savants ne s’en

pri-

vent pas, mais il faut bien reconnaftre que l’introduction d’un mot nouveau

peut

^trouver^sa

justification

dans l’élaboration d’un nouveau

concept,

^ou^d’un

objet

^encore^inconnu.^S’il

s’agit

^au^contraire^d’un

sujet largement

^traité

par des auteurs de

premier plan,

^il^convient d’accueillir avec méfiance les

néologismes proposés

par ^un

quelconque

^ouvrierde la onzième heure.

La Théorie de l’Information a quarante ^ans

d’âge,

^si^l’on^en^{attribue -}

apparemment

^en

toute justice -

^la

paternité

^à

Hartley ^[1].

^Elle^est

majeure depuis plus

^de

vingt

ans,

grâce

^{à Shannon}^et^à

quelques

autres. Peut-on encore lui

apporter quelque

chose d’essentiel ? Il est

permis

d’en douter. On voudra bien

cependant pardonner

à l’auteur

d’y

^avoir^introduit

quelques

^mots

nouveaux,

quelquefois

pour

remplacer

^ceuxqui ^sont^enusage.

Ce n’est ni un bouleversement des

concepts,

ⁿⁱ^une^théorie

nouvelle,

que le lecteur trouvera dans les pages

qui

^suivent.^Il

s’agit

^d’unessai, qui

prend

^son

départ

^dans^une^réflexion^sur

l’analogie

^formelle^entre

l’Energé- tique

^etla Théorie de l’Information. L’une comme l’autre décrivent à

grands

traits des

phénomènes

^très

généraux,

^enn’examinant _{que le}bilan des échan- ges ^entre

systèmes,

d’où résultent diverses transformations de ces grandeurs _{que sont}

l’énergie

^d’une

part,

l’information d’autre

part.

Dès

l’origine,

la similitude entre les deux théories s’est

imposée

^aux

créateurs de la science de l’Information. Ce n’est _{pas par}

hasard,

^oupar

caprice, qu’ils

^ontintroduit des termes bien connus des

physiciens,

^telle

que

l’entropie,

pour

désigner

^la

quantité

d’information

produite

par ^{une sour-}

ce : c’est bien parce que

l’analogie

^formelle^entre^{les deux}

grandeurs - j’entends

par là la similitude des

expressions mathématiques -

leur appa- raissait avec une évidence totale. Mais sont-ils allés

jusqu’au

^{bout de}^cette

"équivalence" ? C’est

^la

question

que

je

^me^suis

posée,

^et^ilm’a bien fallu

répondre

par la

négative.

Le raisonnement suivi par Shannon ^estcelui d’un

mathématicien, l’explication, l’exploitation

^de^ses^résultats^sont^des^travaux

d’ingénieurs, d’experts

^enTélécommunications. Il manque à tout

cela,

^me

semble-t-il,

^une

comparaison permanente

^{avec une}^théorie

déjà

^bien^ancien-

ne, que les

physiciens appellent Thermodynamique Statistique.

Le résultat de cette confrontation est extrêmement

frappant :

^{les deux}

théories se

superposent

presque

complètement.

^Cesont, ^mot^àmot, ^formule

après ^formule,

^les^mêmesraisonnements, ^les^mêmes^calculs

qui sont développés

dans les deux cas. Il est alors inévitable

qu’on

^soittenté de mettre en

regard

^les

grandeurs homologues,

de vérifier leur

signification,

^de

leur donner des noms semblables.

En

premier ^lieu,

^ilm’a paru utile de donner un nom à cette science des

rapports

^entre^les

"messages"

^et^les

"systèmes"

qui

jouent respective-

ment les rôles de véhicules et de sources d’information. Les raisonnements

(5)

28

employés

sont exactement ceux de la

Thermodynamique Statistique :

^c’est

pourquoi Logodynamique Statistique

m’a paru ^un^terme

approprié, l’analyse portant

^sur^le

"langage" (logos)

^au^sens

large

^duterme, ^et^non

plus

^sur^la

chaleur

(ou plus généralement l’énergie).

Il faut bien remarquer ^aupassage que la

logodynamique

^ne

prête

^nullement^attention^aux

propriétés physiques

des circuits

électriques,

^aux

problèmes

^{de bande}passante, ^de

spectre utile,

etc... Toutes ces

questions

relèvent de la théorie

physique

^des^communica-

tions

qui doit,

^à^monsens, être

soigneusement distinguée

de la théorie abstraite et

générale qu’est

^la

logodynamique,

exactement comme l’électricité n’est pas

l’énergétique,

^encoreque les lois de l’électricité satisfassent bien évidemment aux

règles beaucoup plus générales

^de

l’énergétique.

^La

plupart

des auteurs ont, ^me

semble-t-il, mélangé quelque

peu les deux

disciplines,

.ce

qui

^ne

peut

^être

qu’une

^source^de^confusion.

Dans

l’analyse

^de

l’information,

^deux

grandeurs apparaissent, qui jouent,

à

l’évidence,

les mêmes rôles que le travail et

l’énergie

^en

thermodyna- mique.

La

"quantité

d’information" liée à la connaissance d’un

système

^n’est

rien d’autre _quele dénombrement des états discernables :

je

^lui^ai^donné le nom

d’énergie diacritique

(ou ^encore^de

pression diacritique

pour des rai-

sons

qui apparaftront

^{dans la}suite). ^C’est

l’analogie

^formelle

qui

^conduit^au

choix du mot

"énergie",

^alorsque

l’adjectif "diacritique" exprime

^{l’idée du} dénombrement

d’objets

^ou^desituations discernables. La richesse (ou ^si^l’on veut

l’encombrement)

^dumessage doit ^être

comparée

^à^untravail : c’est effectivement la

peine

que l’on se

donne,

^le

prix

que l’on paye ^la

représenta-

tion ^oula traduction de la suite des

configurations

^du

système analysé, géné-

ralement _pourla transmettre à distance. Je l’ai

appelé

^travail

sémiodyna- mique,

parce que

l’analogie

^avecle travail est

frappante,

et parce que ^ce

"travail" met en

jeu

^des

signes

^ou

symboles.

Là _encore, il semble

qu’une

confusion soit

faite,

par la

plupart

^des auteurs, ^entre

l’énergie diacritique

^et^le^travail

sémiodynamique.

^La^dis-

tinction est

essentielle, puisque

^la

dépense

réellement faite _pour

transpor-

ter l’information à distance

dépend

énormément de l’habileté de celui qui ^s’en

charge,

de la redondance

qu’il donne,

volontairement ou non, à son mode

d’expression.

Mais cette

confusion,

faite si

fréquemment,

^est^très^instruc-

tive : elle

provient

^de

l’équivalence

^entre

"l’énergie"

^et^le

"travail", principe

aussi bien

applicable

^{à la}

logodynamique qu’à

^la

thermodynamique.

Paradoxalement, j’ai

^renoncé^au^mot

"entropie",

^choisipar Shonnon pour définir la

quantité

d’information. Pourtant, ^il^est

parfaitement

exact que

l’expression mathématique

de

"l’entropie"

^{au sens}de Shannon est la même que celle de la

grandeur

^utiliséepar les

physiciens.

^On

peut

aussi mettre

en

regard

des formules

semblables,

^oùelles interviennent de la même fa- çon ^et

jouent

des rôles

homologues.

^Le^{choix du} ^mot

"énergie diacritique"

ou

plutôt

^du^mot

"pression diacritique"

^m’aparu

préférable,

d’abord parce

qu’"entropie" évoque,

par ^son

étymologie,

^une^notiond’évolution irréversi- ble _quel’on ne retrouve pas ^en

logodynamique,

ensuite et surtout parce

qu’il n’y

^a^aucunedifférence entre

"l’entropie

d’une source" au sens de Shannon et ce dénombrement des états discernables

qui,

^en

logodynamique, joue

exactement le même rôle _que

l’énergie

^en

thermodynamique.

^Comme^on

le verra, les

grandeurs

^{de la}

logodynamique

^sontdes nombres _purs,elles n’ont pas de

"dimensions",

^ce

qui

rend inutiles ^ouillusoires certaines dis-

(6)

tinctions

qui,

^aucontraire,

jouent

^un^très

grand

rôle dans les théories

phy- siques.

On rencontrera encore, dans

l’exposé,

^une

expression

que

j’ai appelée

"gradient sémiodynamique".

^{Ce terme}

désigne

^une

grandeur qui joue

^un^rôle

homologue

à celui de la

température

^en

Thermodynamique.

^Nous^verrons

qu’il

a

quelqu’importance

^et

quelqu’intérêt

pour évaluer la

répartition

du "travail

sémiodynamique"

^entreles divers

symboles qui représentent,

^dans^{un mes-}

sage, les divers états du

système analysé.

^Cettenotion,

n’a,

^mesemble-t-

il,

^été

proposée

par personne, et c’est ^unelacune

qu’il

^convientde combler.

Au terme de cette tentative de

justification

^d’une

terminologie nouvelle ,

on ne

peut échapper

^à^une

question importante : l’analogie

^entre^la

logodyna- mique

^et^la

thermodynamique

^est-elle

simplement formelle,

^{ou en}réalité

beaucoup plus profonde ? N’y

^a-t-il^pas,à défaut d’une véritable

identité,

une liaison

étroite,

de caractère

physique

^entreles deux théories ? _{Ce pro-} blème a été traité _par

beaucoup d’auteurs,

^{et L.}Brillouin lui a consacré

un livre

[III].

Il s’en

dégage

^l’idéeque la

quantité

d’information et

l’entropie

sont de même nature et

s’échangent

mutuellement. En

réalité,

^il

s’agit

^d’un

problème

^de

couplage, qui

^est

caractéristique

de la théorie de la mesure.

Toute mesure

physique

introduit nécessairement une

perturbation

^dans

le

système étudié ;

dans les cas les

plus fréquents,

^on

prélève

^une^certaine

quantité d’énergie,

^{et si}

petite soit-elle,

^on^modifiepar là même l’état d’é-

quilibre qu’il

^avait^atteint. ^Si^l’on

objecte qu’il

suffit de rendre ce

couplage

extrêmement faible _pourréduire à une valeur

négligeable

^ou

inappréciable

la

perturbation apportée, l’argument

^n’estpas

déterminant ;

^eneffet la mi-

crophysique

^montre^bienque ^{nous ne}pouvons pas réduire cet effet indéfi- niment car nous ne pouvons pas effectuer un

prélèvement

^inférieur^auquan- tum

d’énergie

élémentaire. Or si la

"quantité

d’information" que ^nouspou-

vons rechercher est une

grandeur

^tout^{à fait}

abstraite,

^de^nature

purement intellectuelle,

^son

acquisition

passe, pour tout

système physique réel,

par l’intermédiaire d’un

appareil

^de^mesure

qui

^{doit lui}^être^raccordé.^On^en déduit

qu’aucune

information ne

peut

^êtreeffectivement

acquise

^{sur un}sys- tème

physique

^sansque ^cedernier soit

perturbé ;

c’est-à-dire sans que ^son

entropie augmente.

^C’est^{en ce}sens, et en ce sens

seulement, qu’il peut

y avoir

"échange",

^{à défaut}

d’identité,

^entre

l’entropie

^et^la

quantité

d’information.

Mais il serait tout à fait erroné d’en déduire _quela

logodynamique -

théorie

abstraite,

^de^caractère

purement mathématique - pourrait

^être

plus

ou moins

incorporée

^{dans la}

thermodynamique.

Ce que ^nous

appelons

^en

Phy- sique,

^chaleur^ou

travail,

^cesont des mesures de

phénomènes observables , qui

^ontdes effets que ^nouspouvons constater par nos sens. Au contraire ce

que nous avons

appelé énergie diacritique

^ou^travail

sémiodynamique,

^ce

sont des

dénombrements,

^des

décomptes opérés

par ^unprocessus purement

intellectuel,

^sansréférence

précise

^à^un

système physique

donné. Il faut donc se

garder

^devoir, dans les définitions et les raisonnements qui ^vont suivre, ^autrechose

qu’une analogie

^formelle

qui

^est^sansdoute

frappante,

mais ne

permet

en aucune manière d’identifier cette

mathématique (élémen-

taire

d’ailleurs) qu’est

^la

logodynamique

^{avec une}branche de la

Physique.

(7)

30 CHAPITRE I

DEFINITIONS FONDAMENTALES RELATIVES A L’INFORMATION

INFORMATION ET ETATS DISCERNABLES

La notion d’information n’a de sens que si on l’associe à un ensemble d’états ou de situations

possibles prédéterminées.

^Etre

informé,

^c’est^con-

naftre, parmi

^tousles évènements

qui

^sont

potentiellement concevables,

^ce-

lui

qui

s’est effectivement

produit.

^Unmessage

n’apporte

d’information à son

destinataire _ques’il lui est

intelligible :

^celui

qu’on

^informe^adonc néces- sairement la mémoire de tous les évènements

possibles,

^etla faculté d’in-

terpréter

le message, c’est-à-dire de discerner l’événement

qui

^lui^estrap-

porté.

^Nous

parlons

de mémoire et non

d’intelligence,

^carles machines n’ont que de la mémoire : le cas

exceptionnel

^de

l’homme,

de sa faculté

d’adapta-

tion, ^de^son

aptitude ’à s’instruire,

c’est-à-dire à enrichir ses

connaissances,

de son

imagination

^et^de^son

intelligence -

^sources^de^son

pouvoir

^{créateur -}

échappe

^à^cette

description.

Il est toutefois commode de se référer à

l’exemple

^de

l’homme,

^au

moins

qualitativement.

^La

pensée joue

le rôle de la source

d’information,

le

langage

^{celui du}message. De même que la

pensée

^ne

peut

^se^communi-

quer ^sansle

langage,

^et^nesaurait pour autant être confondue avec

lui,

^la

mesure de la

quantité

d’information est inconcevable sans un

support physi-

que

auquel

^nousdonnons le nom de message. Il ^en^estd’ailleurs de même dans toute mesure

physique : chaque grandeur

^se

manifeste,

directement ou

indirectement,

^dans^un^certain^{nombre de}

phénomènes naturels,

^et^la ^me-

sure est liée à une

expérience qui

^met^en

jeu

^{l’un de}^ces

phénomènes.

La théorie moderne des communications,

plus généralement appelée

théorie de

l’Information,

^et^telle

qu’elle

^a^été

proposée

^ily ^a20 ans par C. E.

Shannon [ II ],

fait usage des ^notionsde "source d’information" et de

"voie de transmission"

(channel). Quoique

^cevocabulaire soit assez naturel et très familier aux

ingénieurs

^de

télécommunication,

^nouslui

préférons

^la notion,

apparemment plus

vague, de

"système",

^et^{celle de}

"message" -

^ce

dernier mot étant au demeurant moins

ambigu

que "voie" ou "canal"

qui

^dé-

signent déjà

communément

beaucoup

d’autres choses. En

effet, l’image

^la

plus

^commode^estcelle d’un

système,

d’ailleurs absolument

quelconque,

^sus-

ceptible

^de

prendre

^états

différents, auquel

ônâssocieûnmessage

composé

de

signes

^ou

symboles caractéristiques

de chacun de ces états. Il reste à donner une définition

quantitative

de l’information

permettant

d’identifier sans

ambiguité

^lasuccession d’états de ce

système,

ainsi que du _{coût que}

repré-

sente l’émission du message

qui

lui

correspond (1).

---

(]) Dans toute cette étude, ^nous^nouscontentons d’analyser ^le^casd’un nombre fini d’états discrets, auquel ^on^cherchegénéralement ^à^ramener^celuiplus complexe

des grandeurs variant de façon ^continue.

(8)

QUANTITE

D’INFORMATION OU ENERGIE

DIACRITIQUE

L’information

permet

de discerner les états du

système,

c’est-à-dire de connaftre la situation dans

laquelle

^il^se^trouve^àtout moment. Il est raisonnable d’admettre que la

quantité

d’information associée à un

symbole

est une fonction croissante du nombre d’états différents entre

lesquels

^ilper- met de

choisir,

^car

plus grand

^estle nombre d’états

possibles, plus

^lepro-

cessus d’identification de l’état effectivement réalisé est laborieux.

Un raisonnement

simple,

d’ailleurs

classique, permet

d’établir la fonction du nombre d’états discernables

qui peut

^être

judicieusement

associée à la

"quantité

d’information".

Considérons un

système

^S

pouvant prendre

^l ^états

distincts,

^et^asso-

cions un

signe

^ou

symbole

si à chacun de ces états. Nous

appellerons

q = f

(l)

la

"quantité

d’information"

correspondant

^à

l’apparition

^de^ce

symbole(1).

^Si

l’évolution du

système

^Sle conduit à

prendre

successivement n états diffé- rents, ^il^en^résultera

l’affichage

^deⁿ

symboles successifs,

choisis dans l’ensemble

(s 1,

S2, ... ,

sd.

^Si

l’apparition

^d’un

symbole

sk

correspond

^à^une

quantité

d’information

f (1), l’apparition

successive de deux

symboles

^indé-

pendants s~

^etsl

correspond,

par ^uneconvention dont la raison d’être est

évidente,

^à

f (1)

⁺

f (1) =

²

f (1) (Principe

de l’additivité de

l’information).

Or,

il est

possible d’employer

^une^autre^méthodepour identifier l’état du

système.

^{Au lieu}d’associer à

chaque

^état^un

symbole

déterminé appartenant à l’ensemble

(sl,

^...,

sl),

^on

peut imaginer

^unclassement a

priori

des états

possibles

^endeux classes

CI

^et

C2,

chacune de ses classes étant elle-même constituée de deux

sous-classes,

^{et ainsi}de suite. Ce

procédé dichotomique permet

^uneidentification de

proche

^en

proche,

^comme^{dans le}

jeu

de société dans

lequel

^on

procède

par questions ^et

réponses,

^ces^der-

nières étant restreintes à oui ou à non. Comme

f (1)

^est"l’information" liée à l’identification d’un

symbole,

êtênâdmettantque

chaque

^classe^{et cha-}

que sous-classe

puissent

^être^divisées^en^deux

parties égales,

^leprocessus

dichotomique

^estcaractérisé _parles relations suivantes,

qui

^tiennent

compte

du principe d’additivité :

(1)

D’où :

(2)

(1) Nous supposons implicitement que la quantité d’information f (1) ^nedépend pas du

symbole qui est apparu, ^cequi ^estlégitime ^si^les^{états de}système (S) sont équi- probables. ^Le^casplus complexe ^des^{états de}probabilités différentes est traité

au Chapitre ^II.

(9)

32

qui

^s’écrit^{encore :}

La fonction

f (x), qui

satisfait à la relation fonctionnelle

(3),

^est^manifeste-

ment la fonction

logarithme

^{de base}^{2 :}

f(x) = log2 (x).

Ceci revient à dire que l’identification d’un état

parmi

^l

possibles peut

être faite par le nombre ^m^dechiffres binaires le

plus

voisin, par

excès ,

de

log2

^l. ^Dans^ces

conditions,

l’information liée à l’émission de n

symbo-

les successifs sera :

en

désignant

par

log

^le

logarithme

^naturel.

De même que l’unité de

surface,

^en

géométrie,

^aété liée à la

figure

la

plus simple

que l’on

puisse imaginer,

^à^savoir^le

carré,

^de^même^l’unité d’information a été rattachée au

symbole

^le

plus simple possible,

^{l’élément}

binaire, qui permet

^la

discrimination,

c’est-à-dire le choix le

plus

^som-

maire :

négation

^ou

affirmation,

^existence^ouinexistence. Dans ces conditions, la base _{2 pour}les

logarithmes s’impose naturellement,

^et^{l’élément} binaire

correspond

^{à la}

plus petite quantité

d’information concevable.

Par seul souci de

simplification

dans l’écriture des relations mathé-

matiques,

^nous

emploierons pourtant,

^{dans la}^suite^de

l’exposé,

^le

logari-

thme naturel

(1),

^en^{écrivant :}

Par convention, ^nous

exprimerons Q

^en

"logons" :

1 élément

binaire = 0, 69 logons -

0, ⁷

logon.

Il

n’y

^aévidemment aucune difficulté à _passerd’une unité à l’autre.

La relation

(5) exprime

^en

quelque

^sortela définition

quantitative

^de l’information. Il est

important

de remarquer que

Q comporte

²^facteursⁿ

et

log l,

^ce

qui suggère

^une

analogie

^formelle^entrel’information et l’éner-

gie.

^En

effet,

ⁿ

peut

^être^considéré^commele facteur

appelé quelquefois

"d’extensité" ou de

"capacité" :

^il

joue

^le^même^rôleque la

quantité

^d’élec- tricité dans

l’expression

^de

l’énergie électrique,

que le volume V dans l’ex-

pression pV

du travail d’un gaz, que le

déplacement

dans le travail d’une

force,

etc.

L’expression logl

^est^au^contrairele facteur "d’intensité"

(ou d’équilibre) homologue

^du

potentiel électrique,

^{de la}

pression,

^{de la}

force,

etc. Il est en effet à _peu

près

^intuitifque la

quantité

d’information doit con-

tenir ces deux facteurs : il

y a le

nombre d’informations

partielles

^recueil-

lies,

êtîly âla "richesse"

qui

^contientchacune de ces informations _par-

tielles, qui

^estmesurée par le facteur

logl.

--- - ---

(1) ^Onpourrait tout aussi bien poser Q ^{= n}

log2t -

^Kⁿ^{log 1,}^avec

^IC

^{1 =}log 2. ^Nous

allègerons

l’écriture en choisissant le logarithme ^naturel^commeunité, ^cequi ^conduit à K = 1.

(10)

Par

définition,

le facteur n sera

appelé

^volume

d’information,

et il est

exprimé

^en^nombrespurs ; le facteur

logl

^l^sera

appelé pression diacritique ,

et la

quantité Q

⁼ⁿ

log

^l^seraconsidérée comme une

énergie diacritique (1).

La

pression

^et

l’énergie diacritiques s’expriment,

^parconvention, ^en

"logons"

(ou ^si^l’onveut, ^enéléments

binaires).

Ces définitions

appellent

^deuxremarques très

importantes.

La pre-

mière,

^c’estque

l’énergie diacritique ^Q

^{dont il}^vient^d’être

^question

^carac-

térise l’information elle-même associée au

système (ou

^{à la}

"source")

indé-

pendamment

^de^son

support physique

^ouvéhicule constitué par le message . Si ce dernier est

indispensable

à la manifestation de l’évolution du

système étudié,

il ne saurait se confondre avec

lui,

pas

plus

que la

pensée

^ne

peut

s’identifier au

langage.

^Nousreviendrons abondamment sur ce

point

dans la suite de

l’exposé.

La deuxième remarque est que les deux facteurs "volume" et

"pression diacritique"

^sont^sansdimension. Il en résulte _quele volume d’information n’a de

signification

^réelleque si le

type

d’états discernables est bien défini . On

peut parfaitement

^{écrire :}

Q =

ⁿ

log

^{1 =}

log (Zn) = log

L ; ^si^la^succession de n états donnés est considérée comme un évènement

unique, Q

^devient la

"pression diacritique" log

^L^associéeau nouveau

symbole complexe qui

lui est affecté et

qui peut prendre

^Lvaleurs différentes. Il

n’y

^a^donc^au-

cune différence de nature entre

"pression"

^et

"énergie" diacritiques.

MESSAGE ET TRAVAIL

SEMIODYNAMIQUE

Le message, véhicule de

l’information, possède

^une^structure

plus

^ou

moins

complexe ;

^il

peut

^êtrelimité dans le

temps,

^donc

posséder

^un^"for-

mat" ou être

"fluent",

c’est-à-dire sans limitation de durée : mais il _pos- sède

toujours

^une^certaine

organisation.

Nous

appellerons

^élément

primaire

^la

plus petite

^fractionque l’on

peut

isoler

"physiquement"

dans le message. Aucun élément identifiable ^n’ade durée

plus

^courte. ^Cetteentité n’a

néanmoins,

dans

beaucoup

^decas, ^au-

cune

signification

propre, ^carelle ne

correspond

pas nécessairement à une

information utilisable.

Nous

désignerons

^sous^le^nom^de

symbole

^la

plus petite

fraction du message

ayant

^une

signification,

c’est-à-dire

correspondant

^à^un^{état du}sys- tème. La

réception

^du

symbole apporte

^une

information,

^car^elle

peut

^être

interprétée

^commeaffirmant l’existence d’une situation

appartenant

^au^cata-

logue

des situations

possibles.

L’ensemble des

symboles

utilisables constitue

l’alphabet.

Les

groupements

^de

symboles

^seront

désignés

^sous^des^noms

divers ,

tels _que

"mot", "séquence"

^ou

"message".

^Onréservera les

expressions

"mot" et

"message"

^aux

assemblages ayant

^une

signification,

c’est- à-dire

appartenant

^à^unensemble ordonné et

cohérent,

tandis que

"séquence"

^dé-

---

(1) ^Le substantif "diacrisis" signifie ^engrec : distinction, ^caractèrediscernable C’est bien la signification profonde ^{de la}"quantité d’information" qui ^est^{une me-}

sure de la possibilité de choix associée à un jeu ^desymboles.

(11)

34

signera plutôt

^une^suite

comportant

^unnombre arbitraire de

symboles,

^suite

qui

est souvent

dépourvue

^de

signification

parce

qu’elle échappe

^à^un^clas-

sement.

Il est

important

de revenir sur la notion

d’alphabet.

^Si^onle suppose constitué de ^l

symboles différents,

^il^estnécessaire de

définir :

a)

^Comment^ces

symboles

^sedifférencient les uns des autres.

b)

^A

quelles règles d’assemblage -

^ou^si^l’on^veut^à

quel "langage"

ils obéissent.

La différenciation des

symboles

résulte de la nature des

signaux qui

leur sont affectés. Les

caractéristiques

^les

plus

couramment utilisées sont

l’amplitude

^et^la^durée.^Dans^lecas, considéré ici, d’un nombre fini d’états

discrets,

la discrimination _par

l’amplitude ⁽¹⁾ correspond

à la définition de niveaux

"quantifiés"

discernables les uns des autres. Il faut évidemment en-

visager

^au^moins^deux^niveauxdifférents _pour

pouvoir distinguer

^les

symbo-

les.

Lorsque

la discrimination se fait _parla

durée,

^on^affecte

généralement

à cette dernière des valeurs

multiples

d’un intervalle de

temps élémentaire ,

mais cette contrainte n’est pas absolue.

La notion d’intervalle de

temps

élémentaire T

jouera

^un^rôle

important

par la suite. On

désigne

par ^ceterme le

plus petit

intervalle

significatif ,

et il

dépend,

^nonseulement des

symboles,

^mais^{de leurs}

règles

^d’assem-

blage.

Précisons-le _parun

exemple :

Considérons un

alphabet comportant

³

symboles

_{si’ s2,} S3’ dont les durées

respectives

sont, ^{avec une}^{unité de}

temps arbitraire, égales

^à2, ^{3 et}5 ; supposons de

plus

que si ^{a une}

amplitude égale

^à

zéro,

tandis que s2 ^ets3 ont une

amplitude égale

^{à 1.}^Si^la

règle d’assemblage

^consiste^à

toujours

faire suivre le

symbole

S2 du

symbole

Si, le

temps

élémentaire est

égal

^à 2, ^car^{c’est le}

plus petit

intervalle de

temps qu’il

^faut^savoir^évaluerpour

ne pas confondre s2 ^avecs3. ^Si^au^contraire^la

règle d’assemblage

^consiste

à

prohiber

^la ^suiteS2 s3,

qui

^estindiscernable de s3 S2, mais à admettre la suite s2 s 2’ le

temps

élémentaire a pour valeur 1,

puisqu’il

^faut

pouvoir distinguer

s2 s 2 de durée ⁶de s3 dont la durée ^{est 5}

(Bien entendu,

^dans

un tel _cas,il faudra

prohiber

^d’autres

combinaisons,

^commeS2 S2 S2 S2 S 2

qui

^estindiscernable de s 3 s 3

s 3 ) .

On voit donc que le

temps

élémentaire ^T

dépend

^nonseulement de la durée des

symboles,

mais aussi de leurs

règles d’assemblage. Lorsque

les

symboles

^ne^sedifférencient _{que par}

l’amplitude,

^le

temps

élémentaire est le

plus petit

intervalle

séparant

^deux

changements

^de^niveausuccessifs.

Donner un

alphabet,

^c’estdonc définir un ensemble de

symboles

^ainsi

que leurs

règles

élémentaires

d’assemblage,

c’est-à-dire les suites discernables

composées

à l’aide de ces

symboles.

Définition : Etant donné un

alphabet

^et^ses

règles d’assemblage,

^le

temps

élémentaire ^Tassocié à cet

alphabet,

^est^le

plus petit

intervalle de temps

qui

^doit

pouvoir

^êtrediscriminé _{pour que}deux

séquences

distinctes de même durée soient discernables. L’inverse w =

1/T

^estla

"rapidité

de modulation "

associée à

l’alphabet.

---

(1) Ôuêncorepar la phase, ^lafréquence, êtc...

(12)

Nous allons maintenant associer au message ^une

grandeur quantitative qui

^soit^en

quelque

^sorte^la^mesure^{de la}

dépense

^effectuée^entransmettant de l’information. Il est évident _quela

correspondance

^entrel’information à transmettre, qui résulte de l’évolution du

système (énergie diacritique)

^et le message

choisi,

^n’estpas stricte. On

peut

^en^effet

employer

^un^message

inutilement

long

pour

communiquer

^uneinformation très faible : chacun sait

qu’un

^écrivain^{ou un}^orateurn’est pas

toujours

^très^concis.Donc, ^{le dis-}

cours ou le message

correspondent

^à^un^certain

"travail",

^àune certaine

"dépense", qu’on

^ne

peut identifier, purement

^et

simplement,

^avec^l’infor-

mation transmise.

A la suite des travaux de

Nyquist

^et^de

Hartley [ I] ,

^il^a^été^reconnu^que

ce travail

pouvait

^être^considéré^comme

proportionnel

^au^nombre^maximal

"d’éléments

primaires"

que

comporte

le message.

Or,

^{l’élément}

primaire,

a, par

définition,

^unedurée ^T=

1 /w ;

^ily ^adonc w éléments _parunité de

temps,

^etle "travail" E

accompli pendant

^un

temps

^T

peut

^se^mettre^sous la forme :

(6)

^{E = K}^x^wT

Nous

appellerons

^E^le^travail

sémiodynamique

^{de la}

séquence

^de

durée T(1 ) .

Nous allons

expliciter

le facteur K

qui

^aété introduit dans la formule

(6) ;

^mais

auparavant,

^faisons^uneremarque ^surla définition du travail sé-

miodynamique.

Le

concept

que ^nous^avonsintroduit ne fait pas intervenir la structure

particulière

^{de telle}^ou^telle

séquence

^ou^{de tel}^outel message : il ^ne^met

en

jeu

que le nombre "d’instants élémentaires" contenus dans un intervalle de

temps

^T.^En

effet,

^{c’est la}^cadence^ou^variation^de^niveau^la

plus

^ra-

pide

que l’on

peut

rencontrer dans une

longue séquence qui

^estle critère de

"dépense"

^ou^de^travail

accompli,

^ladurée étant le deuxième facteur à

prendre

^enconsidération. C’est

pourquoi

^onintroduit la

rapidité

de modulation ou "vitesse de

manipulation"

^w.^Il^est^bien^connuque cette vitesse est liée à la bande

passante A

^{f de la}^voie^decommunication utilisée : mais la relation entre w et ~ f est d’un autre

ordre,

elle

relève,

^non^de^ce que ^nous

avons

appelé

^la

"logodynamique",

^maisde la théorie

physique

^{de la} ^trans-

mission et de la

réception

^des

signaux électriques.

^Dans^un^souci^de

géné- ralité,

nous conservons ainsi à la notion de

"message"

^son^caractére^abs- trait, ^{en ne}^leconfondant _pasavec le

support physique

^le

plus

^communqui est la voie de communication. C’est une des raisons pour

lesquelles

^nous

avons

adopté

^cette

terminologie.

Revenons maintenant au facteur _{K pour}le

préciser.

^Il^est^commode de

pouvoir

comparer la

grandeur

E, que ^nous^avons

appelée

travail sémio-

dynamique

du message, à la

grandeur Q qui

^est

l’énergie diacritique

^dusys- tème.

Or,

^wTest le nombre d’éléments

primaires

que contient l’intervalle T, et pour que KwT soit de même nature

(2)

_que_E,_{il faut}_{que K}

puisse

---

(1) ^De"seméion", signe. Êcaractérise essentiellement le nombre maximal de signes ôuéléments, de durée minimale ^Tqui peuvent ^{être mis}ênjeu pendant ûn temps ^T.

(2) ^Nousparlons ^de"nature", c’est-à-dire de forme, et non de "dimension", puisque

E comme Q sont des nombres purs, dépourvus ^de^dimension.

(13)

36

être considéré comme une

pression diacritique,

ainsi que le montre la formule (5). ^Nous

désignerons

par ^vla valence de

l’émission,

c’est-à-dire le nombre de niveaux que l’on

peut

rencontrer dans l’ensemble des

séquences

constituées à

partir

^de

l’alphabet utilisé,

^et^nous

prendrons,

par

définition ,

K =

log

^v. ^Avec^cette

convention, l’expression

du travail

sémiodynamique

E d’une

séquence

de durée T a pour valeur :

Ce choix va être

justifié

par ^un

exemple particulièrement simple, qui

^met

en évidence

l’équivalence

^de

l’énergie diacritique

^et^du^travail

sémiodyna- mique.

Considérons un

système (S) pouvant prendre

^l ^états

différents,

^et^ob-

servons une suite de N états successifs

pris

par le

système. L’énergie

^dia-

critique

^mise^en

jeu

^{est N}

log l, qui peut

^encore^{s’écrire :}

est le nombre d’éléments binaires nécessaire _pouridentifier un état donné

parmi 1.

A la succession des N états

pris

par le

système,

^on

peut

^faire^cor-

respondre

^unmessage

binaire,

de

rapidité

de modulation w. Ce message de durée T aura

fourni,

^sansomission ni

répétition,

l’information relative à la succession des N états de S, ^s’il

comporte

^unnombre N’ d’éléments binaires tel _{que :}

Donc :

(10)

^N

log

^{1 =}^mN

log

^{2 = wT}

log

^2.

(10)

^N

log

^{1 =}^mN

log

^{2 = wT}

log

^2.

La formule

(10)

^n’est

qu’un

^cas

particulier,

^obtenupour ^{v =}2

(émission bivalente)

de la formule

générale (7).

Il y ^adonc bien

"équivalence"

^entre

énergie diacritique

^ettravail sé-

miodynamique.

Cette

équivalence

^estdémontrée dans le cas

général,

^si^on^observe

qu’on peut toujours

transformer un message de valence ^v

(v

>

2)

^{en un}^message binaire

équivalent

^de

rapidité

de modulation w’ = w, ^en

posant :

ou encore :

(11)

(14)

Remarquons

^enoutre que, ⁿet n’ étant des "facteurs d’extensité" ana-

logues

^{à des}

volumes, log

^v^et

log

²^des

"pressions diacritiques",

^la^for-

mule

(11)

^estformellement semblable à la relation des gas

parfaits :

Toutes ces

analogies

^entre

l’énergie

^etl’information

justifient

^la^ter-

minologie employée ;

par

surcroît,

nous verrons

plus

^loinque les mêmes

ty-

pes de raisonnement interviennent dans l’établissement des relations entre les

grandeurs.

^Elles^ne^doiventpas néanmoins faire

perdre

^de^vue

l’aspect purement

^{formel de}

l’analogie.

^En

effet,

^en

thermodynamique, l’équivalence

entre le travail et la

chaleur,

la loi de Mariotte, etc. , résultent de

l’expé-

rience. Au

contraire,

^en

logodynamique,

les relations se déduisent

simple-

ment de transformations

mathématiques élémentaires,

^car^il

s’agit de

grandeurs

dépourvues

^de

dimensions,

^et c’est là ^unedifférence très

profonde

entre les deux théories

(1).

(1) Îlênest exactement de même dans la comparaison classique êntrela "limitation

temps-fréquence" ^d’unsignal ^et^leprincipe d’incertitude d’Heisenberg. ^Dans^le premier cas, il s’agit ^d’unesimple propriété mathématique ^{de la} transformation de Fourier, alors que le deuxième constitue un véritable principe ^{de la}physique corpusculaire.

(15)

38 CHAPITRE II

ENERGIE

DIACRITIQUE

^MOYENNE^D’UNSYSTEME ET D’UN MESSAGE

Le

chapitre qui précède

^aété consacré aux définitions

fondamentales ;

il a

permis

^de

préciser

^la^notion

d’information,

^sous^saforme

d’énergie

^dia-

critique

^oudénombrement d’états discernables. Mais les considérations

qui

ont été

développées

concernent en

quelque

^sortel’information

"statique"

^ou

"potentielle"

^du

système :

richesse d’information d’un

symbole pris parmi

^l

possibles, dépense

^effectuée^enfonction de la

rapidité

de modulation et de la valence du

signal.

^Nous^allonsmaintenant aller

plus loin,

^enévaluant la

quantité

d’information

qui

^estoffectivement associée à l’évolution d’un sys-

tème,

ainsi que celle

qu’est

effectivement

susceptible

de véhiculer un mes-

sage,

compte

^tenu^de^sa^structure.

PRESSION

DIACRITIQUE

^MOYENNED’UN SYSTEME

Soit un

système (S) susceptible

^de^setrouver, ^à^un^instant

donné,

^dans

un état

(Sk) déterminé, parmi

^l états différents admissibles. Examinons son

évolution en l’observant N fois de suite. Si N est très

grand,

^le

système (S)

^a

pris

^tousles états

possibles :

supposons

qu’il

^ait

pris

^ai^fois^l’état

(sl),

a2 fois l’état

(S2),

^..., a ~ fois l’état

(s~).

^On^{aura :}

(12)

al + a2 +... + a~ = N

Si nous

appelons configuration

l’ensemble des N situations examinées successivement, ^{le nombre}

P (N)

^de

configurations possibles

^apour valeur :

P

(N)

est le nombre de

configurations

discernables :

d’après

la définition don- née au

chapitre précédent, log

^P

(N)

^est

l’énergie

^ou

pression diacritique

d’une

configuration.

Si N est très

grand,

^les^ai^sonteux-mêmes très

grands,

^et

on peut

déterminer la valeur

asymptotique

^de

log

p ^enfaisant usage de la formule de

Stirling,

réduite à son terme

principal :

log

^{x : =}^x

log

^{x - x}

On en déduit :

ou encore,

Essai sur la théorie de l'information (logodynamique statistique)

R EVUE DE STATISTIQUE APPLIQUÉE

J. O SWALD

Essai sur la théorie de l’information (logodynamique statistique)

Revue de statistique appliquée, tome 20, n

1 (1972), p. 25-65

ESSAI SUR LA THÉORIE DE L’INFORMATION

(Logodynamique Statistique)

J. OSWALD

des Laboratoires de

(C.G.E.)

Pages

L’INFORMATION ...

discernables...

Quantité

énergie diacritique...

Message

sémiodynamique...

DIACRITIQUE

diacritique

système...

diacritique

DIACRITIQUE

SEMIODYNAMIQUE...

Comparaison

Thermodynamique ...

Groupement

"multiplexage"

exemple

simple...

exemple

exemple : Alphabet

Pages

Système

Système

pi log-. pi

L’INEGALITE

QUE

HI = L pi 7~jj log

Pi TC i j

QUE...

grand risque

remplacer

l’usage

déjà

pri-

peut

justification

concept,

objet

s’agit

sujet largement

premier plan,

néologismes proposés

quelconque

d’âge,

apparemment

toute justice -

paternité

Hartley [1].

majeure depuis plus

vingt

grâce

quelques

apporter quelque

permis

cependant pardonner

d’y

quelques

quelquefois

remplacer

concepts,

nouvelle,

qui

s’agit

prend

départ

l’analogie

l’Energé- tique

grands

pi log-. ^pi

Hartley ^[1].

après ^formule,

premier ^lieu,