Architecture Opérateurs Arithmétiques

(1)

Additionneurs

(2)

Rappel sur l'écriture des entiers en base 2

• Entiers positifs

• Entiers relatifs (complément à 2)

2

 

⁰^,¹ ^,



⁰^,² ¹



, 2

1 0









^



i n n i

i

i a A

a A

  ⁰ ^, ¹ ^,  ² ^, ² ¹ 

, 2

2

² ¹ ¹

0 1

1

    





^ ^ ^







ⁿ ⁱ ⁱ ⁿ ⁿ

i

i n

n

b b B

b

B

(3)

Additionneur "Full Adder" (FA)

C_i+1

A_i B_i

C_i

S_i

C

_i+1

= A

_i

B

_i

+ A

_i

C

_i

+ B

_i

C

_i

= majorité(A

_i

,B

_i

,C

_i

) C

_i+1

= A

_i

B

_i

+ C

_i

( A

_i 

B

_i

)

S

_i

= A

_i 

B

_i 

C

_i

000 0 0 001 0 1 010 0 1 011 1 0 100 0 1 101 1 0 A

_i

B

_i

C

_i

C

_i+1

S

_i

La somme pondérée de ce qui entre est égale à la somme pondérée de ce qui sort :

A

_i

+ B

_i +

C

_i

= S

_i

+ 2 * C

_i+1

(4)

I- Additionneur à propagation de retenue

4

C

_i+1

= 1 si retenue

Ci+1 = AiBi + AiCi + BiCi C

_o

=0

A

₀

B

₀

A

₁

B

₁

A

₂

B

₂

A

₃

B

₃

C

₀

C

₁

C

₂

C

₃

C

₄

S

₀

S

₁

S

₂

S

₃

Ci+1 = AiBi + Ci ( Ai



Bi) Si = Ai



Bi



Ci

S = A + B

A=A₃A₂A₁A₀ B=B₃B₂B₁B₀

S=R S₃S₂S₁S₀

• La retenue se propage à travers tous les étages

• Délai = O(n)

(5)

000 0 0 001 1 1 010 1 1 011 1 0 100 0 1 101 0 0 110 0 0 111 1 1

Ci+1 = 1 si retenue AiBiCi Ci+1 Si

Ci+1 = AiBi + AiCi+BiCi

Co=0

0 1 1 1

00 01 11 10 0

Ai BiCi

Ci+1

S i = Ai  Bi  Ci

A₀B₀ A₁B₁

A₂B₂ A₃B₃

C₀ C₁

C₂ C₃

C₄

S₀ S₁

S₂ S₃

+ - + - + - + -

Soustracteur

S = A - B

S=R S₃S₂S₁S₀

(6)

A₁B₁ A₂B₂

A₃B₃

C₂ C₃

C₄

- - -

A₀B₀

C₀=0 C₁

-

S₀ S₁

S₂ S₃

si A>B alors C

₄

=0 si A<B alors C

₄

=1

+ - + - + - + -

Ci+1

Ai Bi

Ci

Si

Soustracteur

Ci+1 = AiBi + AiCi + BiCi Ci+1 = AiBi + Ci ( Ai  Bi)

S i = Ai  Bi  Ci

(7)

Ci+1

Ai Bi

Ci Ai Bi

Ci+1 Ci

Ci+1 = AiBi + Ci ( Ai  Bi) S i = Ai  Bi  Ci

A

_i

B

_i

C

_i

C

_i+1

-

A

_i

B

_i

C

_i

C

_i+1

+

+ -

Soustracteur

(8)

A₁B₁ A₂B₂

A₃B₃

C₂ C₃

C₄

- - -

A₀B₀

C₀=0 C₁

-

S₀ S₁

S₂ S₃

C₂ C₃

C₄

+ + +

A₁B₁ A₂B₂

A₃B₃ A₀B₀

C₀=0 C₁

+

S₀ S₁

S₂ S₃

+ - + - + - + -

Soustracteur

(9)

II- Additionneur à sélection de retenue

(carry select adder CSA)

Idée : on sélectionne la retenue sortante à l'aide de la retenue entrante

La retenue entrante ne se propage pas à travers les FA

 on dispose de temps pour la calculer

(10)

Cellule de CSA

Ci+1 = AiBi + Ci ( Ai



Bi)

10

Si = Ai



Bi



Ci

(11)

Carry select adder CSA : Délai n

^1/2

01

 

₁

2 1 1

....

5 4 3 2

1

 









 ^



^ ⁱ ^ ^

n

n n

n n 2

2 2 2 2

1 9 2 8

2 ²    











  

0

t2 t2

t3 t2

t3 t4

t2 t3

t4 t5

t3 t4

t5 t6

t1 t1

t1 t2 t1 t1

(12)

Première cellule d'un bloc CSA

• x

12

Ci+1 = AiBi + Ci ( Ai



Bi)

Retenue1 = AiBi + 0 ( Ai



Bi) = AiBi Retenue2 = AiBi + 1 ( Ai



Bi) = Ai+Bi

01

(13)

III Additionneur à retenue bondissante (Carry Skip Adder)

• Idée :

Si A_i=B_i=0, C_i+1=0 : pas de retenue quelque soit C_i

Si Ai=Bi=1, Ci+1=1 : il y a forcément une retenue, quelque soit Ci

Si Ai≠Bi, , la retenue sortante de l’ étage i est égale à la retenue entrante

• Par blocs de p bits :

– De même, la retenue sortante de l’ étage i est égale à la retenue entrante si et seulement si les Apbits sont les inverses des Bpbits

01101

+ 10010

+ Cin ---

Cin Somme

– Dans les autres cas, la retenue sortante peut être calculée indépendamment de la retenue entrante

(14)

Carry Skip ADDER

14

A_i,B_i, i=23,…,16 A_i,B_i, i=15,…,8 A_i,B_i, i=7,…,0

&

calcule : (A₀  B₀).(A₁  B₁)…. (A₇  B₇)

Interprétation : Propagation de la retenue entre 0 et 7 Temps de calcul : plus long temps de propagation d’ une retenue :

une retenue se propage depuis le rang i où elle est générée (et pour lequel Gi=1) jusqu’ au rang où la retenue suivante est générée

Un bloc est constitué d’ un additionneur à propagation de retenue et d’ un « circuit » détectant si pour chaque bit i du bloc on a Ai≠Bi,

C

_n

+

&

P23

+

&

P15

C

₀

+

&

P7

(15)

Remarques

• les signaux ne servent pas pour calculer la retenue (que la somme)

• Les signaux peuvent être calculés en parallèle

Carry Skip ADDER

C

₀

C

_n

+

&

P23

+

&

P15

+

&

P7

(16)

Carry Skip ADDER

16

+ &

• Temps de calcul

– pire cas : le retenue est générée au premier bloc, « saute » les blocs suivants et traverse le dernier bloc pour calculer la somme

(17)

Taille des blocs

• Hypothèse: Groupes de même taille k , m=n/k groupes , k et n/k entiers

• k sélectionné pour minimiser le temps de la plus longue

chaîne de propagation

temps de traversée d’ un bloc de k additionneurs 1 bit : t1*k

temps de propagation à l'aide des comparateurs: t2 ("mux") Temps total (pire cas) : 2t1k + (m-2)t2 = 2 t1 * n/m +

(m-2) * t2

• Il suffit de déterminer où cette fonction est minimale.

(18)

Carry Skip ADDER : taille des blocs

Sous hypothèse 1 : le temps de propagation à travers les comparateurs est constant

soit f(x) : 2*t1*n/x + (x-2) * t2 minimum pour x₀ = (2*n*t1/t2)^1/2

f convexe sur R⁺=> m optimal : 2 valeurs entières qui encadrent x₀

Temps total = O(n^1/2)

exemple : additionneur de 60 bits, t1=t2 => x₀=120^1/2=10,95

 m = 10 ou m =12

 10 blocs de 6 bits ou 12 blocs de 5 bits

18

(19)

Carry Skip ADDER : taille des blocs

• Hypothèse: Groupes de même taille k , m=n/k groupes , k et n/k entiers

• k sélectionné pour minimiser le temps de la plus longue

chaîne de propagation

• Notations:

– tr - temps de propagation de la retenue sur un seul bit

– ts(k) – Temps pour sauter un groupe taille k (la plupart du temps - indépendant de k)

– tb – délai du "MUX" entre 2 groupes

– Ttotal – temps total de propagation de la retenue – lorsque la retenue est générée à l'étage 0 et se propage jusqu'à l'étage n- 1

• La retenue se propage dans les étages 1,2, … ,k-1 du groupe

1, saute les groupes 2,3, … , m-1, et se propage dans le

groupe m

(20)

Carry Skip ADDER : taille des blocs

• T

^total

=(k-1)t

^r

+t

^b

+(m-2)(t

^s

+t

^b

)+(k-1)t

^r

• Exemple - implémentation 2 niveaux

– tr = ts+tb = 2



^G (



^G = délai d'une porte) – Ttotal=(4k+2

n

^/k-7)



^G

• En dérivant T

total par rapport à

k et en égalisant à 0 -

• k

^opt

^{= } ⁿ ^/

²

• Taille des groupes et temps de propagation de la retenue proportionnel à  n - idem carry-select adder

• Exemple : n=32, 8 groupes de taille kopt = 4 est la meilleure solution

• Topt=25 

^G

au lieu 62 

^G

pour un additionneur à propagation de retenue

20

(21)

Accélération

• Taille du premier et dernier groupe plus petite que la taille fixée k – le temps de propagation de la retenue dans ces groupes réduit

• Taille des groupes centraux augmentée – puisque le temps de

"saut" est à peu près indépendant de la taille du groupe

• Autre approche : ajouter un second niveau pour permettre le saut de deux ou plusieurs groupes en une étape (plus de 2 niveaux possible)

• Algorithmes existants pour déterminer les taille de groupes optimales pour différentes technologies et implantations (càd différentes valeurs du ratio (ts+tb)/tr)

(22)

Groupes de taille variable

• A l'inverse du cas des groupes constants – on ne peut se restreindre à l'analyse du pire cas de la propagation de la retenue

• Peut mener à la conclusion triviale : le premier et le dernier groupe composé d'un seul étage (1 bit) – les n-2 étages restants constituant un seul groupe central

• La retenue générée au début du groupe central peut se propager à travers les autre n-3 étages – et par là devenant le pire cas

• On doit donc considérer toutes les chaînes de retenue démarrant à n'importe quelle position arbitraire de bit a (avec

x

^a

=y

^a^{) et}

s'arrêtant à b (

x

^b

=y

^b^),position à laquelle une nouvelle chaîne de retenue (indépendante de la précédente) commence. (X et Y opérandes)

22

(23)

Optimiser les taille de groupe

• k1, k2, … , kL – tailles des L groupes – avec

• Cas général : Chaîne commençant dans le groupe u, finissant dans le groupe v, sautant les groupes u+1, u+2, … ,v-1

• Pire cas - retenue générée à la première position dans u et finissant dans la dernière position dans v

• Le temps de propagation de la retenue est : n k

L i

i 



1







 Tcarry u v Minimiser max ( , )



^













¹

1

).

1 (

) )

( ( ).

1 (

) ,

(

^v

u l

r v

b l

s b

r

u

t t t k t k t

k v

u Tcarry

• Nombre de groupes L et tailles k1, k2, …, kL sélectionnées de telle façon que la plus longue chaîne de propagation de la retenue soit minimale

• Solutions algorithmiques développées - programmation dynamique

(24)

Optimisation - Exemple

• additionneur 32-bit avec un seul niveau de saut

• t

^s

+t

b

=t

r

• Organisation optimale - L=10 groupes de taille k

¹

,k

²

,…,k

¹⁰

= 1,2,3,4,5,6,5,3,2,1

• Résultat T

^carry

 9 t

r

• Si t

^r

=2 

^G

- T

^carry

 18 

^G

au lieu 25 

^G

pour des groupes de taille égale

• Exercice: Montrer que toute paire de position de bits dans deux groupes quelconques u et v ( 1  u  v  10 )

satisfait

T

carry

(u,v)  9 t

r

24

(25)

IV- Additionneur à retenue anticipée (Carry Look-Ahead : CLA)

• L'inconvénient des structures précédentes est le temps nécessaire à la réalisation de l'addition. Ce temps est en effet conditionné par la propagation de la retenue à travers tous les additionneurs élémentaires.

• Dans un additionneur à retenue anticipée on évalue en même temps la retenue de chaque étage. Pour cela on détermine pour chaque étage les quantités Pi et Gi

suivantes:

– pi = ai  bi (propagation d'une retenue)

– gi = ai.bi (génération d'une retenue)

(26)

Additionneur à retenue anticipée : CLA

26

p

_i

= a

_i 

b

_i

(propagation d'une retenue) g

_i

= a

_i

.b

_i

(génération d'une retenue) La retenue entrante à l'ordre i vaut 1 si :

- soit l'étage i-1 a généré la retenue (g

_i-1

= 1)

- soit l'étage i-1 a propagé la retenue générée à l'étage i-2 (p

_i-1

=1 et g

_i-2

=1) - soit les étages i-1 et i-2 ont propagé la retenue générée à l'étage i-3 (p

_i-1

=p

_i-2

=1 et g

_i-3

=1)

...

- soit tous les étages inférieurs ont propagé la retenue entrante dans l'additionneur (p

_i-1

=p

_i-2

=...=p

₀

=c

₀

=1).

c

_i

= g

_i-1

+ p

_i-1

.g

_i-2

+ p

_i-1

.p

_i-2

.g

_i-3

+...+ p

_i-1

.p

_i-2

.p

_i-3

....p

₀

.c

₀

c

₁

= g

₀

+ p

₀

.c

₀

c

₂

= g

₁

+ p

₁

.g

₀

+ p

₁

.p

₀

.c

₀

c

₃

= g

₂

+ p

₂

.g

₁

+ p

₂

.p

₁

.g

₀

+ p

₂

.p

₁

.p

₀

.c

₀

c

₄

= g

₃

+ p

₃

.g

₂

+ p

₃

.p

₂

.g

₁

+ p

₃

.p

₂

.p

₁

.g

₀

+ p

₃

.p

₂

.p

₁

.p

₀

.c

₀

(27)

Additionneur à retenue anticipée

p

_i

= a

_i 

b

_i

(propagation d'une retenue) g

_i

= a

_i

.b

_i

(génération d'une retenue) S

_i

= a

_i 

b

_i ^

c

_i

= p

_i 

c

_i

c

_i

= g

_i-1

+ p

_i-1

.g

_i-2

+ p

_i-1

.p

_i-2

.g

_i-3

+...+ p

_i-1

.p

_i-2

.p

_i-3

....p

₀

.c

₀

(28)

Additionneur à retenue anticipée

28

c0 g0

p0 g1

p1 g2

p2 g3

p3 c4

s0 s1

s2 s3

c3 c2 c1

g.p. g.p. g.p. g.p.

C.L.U.

a0 b0 a1

b1 a2

b2 a3

b3

CLU : Carry Look-ahead Unit

p0 p1

p2 p3

S

_i

= p

_i 

c

_i

(29)

Bloc g.p.

p_i= a_i  b_i (propagation d'une retenue) g_i = a_i.b_i (génération d'une retenue)

g.p.

a

_i

b

_i

p

_i

g

_i

(30)

Bloc CLU

30

c4 c3 c2 c1

c0

p3 g3 p2 g2 p1 g1 p0 g0

Délai : 2 portes

c

_i

= g

_i-1

+ p

_i-1

.g

_i-2

+ p

_i-1

.p

_i-2

.g

_i-3

+...+ p

_i-1

.p

_i-2

.p

_i-3

....p

₀

.c

₀

(31)

C.L. Adder (n>4)

En pratique : n = 4 Pour n >4 :

Arbre de C.L.A multi-niveau (au détriment de la vitesse)

c4 c0

a₀ b₀ a₁ b₁ a₂ b₂ a₃ b₃

c8

a₄ b₄ a₅ b₅ a₆ b₆ a₇ b₇

c12

a₈ b₈ a₉ b₉ a₁₀ b₁₀ a₁₁ b₁₁

(32)

V- Génération et propagation de groupe

32

Soient ^g

_i

^{, p}

_i

^{, P}

_i,j^

G

_i,j

définis de la façon suivante :

G

_i,i

= g

_i

= a

_i

. b

_i

: génération au rang i P

_i,i

= p

_i

= a

_i 

b

_i

: propagation au rang i

G

_i,k

= G

_i,j

+ P

_i,j

.G

_j-1,k

: génération du rang k au rang i (n>i≥j≥k≥0)

P

_i,k

= P

_i,j

.P

_j-1,k

: propagation du rang k au rang i

G_i,k: la retenue qui sort de l'étage i a été générée entre l'étage k et l'étage i P_i,k: le retenue entrant à l'étage k a été propagée jusqu'à la sortie de l'étage i

c

_i+1

= G

_i,0

+ P

_i,0

. c

₀

: retenue au rang i+1 que l'on cherche à obtenir

S

_i

= a

_i 

b

_i ^

c

_i

= p

_i 

c

_i

= p

_i 

(G

_i-1,0

+ P

_i-1,0

. c

₀

)

et S

₀

=p

₀ 

c

₀

(33)

Cellule de Brent et Krung

Propriétés :

– La cellule est associative => nombreux assemblages possibles

– Règle d’ assemblage : toute sortie de rang i dépend des entrées des rangs 0 à i

– La cellule est non commutative

G

_i,k

= G

_i,j

+ P

_i,j

.G

_j-1,k

P

_i,k

= P

_i,j

.P

_j-1,k

P

_i,j

G

_i,j

P

_j-1,k

G

_j-1,k

P

_i,k

G

_i,k

P

_i,k

P

_i,j

P

_j-1,k

G

_i,k

G

_i,j

P

_i,j

G

_j-1,k

G

_i,i

= g

_i

P

_i,i

= p

_i

n ≥ i ≥ j ≥ k ≥ 1

(34)

Calcul arborescent de la retenue de sortie

34

Le calcul des autres retenues peut-être fait : - 1 à coût minimum,

- 2 rapide à fanout variable, - 3 rapide à fanout fixe

3,2 5,4

7,6 9,8

11,10 13,12

15,14

7,4 11,8

15,12 15,8

S

_i

= p

_i 

(G

_i-1,0

+ P

_i-1,0

. c

₀

)

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

c

_i+1

= G

_i,0

+ P

_i,0

. c

₀

(35)

Additionneur Brent & Kung

calcul pi et gi

S

_i

= p

_i 

( G

_i-1,0

+ P

_i-1,0

. c

₀

)

C₁₆

S

_i

= p

_i 

(G

_i-1,0

+ P

_i-1,0

. c

₀

)

c

_i+1

= G

_i,0

+ P

_i,0

. c

₀

(36)

Additionneur Brent & Kung

36

calcul pi et gi

S

_i

= p

_i 

( G

_i-1,0

+ P

_i-1,0

. c

₀

)

(37)

Additionneur Brent & Kung en temps log

₂

(n)+2

calcul pi et gi

S

_i

= p

_i 

( G

_i-1,0

+ P

_i-1,0

. c

₀

)

C₁₆

(38)

Additionneur de Brent & Kung

38

temps

(39)

Règles de construction

Il y a une seule règle de construction des arbres imbriqués de cellules "BK" :

Toute retenue ci de rang i est reliée à toutes les entrées de rang j < i par un arbre binaire planaire de cellules "BK".

Cela permet d'entrelacer les arbres des n sorties de très

nombreuses façons en fonction du nombre de bits et du délai de l'additionneur.

Ce délai va de (n-1) à log

₂

(n), bornes comprises.

(40)

Additionneur de Brent & Kung modifié

40

Modification de Fishburn (1990) : une cellule de plus mais réduction de 6 à 5

G

_14,0

= G

_14,14

+ P

_14,14

.G

_13,0

G

_14,0

= G

_14,12

+ P

_14,12

.G

_11,0

G

_14,12

= G

_14,14

+ P

_14,14

.G

_13,12

(41)

Additionneur de Sklansky en log

₂

(n)

(42)

Additionneur en temps (n

^1/2

)

42

(43)

Additionneur en temps (n

^1/3

)

(44)

Exercice

44

(45)

Additionneur de Ling (1981)

k_i = le retenue a été tuée au rang i = a_i^'. b_i^' Remarque : gi = k'_i g_i Calcul de la 6ième retenue

S₆ = p₆  G5,0

G_5,0= G_5,3+ P_5,3G_2,0

G_5,3= g5 + k'5 g4 + k'5k'4 g3

G_2,0= g2 + k'2 g1 + k'2k'1 g0

P_5,3=k'5k'4k'3

Le délai de S₆ est déterminé par G_5,0dont tous les termes contiennent k'5 sauf le premier .

Or g5 = k'5 g5. On metk'5 en facteur : S₆ = p₆  k'5 H_5,0(H_i,0pseudo-retenue au rang i) H_5,0= H_5,3+ Q_5,3H_2,0

H_5,3= g₅ + g₄+ k'₄ g₃ H_2,0= g2 + g1 + k'1 g0

Q =k' k' k'

(46)

Additionneur de Ling

Pour S

₆

on précalcule p

₆

et p

₆

 k'

5

G

_5,3

= g

₅

+ k'

₅

g

₄

+ k'

₅

k'

₄

g

₃

= a

₅

b

₅

+ (a

₅

+b

₅

)a

₄

b

₄

+ (a

₅

+b

₅

) (a

₄

+b

₄

)a

₃

b

₃

H

_5,3

= g

₅

+ g

₄

+ k'

₄

g

₃

= a

₅

b

₅

+ a

₄

b

₄

+ (a

₄

+b

₄

)a

₃

b

₃

H

_5,3

est plus rapide à calculer que G

_5,3

46

(47)

Additionneurs Parallèles

• But : éviter la propagation de la retenue

• Astuce : coder les chiffres sur 2 bits

• Le résultat est la somme de l'addition et de la retenue de l'étage précédent

• codage :

0 : 00,

1 : 01 ou 10, 2 : 11

• (13)10= 1*2³+1*2²+0*2¹+1*2⁰= >1101 en binaire naturel

=> 01 01 00 01 en CS ou bien

= 1*2³+0*2²+2*2¹+1*2⁰

= > 01 00 11 01 en CS

 ⁰ ^, ¹ ^, ² 

, ,

, 2 2

2

¹

0 1

0





   

^











a b

ⁿ

s

ⁱ

a

ⁱ

b

ⁱ

s

ⁱ

i i

n i

i i

n i

i i

B S

A

(48)

Cellule CS (Carry-Save)

• Cellule CS :

somme pondérée des sorties = somme pondérée des entrées a + b + c + d + e = 2_*h + 2_*g + f

48

• La sortie "h" ne dépend pas de l'entrée "e".

• h : retenue pour le bit suivant

• g : partie du résultat pour le bit suivant

• Chaque chiffre est maintenant représenté sur 2 bits

• la valeur du chiffre est la somme de ces deux bits. Les valeurs possibles des chiffres "CS" sont donc '0', '1' et '2' .

CS

a b c d e

h g f

a+b+c+d h g f

0 0 0 e

1 0 e e'

2 1 ou 0

0

ou 1 e

3 1 e e'

4 1 1 e

(49)

Additionneur parallèle CS

CS CS CS

s0

a2 b2 a1 b1 a0 b0

s2 s1

g f g f g f

0

(50)

50

(51)

Table de vérité

h = majorité (a,b,c)

g = majorité (somme(a,b,c),d,e) a + b + c + d + e = 2*h +

2*g + f

(52)

Implantation : additionneur parallèle CS

52

FA

a b c d

h

g f

g g

e h = majorité (a,b,c)

f = somme (a,b,c,d,e)

g = majorité (somme(a,b,c),d,e)

(53)

Additionneur parallèle

ai {0,1,2}

Codage : ai:{ai1,ai2} / ai1+a12 = ai 0 : 00

1 : 01 ou 10 2 : 11

CS

(54)

Implantation Cellule CS (Carry-Save)

54

(55)

Variantes

(56)

Additionneurs de réels

56

(57)

Nombre réels

• Codage des réels : virgule flottante

• flottant stocké sous la forme M * B

^E

– M : Mantisse ; B : Base ; E : Exposant

• exemple : 123 . 10

³

= 123 000

• Représentation IEEE 754, base 2 (signe 1 bit, exposant et mantisse sur 32 ou 64 bits pour simple et double

précision)

• SM : signe de la mantisse : 1 bit

• Eb : exposant biaisé : 8 ou 11 bits

• M : Mantisse : 23 ou 52 bits

SM Eb M

(58)

Mantisse et exposant

• Signe : bit de poids fort (0 = + ; 1 = -)

• Exposant

– placé avant la mantisse pour simplifier les comparaisons (pour ceci il ne doit pas être représenté en complément à deux : 2-1 > 2)

– sur 8 bits : 0..255

– sans signe mais biaisé de 127 (on enlève 127) : – Eb = 0 ⇒ E = 0 – 127 = -127

– Eb = 255 ⇒ E = 255 – 127 = 128

• Remarque : E>0 si et seulement si le bit de poids fort de Eb =1

• Mantisse

– normalisée : bit de poids fort n’ est pas 0 et un seul chiffre avant la virgule

• ex : 3,2510 =11,01 = 1,101 * 2¹

58

(59)

Virgule Flottante

• Mantisse : Comme le bit de poids fort de la mantisse est nécessairement 1, on ne l’ indique pas (gaspillage de place). Il est implicite

– partie fractionnaire = f1f2 …fn ⇒ m = 1,f1f2…fn – nombre x = (-1)^SM * 1,M * 2^Eb-127

• Exemple

– x = (-2,5)₁₀ = (-1,01*2¹)₂ – SM = 1 ;

– E= 1 => Eb= 128 = 1000 0000 ; – m=1,01 => M = 010…….0

1 1000 0000 010……0

(60)

Exemple : 452,5 + 117,5

60

452,5=

A=1.11000100100000000000000*2

⁸

117,5=

B=1.11010110000000000000000*2

⁶

A=1.11000100100000000000000*2

⁸

B=0.0111010110000000000000000*2

⁸

452,5=

117,5=

A+B = 10.0011101000000000000000000*2

⁸

= 1.0001110100000000000000000*2

⁹

(61)

Addition virgule flottante

• Les réels étant codés en "signe/valeur absolue", un seul opérateur pour addition et soustraction (Cmp à 1 +1 si signes dif.)

• Exposant du résultat : exposant du + grand (voir la suite)

• Déroulement de l'addition

– alignement des mantisses si les exposants sont dif.

– addition ou soustraction des mantisses alignées

– renormalisation de la mantisse de la somme S (si elle n'est pas normalisée) => modif de l'exposant

– arrondi de la mantisse

(62)

Exemple : 452,5+117,5

62

A=1.11000100100000000000000*2

⁸

B=1.11010110000000000000000*2

⁶

Alignement des mantisses

B= 0.01110101100000000000000|00*2

⁸

Addition des mantisses alignées

A=1.110001001000000000000000000*2

⁸

+B=0.011101011000000000000000000*2

⁸

S=10.001110100000000000000000000*2

⁸

Normalisation de la mantisse

S'=1.000111010000000000000000000*2

⁹

Arrondi de la mantisse

S'=1.00011101000000000000000*2

⁹

452,5=

117,5=

(63)

Alignement des mantisses

• Par décalage de p bits

• La valeur p du décalage est donnée par la différence des exposants. Dans l'exemple 8-6 =2 . Décalage de 2 bits.

• La valeur max de décalage est 23 , la différence est

codée sur 5 bits

(64)

Architecture : huit blocs

Bloc 1: entrent les deux exposants, sort plus grand exposant (8 bits), sort la valeur absolue de la différence des exposants (5 bits), sort le bit implicite du plus petit opérande et le bit implicite du plus grand opérande.

Bloc 2: entrent les deux mantisses, sort à gauche la mantisse du plus petit

opérande (23 bits), sort à droite la mantisse du plus grand opérande (23 bits).

Commande le mux du signe résultat (signe du plus grand).

Décaleur 1: décale vers la droite la mantisse du plus petit, conserve un "bit de garde" et un "bit d'arrondi" et ajoute un "bit collant"; total 27 bits.

Complémenteur: fait sur commande le complément logique en vue d'une soustraction.

Additionneur 1: additionne les deux mantisses alignées et la retenue, sort un résultat arrondi et une retenue, en tout 28 bits (dont 2 avant la virgule et 5 servant à l'arrondi dont 2 perdus).

Compteur de zéros en tête: la sortie ZLC compte le nombre de '0' en poids forts ou vaut 1 si le comptage est inhibé.

Décaleur 2: décale vers la gauche de ( ZLC – 2 ) positions (de 2 positions à droite jusqu'à 23 positions à gauche). Sort la mantisse du résultat, le bit sortant poids fort est perdu (bit '1' implicite si normalisé).

Additionneur 2: soustrait ( ZLC – 1 ) du plus grand exposant. Sort l'exposant du résultat.

64

(65)

Architecture

452,5+117,5

Bloc1 Bloc2

Décal.1 Compl.

Addit. 1

Décal.2 Compt. zéros

Addit. 2

(66)

Multiplieurs

66

(67)

Multiplication binaire

1 1 0 0 Multiplicande 1 1 0 1 Multiplieur

---

1 1 0 0 Produit partiel 0 0 0 0 Produit partiel 1 1 0 0 Produit partiel 1 1 0 0 Produit partiel ---

1 0 0 1 1 1 0 0 1 2

* 1 3 --- 3 6

1 2

---

1 5 6

(68)

Multiplieur

68

A

₃

B

₀

A

₂

B

₀

A

₁

B

₀

A

₀

B

₀

A

₃

B

₁

A

₂

B

₁

A

₁

B

₁

A

₀

B

₁

A

₃

B

₂

A

₂

B

₂

A

₁

B

₂

A

₀

B

₂

A

₃

B

₃

A

₂

B

₃

A

₁

B

₃

A

₀

B

₃

PP1 PP2 PP3 PP4

PP1 + PP2 = R1 =>

R1 + PP3 = R2 =>

R2 + PP4 = P

+

Ri Ai-1 Bj

Ri+1

P = A * B

P=P₇P₆P₅P₄P₃P₂P₁P₀

B

₃

B

₂

B

₁

B

₀

A

₃

A

₂

A

₁

A

₀

*

P

₇

P

₆

P

₅

P

₄

P

₃

P

₂

P

₁

P

₀

(69)

Multiplieur

A₃B₀A₂B₀A₁B₀A₀B₀ A₃B₁A₂B₁A₁B₁A₀B₁

A₃B₂A₂B₂A₁B₂A₀B₂ A₃B₃A₂B₃A₁B₃A₀B₃

P7 P6 P5 P4 P3 P2 P1 P0

+ + + +

B0 B1

B2

B3

A0 A1

A2 A3

A0 A1

A2 A3

A0 A1

A2 A3

A0 A1

A2 A3

0

(70)

Multiplieur naïf (5 x 6)

25 adders, chemin critique 13 adders

70

(71)

Multiplieur amélioré

Tous les chiffres d'un même colonne ont même poids.

En jouant sur :

- l'associativité et la commutativité de l'addition

- sur le fait que l'on ajoute des 0 sur la première couche diagonale on peut réduire le chemin critique

(72)

Multiplieur de Braun

72

A

₄

B

₀

A

₃

B

₀

A

₂

B

₀

A

₁

B

₀

A

₀

B

₀

A

₄

B

₁

A

₃

B

₁

A

₂

B

₁

A

₁

B

₁

A

₀

B

₁

A

₄

B

₂

A

₃

B

₂

A

₂

B

₂

A

₁

B

₂

A

₀

B

₂

A

₄

B

₃

A

₃

B

₃

A

₂

B

₃

A

₁

B

₃

A

₀

B

₃

B

₅

B

₄

B

₃

B

₂

B

₁

B

₀

A

₄

A

₃

A

₂

A

₁

A

₀

*

P

₉

P

₈

P

₇

P

₆

P

₅

P

₄

P

₃

P

₂

P

₁

P

₀

A

₄

B

₄

A

₃

B

₄

A

₂

B

₄

A

₁

B

₄

A

₀

B

₄

A

₄

B

₅

A

₃

B

₅

A

₂

B

₅

A

₁

B

₅

A

₀

B

₅

Avec P₀= A₀B₀, P₁=A₁B₀+A₀B₁, P₂ = A₂B₀+A₁B₁+A₀B₂, etc…

(73)

Multiplieur de Braun

(74)

Multiplication Signée (complément à 2)

74

(75)

Multiplieur séquentiel 1

(A) 1110 (B) 1011 ---

R2R1 0000 0000 Initialisation de R1 et R2 +A*2⁰ 1110 b0=1 => on ajoute A*2⁰ ---

R2R1 0000 1110 Décalage de B => B=(0101) +A*2¹ 1 110 b0=1 => on ajoute A*2¹

---

R2R1 0010 1010 Décalage de B => B=(0010) +0*2² b0=0 => on ajoute 0*2²

---

R2R1 0010 1010 Décalage de B => B=(0001) +A*2³ 111 0 b0=1 => on ajoute A*2³

---

R2R1 1001 1010 Fin

Avec addition de A sur le ième bit

(76)

Multiplieur séquentiel 1

76

A 00000000

R2 R1

+ B

8 8

8

(77)

Multiplieur séquentiel 2

(A) 1110 (B) 1011 ---

R3R2R1 0 0000 0000 Initialisation de R3 R2 R1 +A 1110 b0=1 => (R2 + A -> R3R2) ---

R3R2R1 0 1110 0000 Décalage de R3R2R1

R3R2R1 0 0111 0000 Décalage de B => B=(0101) +A 1110 b0=1 => (R2 + A -> R3R2) ---

R3R2R1 0 1010 1000 Décalage de B => B=(0010) +0 0000 b0=0 => (R2 + 0 -> R3R2) ---

R3R2R1 0 0101 0100 Décalage de B => B=(0001) +A 1110 b0=1 => (R2 + A -> R3R2) ---

Avec addition de A sur les poids forts et décalage

(78)

Multiplieur séquentiel 2

78

A 00000

R2 R1

+ B

4 4

4

R3

(79)

Multiplieur séquentiel 3

(A) 1110

---

R3 R2 R1 0 0000 1011 Initialisation de R3R2R1 (B->R1) +A 1110 b0(R1)=1 => (R2 + A -> R3R2) ---

R3 R2 R1 0 1110 1011 Décalage de R3R2R1

R3 R2 R1 0 0111 0101 b0(R1)=1 => (R2 + A -> R3R2) +A 1110

---

R3 R2 R1 0 1010 1010 b0(R1)=0 => (R2 + 0 -> R3R2) +0 0000

---

R3 R2 R1 0 0101 0101 b0(R1)=1 => (R2 + A -> R3R2) +A 1110

---

R3 R2 R1 1 0011 0101 Décalage de R3R2R1 R3 R2 R1 0 1001 1010 Fin

Architecture Opérateurs Arithmétiques

Additionneurs

Rappel sur l'écriture des entiers en base 2

• Entiers positifs

• Entiers relatifs (complément à 2)

 







  0 , 1 ,  2 , 2 1 

, 2

2

    







b b B

b

B

Additionneur "Full Adder" (FA)

C

= A

B

+ A

C

+ B

C

= majorité(A

,B

,C

) C

= A

B

+ C

( A

B

)

S

= A

B

C

000 0 0 001 0 1 010 0 1 011 1 0 100 0 1 101 1 0 A

B

C

C

S

La somme pondérée de ce qui entre est égale à la somme pondérée de ce qui sort :

A

+ B

C

= S

+ 2 * C

I- Additionneur à propagation de retenue

C

= 1 si retenue

Ci+1 = AiBi + AiCi + BiCi C

=0

A

B

A

B

A

B

A

B

C

C

C

C

C

S

S

S

S

Ci+1 = AiBi + Ci ( Ai

Bi) Si = Ai

Bi

Ci

• La retenue se propage à travers tous les étages

• Délai = O(n)

  ⁰ ^, ¹ ^,  ² ^, ² ¹ 