Tri rapide (quicksort) - Notes de programmation (C) et d'algorithmique

Le coˆut moyen est donc infini !

Exercice 19 Consid´erez la fonction C suivante qui effectue une recherche ‘al´eatoire’ d’un ´

el´ement dans un tableau.

1 int rs (int x , int n , int t [ n ]){

2 s h o r t c h e c k [ n ]; 3 int i ; 4 for ( i =0; i < n ; i + + ) { 5 c h e c k [ i ] = 0 ; } 6 int c o u n t =0; 7 w h i l e ( c o u n t < n ){ 8 int i =(r a n d()% n ); 9 if ( t [ i ]== x ){ 10 r e t u r n i ;} 11 if (! c h e c k [ i ]){ 12 c h e c k [ i ] = 1 ; 13 c o u n t + + ; } } 14 r e t u r n -1;}

Calculez (de fa¸con exacte ou approch´ee) le nombre moyen d’appels `a la fonction rand dans les cas suivants :

1. Le tableau contient l’élément cherché 1 fois. 2. Le tableau contient l’élément cherché k fois. 3. Le tableau ne contient pas l’élément cherché.

17.2 Tri rapide (quicksort)

On consid`ere un algorithme dit de tri rapide (quicksort, en anglais) [Hoa61].²

Algorithme de partition

Le tri rapide est basé sur une fonction de partition qui prend en entrée un ensemble fini de valeurs X et une valeur pivot v et génère l’ensemble X₁ des valeurs dans X strictement inférieurs à v et l’ensemble X2 des valeurs dans X supérieurs ou égales à v. Supposons que X contienne n valeurs. Si X est représenté par une liste alors il est clair que l’on peut produire les deux listes qui représentent les ensembles X₁ et X₂ en O(n). Si X est représenté par un tableau a alors il est remarquable que l’on peut générer X1 et X2 en temps O(n) et sans effectuer d’allocation de mémoire (en anglais, on dit aussi que l’algorithme travaille in place). Supposons que les éléments de l’ensemble à partitionner sont mémorisés dans les cellules d’indice compris entre i et j avec i < j On itère :

2. Cet algorithme est dans une top 10 d’algorithmes du XX si`ecle (voir https://www.siam.org/pdf/news/ 637.pdf).

Algorithmes probabilistes 129

1. Tant que a[i] < v on incrémente i. Si i ‘croise’ j on sort de l’itération. 2. Tant que v ≤ a[j] on décrémente j. Si j ‘croise’ i on sort de l’itération.

3. Si on arrive `a ce point, on doit avoir a[i] ≥ v et a[j] < v. On permute a[i] avec a[j] et on reprend l’it´eration (pas 1).

Il est facile de modifier l’algorithme pour qu’`a la fin de la partition il retourne l’indice `

a partir duquel on trouve les éléments plus grands ou égaux que le pivot (et une valeur conventionnelle s’il y en a pas). Dans la suite, on appelle cet indice le point de partition.

Algorithme de tri

On considère maintenant l’application de l’algorithme de partition au problème du tri. On suppose que les données à trier sont stockées dans un tableau a dans les positions comprises entre min et max et on prend a[max] comme pivot. Si min = max on a rien à faire ! Sinon :

— soit k le point de partition par rapport au pivot,

— si k<max on échange a[k] avec a[max] ; on met donc le pivot au point de partition, — si nécessaire, on calcule récursivement qsort(min,k-1) et qsort(k+1,max).

Complexit´e dans le pire des cas et en moyenne

Le pire des cas est quand toutes les partitions sont déséquilibrées. Par exemple, si le tableau est déjà ordonné (SIC). Dans ce cas, le coût est quadratique. Pourtant, le qsort est un algorithme de choix pour effectuer le tri. Par exemple, il est dans la bibliothèque standard de C. Le fait est qu’en moyenne l’algorithme a une complexité O(n log n) (qui est bien meilleure que quadratique !). Par ailleurs, l’opération de partition est efficace (en temps et en mémoire). Il y a deux fa¸cons d’analyser le comportement moyen du tri rapide. La première fa¸con (qui est celle étudiée dans la suite) est de le transformer dans un algorithme probabiliste qui `

a chaque appel récursif choisit le pivot de fa¸con aléatoire. Dans cette approche on ne fait pas d’hypothèse sur la distribution des données en entrée. Ce qu’on montre est que pour toute entrée, en choisissant les pivots de fa¸con aléatoire on aura un coût moyen en O(n log n). Une deuxième fa¸con de procéder est de supposer une distribution uniforme des données. Dans ce cas, on peut garder la version déterministe de l’algorithme (par exemple celle dans laquelle le pivot est toujours l’élément le plus à droite) et montrer que le coût moyen (sur toutes les entrées) est O(n log n). L’analyse de cette deuxième approche est similaire à celle de la première et elle est omise.

Tri rapide : version probabiliste

La seule différence dans la version probabiliste du tri rapide est que pour trier les posi-tions comprises entre min et max on commence par tirer un indice i tel que min ≤ i ≤ max avec probabilité uniforme et on permute a[i] avec a[max]. Le pivot est donc choisi avec une probabilité uniforme.

Analyse du tri rapide probabiliste

On suppose tous les éléments à trier différents. Pour simplifier la notation on dénote ces éléments par 1, 2, · · · , n. Par exemple, 2 est le deuxième plus petit élément. Au début du tri sa position est arbitraire mais à la fin du tri on sait qu’il sera en deuxième position

a partir de gauche. Comme souvent dans les algorithmes de tri, on considère que le coût est proportionnel au nombre de comparaisons et on s’attache donc à compter le nombre de comparaisons effectuées en moyenne par l’algorithme. Ce nombre dépend du choix aléatoire des pivots. On représente un calcul par la suite des pivots choisis. Soit Ω l’ensemble de ces suites. On définit une v.a.d. X qui associe à chaque suite le nombre de comparaisons effectuées par le tri rapide. Le but est de calculer l’espérance E[X].

Remarque 18 Soient i, j ∈ {1, . . . , n} avec i < j deux éléments à trier. Dans toute exécution, i et j sont comparés au plus un fois. En effet, l’algorithme compare un pivot aux autres ´

eléments d’une partition. Donc pour comparer i et j il faut que l’un des deux soit un pivot et l’autre se trouve dans la même partition. Par ailleurs, dans la suite du calcul le pivot ne sera plus comparé à un autre élément (à la fin de la partition le pivot se trouve à la bonne place).

On va maintenant utiliser une technique standard du calcul des probabilités : on exprime la v.a.d. X comme une somme de v.a.d. de Bernoulli dont on sait calculer l’espérance. Ensuite on utilise la linéarité de l’espérance pour dériver l’espérance de X. Pour ω ∈ Ω une suite de comparaisons, on définit :

X_i,j(ω) =

1 si i et j sont compar´es dans ω 0 autrement.

On observe :

X = Σ1≤i<j≤nXi,j . Et par lin´earit´e :

E[X] = Σ_1≤i<j≤nE[X_i,j] . Il reste donc `a calculer E[X_i,j].

Définition 15 (probabilité de comparaison) On note P (i, j, n) = E[X_i,j] la probabilité que i et j sont comparés dans un tri rapide avec n éléments, où 1 ≤ i < j ≤ n.

Une premi`ere remarque est que P (i, j, n) satisfait une relation de r´ecurrence.

Proposition 13 La fonction P (i, j, n) satisfait : P (1, 2, 2) = 1

P (i, j, n) = _n² +¹_n· ( Σ_{k=1,...,(i−1)} P (i − k, j − k, n − k) + Σ_{k=(j+1),...,n}P (i, j, k − 1) ) .

Preuve. Pour comparer i `a j, soit on prend le pivot dans {i, j} soit on le prend avant i ou

apr`es j. 2

Une deuxi`eme remarque (assez surprenante) est que P (i, j, n) ne d´epend pas de n.

Proposition 14

P (i, j, n) = ² (j − i + 1) ^.

Algorithmes probabilistes 131

Preuve. Par récurrence sur n. Pour n = 2 on a bien P (1, 2, 2) = ₂₋₁₊₁² = 1. Plus en général : P (i, i + 1, n) = 1. Pour n + 1 > 2 on a : P (i, j, n + 1) = _n+1² +_n+1¹ ( Σ_{k=1,...,(i−1)} P (i − k, j − k, n + 1 − k) + Σ_{k=(j+1),...,n+1}P (i, j, k − 1) ) = _n+1² +_n+1¹ ( Σ_{k=1,...,(i−1)} _j−i+1² + Σ_{k=(j+1),...,n+1} _j−i+1² ) = _n+1² +_n+1¹ ^2(n−j+i)_j−i+1 = _j−i+1² . 2 Proposition 15 E[X] est O(n log n).

Preuve. On calcule :

E[X] = Σ_{i=1,...,(n−1)}Σ_j=i+1,...,n_(j−i+1)² = 2 · (Σ_{i=1,...,n−1}(Σ_{k=1,...,(n−i)}_(k+1)¹ )) ≤ 2 · (Σ_{i=1,...,n−1}(Σ_k=1,...,n¹_k)) . On approxime la somme par un int´egral pour obtenir :

Σx=2,...,m

Dans le document Notes de programmation (C) et d'algorithmique (Page 129-132)