Tri de Shell

Le tri de Shell ou Modèle:Langue en anglais est un algorithme de tri. C'est une amélioration notable du tri par insertion au niveau de la vitesse d'exécution, mais ce tri n'est pas stable. Le principe de l'algorithme est simple mais l'étude du temps d'exécution est très complexe, et plusieurs problèmes sont toujours ouverts à ce sujet.

Le nom vient de son inventeur Modèle:Lien (1924-2015) qui publia l'algorithme dans le numéro de Modèle:Date de Communications of the ACM^[1].

Principe

Amélioration du tri par insertion

Le tri de Shell est une amélioration du tri par insertion en observant deux choses :

Le tri par insertion est efficace si la liste est à peu près triée (1) ;
Le tri par insertion est inefficace en moyenne car il ne déplace les valeurs que d'une position par instruction (2).

Le tri de Shell trie chaque liste d'éléments séparés de n positions chacun avec le tri par insertion. L'algorithme effectue plusieurs fois cette opération en diminuant n jusqu'à n=1 ce qui équivaut à trier tous les éléments ensemble.

Le fait de commencer avec des éléments espacés permet de pallier l'inconvénient (2), tandis que lorsque l'on fait à la fin avec un espacement de 1, ce qui est en fait un tri par insertion ordinaire, on tire parti de l'avantage (1).

Code Python

gaps = [701, 301, 132, 57, 23, 10, 4, 1]

def shell_sort(tab):
  n = len(tab)
  for m in gaps:
    for r in range(m):
      # tri par insertion des positions de la forme k * m + r
      for i in range (r + m, n, m):
        j = i
        x = tab[i]
        while j > r and tab[j-m] > x:
          tab[j] = tab[j-m]
          j = j - m
        tab[j] = x

Gap ou espacement entre les éléments

Les premiers espacements optimaux (empiriquement trouvés) sont les suivants : 1, 4, 10, 23, 57, 132, 301, 701^[2].

On remarque que le facteur entre ces valeurs, exception faite des deux premières, est d'environ 2,3. On peut effectivement prolonger cette liste avec ce facteur si les dimensions du tableau dépassent environ 1600 éléments. Par exemple pour étendre la liste gaps jusqu'à la taille nécessaire:

gap = gaps[0]
while gap<length(liste):
  gap = round(gap*2.3);
  gaps = [gap] + gaps

Des espacements de la forme $2^{p} 3^{q}$ , dans l'ordre croissant, garantissent quant à eux la meilleure complexité théorique prouvée aujourd'hui, $O (n \log^{2} n)$ ^[3].

Complexité

Sur des tableaux de moins d'une centaine d'éléments, ce tri est aussi rapide qu'un tri rapide simple. Mais plutôt que d'être en compétition avec l'algorithme quicksort, il peut être utilisé pour son optimisation quand les sous-listes à traiter deviennent petites.

Le choix de la suite des espacements entre les éléments qu'on trie à chaque étape (gap) est très important. Il peut faire varier la complexité dans le pire cas de $O (n^{2})$ à $O (n \log^{2} n)$ ^[3]. Il est également possible que la complexité en moyenne puisse être $O (n \log n)$ avec un bon choix d'espacements (problème ouvert).

Des bornes inférieures ont aussi été publiées, on peut citer une borne de $Ω (n {(\frac{\log n}{\log \log n})}^{2})$ sur la complexité dans le pire cas quels que soient les espacements^[4].

Le tableau suivant compare les gaps publiés jusqu'à aujourd'hui :

OEIS	Terme général (k ≥ 1)	Gaps ou espacements concrets	Complexité dans le pire des cas	Auteur et année de publication
	$⌊ \frac{N}{2^{k}} ⌋$	$⌊ \frac{N}{2} ⌋, ⌊ \frac{N}{4} ⌋, \dots, 1$	$Θ (N^{2})$ [i.e quand N = 2^p]	Modèle:Lien, 1959
	$2 ⌊ \frac{N}{2^{k + 1}} ⌋ + 1$	$2 ⌊ \frac{N}{4} ⌋ + 1, \dots, 3, 1$	$Θ (N^{\frac{3}{2}})$	Frank & Lazarus, 1960^[5]
A168604	$2^{k} - 1$	$1, 3, 7, 15, 31, 63, \dots$	$Θ (N^{\frac{3}{2}})$	Modèle:Lien, 1963^[6]
A083318	$2^{k} + 1$ , préfixé avec 1	$1, 3, 5, 9, 17, 33, 65, \dots$	$Θ (N^{\frac{3}{2}})$	Papernov & Stasevich, 1965^[7]
A003586	Nombres successifs de la forme $2^{p} 3^{q}$ (entier friable 3-lisse)	$1, 2, 3, 4, 6, 8, 9, 12, \dots$	$Θ (N \log^{2} N)$	Modèle:Lien, 1971^[3]
A003462	$\frac{3^{k} - 1}{2}$ , plus petit que $⌈ \frac{N}{3} ⌉$	$1, 4, 13, 40, 121, \dots$	$Θ (N^{\frac{3}{2}})$	Modèle:Lien, 1971^[3]
A036569	$\begin{matrix} \prod_{I} a_{q}, où \\ a_{q} = & \min {n \in ℕ : n \geq {(\frac{5}{2})}^{q + 1}, \forall p : 0 \leq p < q \Rightarrow p g c d (a_{p}, n) = 1} \\ I = & {0 \leq q < r ∣ q \neq \frac{1}{2} (r^{2} + r) - k} \\ r = & ⌊ \sqrt{2 k + \sqrt{2 k}} ⌋ \end{matrix}$	$1, 3, 7, 21, 48, 112, \dots$	$O (N^{1 + \sqrt{\frac{8 \ln (5 / 2)}{\ln (N)}}})$	Incerpi & Robert Sedgewick, 1985^[8], Knuth^[9]
A036562	$4^{k} + 3 \cdot 2^{k - 1} + 1$ , préfixé par 1	$1, 8, 23, 77, 281, \dots$	$O (N^{\frac{4}{3}})$	Sedgewick, 1986^[10]
A033622	${\begin{matrix} 9 (2^{k} - 2^{\frac{k}{2}}) + 1 & k pair, \\ 8 \cdot 2^{k} - 6 \cdot 2^{(k + 1) / 2} + 1 & k impair \end{matrix}$	$1, 5, 19, 41, 109, \dots$	$O (N^{\frac{4}{3}})$	Sedgewick, 1986^[11]
	$h_{k} = \max {⌊ \frac{5 h_{k - 1}}{11} ⌋, 1}, h_{0} = N$	$⌊ \frac{5 N}{11} ⌋, ⌊ \frac{5}{11} ⌊ \frac{5 N}{11} ⌋ ⌋, \dots, 1$	Inconnue	Modèle:Lien & Modèle:Lien, 1991^[12]
A108870	$⌈ \frac{1}{5} (9 \cdot {(\frac{9}{4})}^{k - 1} - 4) ⌉$	$1, 4, 9, 20, 46, 103, \dots$	Inconnue	Tokuda, 1992^[13]
A102549	Inconnue (trouvé expérimentalement)	$1, 4, 10, 23, 57, 132, 301, 701$	Inconnue	Ciura, 2001^[14]

Références

Liens externes

Modèle:Autres projets

Modèle:Palette Modèle:Portail

[1] Modèle:Article

[Ciura-2] Modèle:Chapitre

[Pratt-3] 3,0 ^3,1 ^3,2 et ^3,3 Modèle:Ouvrage

[4] Modèle:Chapitre

[5] Modèle:Article

[6] Modèle:Article

[7] Modèle:Article

[8] Modèle:Article

[Knuth-9] Modèle:Ouvrage

[10] Modèle:Ouvrage

[Sedgewick2-11] Modèle:Article

[Gonnet-12] Modèle:Ouvrage

[13] Modèle:Ouvrage

[:0-14] Modèle:Ouvrage

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Tri de Shell

Sommaire

Principe

Amélioration du tri par insertion

Code Python

Gap ou espacement entre les éléments

Complexité

Références

Liens externes

Menu de navigation

Tri de Shell

Principe

Amélioration du tri par insertion

Code Python

Gap ou espacement entre les éléments

Complexité

Références

Liens externes

Menu de navigation

Rechercher