Codage de Levenshtein

Le codage de Levenshtein est un codage entropique inventé par Vladimir Levenshtein en 1968 et utilisé essentiellement en compression de données[1].

Le code de Levenshtein produit est un code préfixe et universel.

Le codage de Levenshtein permet de coder tous les entiers naturels (zéro compris — ce qui le distingue des codes d'Elias), sans qu'il y ait besoin de connaitre au préalable l'intervalle des valeurs à coder (contrairement, par exemple, au codage binaire de taille fixe, qui ne permet de coder que des nombres inférieurs à une borne supérieure fixée à l'avance).

Pour cela, le codage de Levenshtein se fait en deux étapes :

  1. le codage du nombre de récursions de l'algorithme avec un codage unaire ;
  2. le codage récursif de la valeur.

Le codage récursif consiste à représenter l'entier en binaire, privé de son bit de poids fort (implicite) et précédé de son nombre de bits (sans compter le bit de poids fort dont il est privé), lui-même codé avec un codage récursif — la récursion s'arrêtant lorsque le nombre est nul.

Longueur du code

[modifier | modifier le code]

Un code de Levenshtein est toujours exactement un bit plus long que le code omega équivalent. À la différence de ce dernier, il permet cependant de coder les entiers relatifs sans transformation intermédiaire.

Représentation des premiers entiers naturels (zéro compris) avec un codage de Levenshtein
Décimal Binaire Code omega Code de Levenshtein
0 0 Impossible 0
1 1 0 10
2 10 10 0 110 0
3 11 11 0 110 1
4 100 10 100 0 1110 0 00
5 101 10 101 0 1110 0 01

Notes et références

[modifier | modifier le code]
  1. (ru) Vladimir Levenshtein, « On the redundancy and delay of separable codes for the natural numbers » [« ОБ ИЗБЫТОЧНОСТИ И ЗАМЕДЛЕНИИ РАЗДЕЛИМОГО КОДИРОВАНИЯ НАТУРАЛЬНЫХ ЧИСЕЛ »], Problems of Cybernetics, vol. 20,‎ , p. 173–179 (lire en ligne [PDF])