Os códigos de Golomb, ou ainda a codificação de Golomb, é um conjunto de códigos livres de prefixo que podem ser utilizados na compressão de dados em substituição ao código de huffman, apresentando resultados ótimos para determinadas distribuições de probabilidade dos símbolos codificados. O método foi desenvolvido por Solomon W. Golomb em 1966.[1][2][3]
Os códigos de Golomb se aplicam a todo número inteiro e não negativo, e dependem de um parâmetro que deve ser previamente computado para que o código seja adequado aos dados. Desse parâmetro depreendemos mais duas grandezas e :
das quais o código será construído. Da grandeza produzimos o prefixo, que será codificado em unário, enquanto a segunda parte será codificada com bits para os menores valores e bits para os maiores valores. Assim, para temos e como os valores possíveis de , que serão codificados como e ( tem bits e e têm ambos bits). Para teremos os valores e . A tabela abaixo ilustra os códigos de Golomb para e :
n
1
2
3
4
5
6
7
8
9
10
0/0
0/10
0/11
10/0
10/10
10/11
110/0
110/10
110/11
1110/0
0/00
0/01
0/100
0/101
10/110
10/00
10/01
10/100
10/101
110/110
Com os dados apropriados, os códigos de Golomb podem ser mais fáceis de gerar e tão eficientes quanto os códigos de Huffman. Pode ser demonstrado que para dados onde a probabilidade de cada símbolo respeita a fórmula: para o código de Golomb será ótimo se for escolhido tal que
O padrão JPEG-LS de compressão de imagenssem perdas utiliza os códigos de Golomb para representar os valores de diferença entre as previsões e os valores reais dos pixels.
↑Golomb, S. W. (1966). «Run-Length Encodings». IEEE Transactions on Information Theory. IT-12(3): 399-401in SALOMON, David (2000). Data Compression. The Complete Reference 2 ed. Nova Iorque: Springer. ISBN0-387-95045-1