Wavelet transform

Wavelet compression is a form of data compression well suited for image compression (sometimes also video compression and audio compression). Implementações notáveis são JPEG 2000, DjVu e ECW para still images, CineForm, e Dirac da BBC. O objetivo é armazenar dados de imagem no menor espaço possível em um arquivo. Compressão Wavelet pode ser ou sem perdas ou perdas. Wavelet coding é uma variante da codificação discrete cossine transform (DCT) que usa wavelets em vez de dct’s block-based algorithm.

usando uma transformada de wavelet, os métodos de compressão de wavelet são adequados para representar transientes, tais como sons de percussão em áudio, ou componentes de alta frequência em imagens bidimensionais, por exemplo uma imagem de estrelas em um céu noturno. Isto significa que os elementos transitórios de um sinal de dados podem ser representados por uma menor quantidade de Informação do que seria o caso se alguma outra transformada, como a Transformada discreta mais difundida, tivesse sido usada.

Discrete wavelet transform tem sido aplicado com sucesso para a compactação do eletrocardiógrafo (ECG) sinais neste trabalho, a alta correlação entre os correspondentes coeficientes wavelet dos sinais de sucessivos ciclos cardíacos é utilizado empregando linear prediction.

compressão Wavelet não é bom para todos os tipos de dados: características transitórias do sinal significam boa compressão wavelet, enquanto os sinais periódicos suaves são melhor comprimidos por outros métodos, particularmente a compressão harmônica tradicional (domínio de frequência, como por transformada de Fourier e relacionados).

See Diary Of An x264 Developer: The problems with wavelets (2010) for discussion of practical issues of current methods using wavelets for video compression.

MethodEdit

First a wavelet transform is applied. Isto produz tantos coeficientes quanto existem pixels na imagem (isto é, não há compressão ainda, uma vez que é apenas uma transformada). Estes coeficientes podem então ser comprimidos mais facilmente porque a informação está estatisticamente concentrada em apenas alguns coeficientes. Este princípio é chamado codificação de transformação. Depois disso, os coeficientes são quantizados e os valores quantizados são codificados em entropia e/ou comprimento de execução codificados.

a few 1D and 2D applications of wavelet compression use a technique called “wavelet footprints”.

EvaluationEdit

Requirement for image compressionEdit

For most natural images, the spectrum density of lower frequency is higher. Como resultado, a informação do sinal de baixa frequência (sinal de referência) é geralmente preservada, enquanto a informação no sinal de detalhe é descartada. Do ponto de vista da compressão e reconstrução da imagem, um wavelet deve cumprir os seguintes critérios ao executar a compressão da imagem:

  • ser capaz de transformar a imagem mais original no sinal de referência.
  • reconstrução de maior fidelidade com base no sinal de referência.
  • não deve levar a artefatos na imagem reconstruída apenas a partir do sinal de referência.

Requirement for shift variance and ring behaviorEdit

Wavelet image compression system involves filters and decimation, so it can be described as a linear shift-variant system. Apresenta-se abaixo um diagrama típico de transformação ondulada:

Diagrama típico da Transformada de wavelet.png

A transformação do sistema contém dois de análise de filtros (um filtro passa-baixa h 0 ( n ) {\displaystyle h_{0}(n)}

{\displaystyle h_{0}(n)}

e um filtro passa-altas h 1 ( n ) {\displaystyle h_{1}(n)}

h_{1}(n)

), um processo de dizimação, um processo de interpolação, e dois de síntese de filtros ( g 0 ( n ) {\displaystyle g_{0}(n)}

{\displaystyle g_{0}(n)}

e g 1 ( n ) {\displaystyle g_{1}(n)}

{\displaystyle g_{1}(n)}

). A compressão e a reconstrução do sistema geralmente envolve componentes de baixa frequência, que é a análise de filtros h 0 ( n ) {\displaystyle h_{0}(n)}

{\displaystyle h_{0}(n)}

para a compressão de imagens e a síntese de filtros g 0 ( n ) {\displaystyle g_{0}(n)}

{\displaystyle g_{0}(n)}

para a reconstrução. Para avaliar esse sistema, podemos entrada de um impulso δ ( n − n i ) {\displaystyle \delta (n-n_{i})}

{\displaystyle \delta (n-n_{i})}

e observar a sua reconstrução h ( n − n i ) {\displaystyle h(n-n_{i})}

{\displaystyle h(n-n_{i})}

; O ideal de wavelets são os que trazem o mínimo de mudança de variância e o lóbulo lateral de h ( n − n i ) {\displaystyle h(n-n_{i})}

{\displaystyle h(n-n_{i})}

. Mesmo que wavelet com variância de deslocamento estrito não é realista, é possível selecionar wavelet com apenas ligeira variância de deslocamento. Por exemplo, podemos comparar a mudança de variância de dois filtros:

Biorthogonal filtros de wavelets de compressão de imagem
Comprimento Filtro de coeficientes de Regularidade
Wavelet de filtro 1 H0 9 .852699, .377402, -.110624, -.023849, .037828 1.068
G0 7 .788486, .418092, -.040689, -.064539 1.701
Wavelet de filtro 2 H0 6 .788486, .047699, -.129078 0.701
G0 10 .615051, .133389, -.067237, .006989, .018914 2.068

ao observar as respostas de impulso dos dois filtros, podemos concluir que o segundo filtro é menos sensível à localização de entrada (ou seja, é menos variante de deslocamento). Outra questão importante para a compressão e reconstrução da imagem é o comportamento oscilatório do sistema, que pode levar a artefatos indesejáveis graves na imagem reconstruída. Para conseguir isso, os filtros de onda devem ter um grande pico para a razão sidelobe.

até agora temos discutido sobre a transformação de uma dimensão do sistema de compressão de imagem. Esta questão pode ser estendida a duas dimensões, enquanto um termo mais geral – metamorfose multiscale transforma – se-é proposto.Como mencionado anteriormente, a resposta a impulsos pode ser utilizada para avaliar o sistema de compressão/reconstrução da imagem.

Para a seqüência de entrada x ( n ) = δ ( n − n i ) {\displaystyle x(n)=\delta (n-n_{i})}

{\displaystyle x(n)=\delta (n-n_{i})}

, o sinal de referência r 1 ( n ) {\displaystyle r_{1}(n)}

{\displaystyle r_{1}(n)}

depois de um nível de decomposição é x ( n ) ∗ h 0 ( n ) {\displaystyle x(n)*h_{0}(n)}

{\displaystyle x(n)*h_{0}(n)}

atravessa dizimação por um fator de dois, enquanto o h 0 ( n ) {\displaystyle h_{0}(n)}

{\displaystyle h_{0}(n)}

é um filtro passa-baixa. Da mesma forma, o próximo sinal de referência r 2 ( n ) {\displaystyle r_{2}(n)}

{\displaystyle r_{2}(n)}

é obtido por r 1 ( n ) ∗ h 0 ( n ) {\displaystyle r_{1}(n)*h_{0}(n)}

{\displaystyle r_{1}(n)*h_{0}(n)}

atravessa dizimação por um fator de dois. Após os níveis de decomposição (e decimação) L, A Resposta da análise é obtida retendo um de cada 2 L (\displaystyle 2^L}}

2^{L}

amostras: h ( L ) ( n , n, i ) = f h 0 ( L ) ( n − n i / 2 L ) {\displaystyle h_{A}^{(L)}(n,n_{i})=f_{h0}^{(L)}(n-n_{i}/2^{L})}

{\displaystyle h_{A}^{(L)}(n,n_{eu})=f_{h0}^{(L)}(n-n_{i}/2^{L})}

.

por outro lado, para reconstruir o sinal x(n), podemos considerar um sinal de referência r L ( n ) = δ ( n − n j ) {\displaystyle r_{L}(n)=\delta (n-n_{j})}

{\displaystyle r_{L}(n)=\delta (n-n_{j})}

. Se os detalhes sinais d i ( n ) {\displaystyle d_{i}(n)}

{\displaystyle d_{i}(n)}

são iguais a zero para 1 ≤ i ≤ L {\displaystyle 1\leq i\leq L}

{\displaystyle 1\leq i\leq L}

, em seguida, o sinal de referência na fase anterior ( L − 1 {\displaystyle L-1}

L-1

palco), r L − 1 ( n ) = g 0 ( n − 2 n j ) {\displaystyle r_{L-1}(n)=g_{0}(n-2n_{j})}

{\displaystyle r_{L-1}(n)=g_{0}(n-2n_{j})}

, qual é obtido por interpolação r L ( n ) {\displaystyle r_{L}(n)}

{\displaystyle r_{L}(n)}

e convoluting com g 0 ( n ) {\displaystyle g_{0}(n)}

{\displaystyle g_{0}(n)}

. Da mesma forma , o procedimento é iterado para obter o sinal de referência r ( n ) {\displaystyle r(n)}

r(n)

na fase L − 2, L − 3,. . . . , 1 {\displaystyle L-2, L-3,….,1}

{\displaystyle L-2, L-3,....,1}

. Após l iterações, calcula-se a resposta do impulso de síntese: h s ( L), ( n , n, i ) = f g 0 ( L ) ( n / 2 L − n j ) {\displaystyle h_{s}^{(L)}(n,n_{i})=f_{g0}^{(L)}(n/2^{L}-n_{j})}

{\displaystyle h_{s}^{(L)}(n,n_{eu})=f_{g0}^{(L)}(n/2^{L}-n_{j})}

, que relaciona o sinal de referência r L ( n ) {\displaystyle r_{L}(n)}

{\displaystyle r_{L}(n)}

e a reconstituição do sinal.

para obter o sistema global de análise/síntese do nível L, as respostas de análise e síntese são combinadas da seguinte forma::

h E S ( L), ( n , n ) = água k f h 0 ( L ) ( k − n / 2 L ) f g 0 ( L ) ( n / 2 L − k ) {\displaystyle h_{MP}^{(L)}(n,n_{i})=\sum _{k}f_{h0}^{(L)}(k-n_{i}/2^{L})f_{g0}^{(L)}(n/2^{L}-k)}

{\displaystyle h_{MP}^{(L)}(n,n_{i})=\sum _{k}f_{h0}^{(L)}(k-n_{i}/2^{L})f_{g0}^{(L)}(n/2^{L}-k)}