La transformation en ondelettes

La compression en ondelettes est une forme de compression de données bien adaptée à la compression d’image (parfois aussi à la compression vidéo et à la compression audio). Les implémentations notables sont JPEG 2000, DjVu et ECW pour les images fixes, CineForm et Dirac de la BBC. L’objectif est de stocker les données d’image dans le moins d’espace possible dans un fichier. La compression en ondelettes peut être sans perte ou avec perte. Le codage par ondelettes est une variante du codage par transformée en cosinus discrète (DCT) qui utilise des ondelettes au lieu de l’algorithme basé sur des blocs de DCT.

En utilisant une transformée en ondelettes, les méthodes de compression en ondelettes sont adéquates pour représenter des transitoires, tels que des sons de percussion dans l’audio, ou des composantes à haute fréquence dans des images bidimensionnelles, par exemple une image d’étoiles sur un ciel nocturne. Cela signifie que les éléments transitoires d’un signal de données peuvent être représentés par une plus petite quantité d’informations que ce ne serait le cas si une autre transformée, telle que la transformée en cosinus discrète plus répandue, avait été utilisée.La transformée en ondelettes discrètes

a été appliquée avec succès pour la compression de signaux électrocardiographiques (ECG) Dans ce travail, la corrélation élevée entre les coefficients d’ondelettes correspondants de signaux de cycles cardiaques successifs est utilisée en utilisant la prédiction linéaire.

La compression en ondelettes n’est pas bonne pour toutes sortes de données: les caractéristiques des signaux transitoires signifient une bonne compression en ondelettes, tandis que les signaux lisses et périodiques sont mieux compressés par d’autres méthodes, en particulier la compression harmonique traditionnelle (domaine fréquentiel, comme par les transformées de Fourier et connexes).

Voir Diary Of An x264 Developer: The problems with wavelettes (2010) pour une discussion sur les problèmes pratiques des méthodes actuelles utilisant des ondelettes pour la compression vidéo.

MethodEdit

Une transformée en ondelettes est d’abord appliquée. Cela produit autant de coefficients qu’il y a de pixels dans l’image (c’est-à-dire qu’il n’y a pas encore de compression puisqu’il ne s’agit que d’une transformation). Ces coefficients peuvent alors être compressés plus facilement car l’information est concentrée statistiquement en quelques coefficients seulement. Ce principe est appelé codage par transformation. Après cela, les coefficients sont quantifiés et les valeurs quantifiées sont codées par entropie et / ou par longueur d’exécution.

Quelques applications 1D et 2D de compression d’ondelettes utilisent une technique appelée « empreintes d’ondelettes ».

ÉvaluationEdit

Exigence de compression d’imagedit

Pour la plupart des images naturelles, la densité spectrale de fréquence inférieure est plus élevée. De ce fait, les informations du signal basse fréquence (signal de référence) sont généralement conservées, tandis que les informations du signal de détail sont ignorées. Du point de vue de la compression et de la reconstruction d’image, une ondelette doit répondre aux critères suivants lors de la compression d’image:

  • Être capable de transformer une image plus originale en signal de référence.
  • Reconstruction de la plus haute fidélité basée sur le signal de référence.
  • Ne doit pas conduire à des artefacts dans l’image reconstruits à partir du seul signal de référence.

Exigence de variance de décalage et de comportement de sonnagedit

Le système de compression d’images en ondelettes implique des filtres et une décimation, de sorte qu’il peut être décrit comme un système de variante de décalage linéaire. Un diagramme de transformation d’ondelettes typique est affiché ci-dessous:

 Diagramme de transformation d'ondelettes typique.png

Le système de transformation contient deux filtres d’analyse (un filtre passe-bas h 0(n) {\displaystyle h_{0}(n)}

{\ displaystyle h_{0}(n)}

et un filtre passe-haut h 1(n) {\displaystyle h_{1}(n)}

 h_{1}(n)

), un processus de décimation, un processus d’interpolation et deux filtres de synthèse (g 0(n) {\displaystyle g_{0}(n)}

{\ displaystyle g_{0}(n)}

et g 1(n) {\displaystyle g_{1}(n)}

{\ displaystyle g_{1}(n)}

). Le système de compression et de reconstruction implique généralement des composantes basse fréquence, qui sont les filtres d’analyse h 0(n) {\displaystyle h_{0}(n)}

{\ displaystyle h_{0}(n)}

pour la compression d’image et les filtres de synthèse g 0(n) {\displaystyle g_{0}(n)}

{\ displaystyle g_{0}(n)}

pour la reconstruction. Pour évaluer un tel système, on peut entrer une impulsion δ(n−n i) {\displaystyle\delta(n-n_ {i})}

{\ displaystyle\delta(n-n_{i})}

et observer sa reconstruction h(n−n i) {\displaystyle h(n-n_{i})}

{\ afficher le style h(n-n_ {i})}

; Les ondelettes optimales sont celles qui apportent la variance de décalage minimale et le lobe latéral à h(n−n i) {\displaystyle h(n-n_ {i})}

{\ afficher le style h(n-n_ {i})}

. Même si l’ondelette avec une variance de décalage stricte n’est pas réaliste, il est possible de sélectionner une ondelette avec seulement une légère variance de décalage. Par exemple, nous pouvons comparer la variance de décalage de deux filtres :

Filtres biorthogonaux pour la compression d’images en ondelettes
Longueur Coefficients du filtre Régularité
Filtre à ondelettes 1 H0 9 .852699, .377402, -.110624, -.023849, .037828 1.068
G0 7 .788486, .418092, -.040689, -.064539 1.701
Filtre à ondelettes 2 H0 6 .788486, .047699, -.129078 0.701
G0 10 .615051, .133389, -.067237, .006989, .018914 2.068

En observant les réponses impulsionnelles des deux filtres, on peut conclure que le second filtre est moins sensible à l’emplacement d’entrée (c’est-à-dire qu’il est moins de variante de décalage).

Un autre problème important pour la compression et la reconstruction d’images est le comportement oscillatoire du système, qui peut entraîner de graves artefacts indésirables dans l’image reconstruite. Pour ce faire, les filtres à ondelettes doivent avoir un rapport pic/lobe latéral important.

Jusqu’à présent, nous avons discuté de la transformation en une dimension du système de compression d’image. Ce problème peut être étendu à deux dimensions, tandis qu’un terme plus général – transformées multi-échelles décalables – est proposé.

Dérivation de la réponse impulsionnelledit

Comme mentionné précédemment, la réponse impulsionnelle peut être utilisée pour évaluer le système de compression/ reconstruction d’image.

Pour la séquence d’entrée x(n) = δ(n−n i) {\displaystyle x(n) = \delta(n-n_ {i})}

{\ je n'ai pas de problème.})}

, le signal de référence r1(n) {\displaystyle r_{1}(n)}

{\ displaystyle r_{1}(n)}

après un niveau de décomposition est x(n) ∗ h 0(n) {\displaystyle x(n) * h_{0}(n)}

{\ displaystyle x(n) * h_{0}(n)}

subit une décimation par un facteur deux, tandis que h 0(n) {\displaystyle h_{0}(n)}

{\ displaystyle h_{0}(n)}

est un filtre passe-bas. De même, le signal de référence suivant r2(n) {\displaystyle r_{2}(n)}

{\ displaystyle r_{2}(n)}

est obtenu par r 1(n) ∗ h 0(n) {\displaystyle r_{1}(n) * h_{0}(n)}

{\ displaystyle r_{1}(n) * h_{0}(n)}

subit une décimation par un facteur deux. Après L niveaux de décomposition (et de décimation), la réponse d’analyse est obtenue en conservant un sur 2 L {\displaystyle 2^{L}}

2^{ L}

échantillons: h A (L) (n, n i) = f h 0 (L) (n−n i / 2 L) {\displaystyle h_ {A}^{(L)} (n, n_{i}) = f_ {h0} ^{(L)} (n-n_{i} /2 ^ {L})}

{\ je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec le fait que je n'ai pas de problème avec moi.})}

.

Par contre, pour reconstruire le signal x(n), on peut considérer un signal de référence r L(n) = δ(n−n j) {\displaystyle r_{L}(n) = \delta(n-n_{j})}

{\ ce n'est pas la même chose que les autres.})}

. Si le détail signale d i(n) {\displaystyle d_ {i}(n)}

{\ displaystyle d_ {i}(n)}

sont égaux à zéro pour 1 ≤ i ≤ L {\displaystyle 1\leq i\leq L}

 {\displaystyle 1\leq i\leq L}

, alors le signal de référence à l’étape précédente (L−1 {\displaystyle L-1}

 L-1

étape) est r L−1(n) = g 0(n−2 n j) {\displaystyle r_ {L-1}(n) = g_{0}(n-2n_ {j})}

{\ ce n'est pas la première fois que j'ai un problème.})}

, qui est obtenu en interpolant r L(n) {\displaystyle r_ {L}(n)}

{\ style d'affichage r_{L}(n)}

et convoluant avec g 0(n) {\displaystyle g_{0}(n)}

{\ displaystyle g_{0}(n)}

. De même, la procédure est itérée pour obtenir le signal de référence r(n) {\displaystyle r(n)}

 r(n)

à l’étape L−2, L−3,. . . . , 1 {\displaystyle L-2, L-3,….,1}

{\ afficher le style L-2, L-3,....,1}

. Après L itérations, la réponse impulsionnelle de synthèse est calculée: (n, n i) = f g 0 (L) (n/2 L−n j) {\displaystyle h_ {s}^{(L)} (n, n_{i}) = f_ {g0} ^{(L)} (n/2 ^{L} – n_{j})}

{\ (l)} (n, n_{i}) = f_{g0}^{(L)}(n/2^{L} - n_{j})}

, qui relie le signal de référence r L(n) {\displaystyle r_ {L}(n)}

{\ displaystyle r_{L}(n)}

et le signal reconstruit.

Pour obtenir le système global d’analyse/ synthèse de niveau L, les réponses d’analyse et de synthèse sont combinées comme suit:

h Et S(L) (n, n) = eau k f h 0(L) (k−n / 2 L) f g 0(L)(n/2 L) {\displaystyle h_{MP}^{(L)} (n, n_{i}) = \somme _{k} f_{h0}^{(L)} (k−n_{i}/2^{L}) f_{g0}^{(L)} ( n/2 ^ {L} – k)}

{\ displaystyle h_{MP}^{(L)}(n, n_{i}) = \somme _{k} f_{h0}^{(L)}(k-n_{i}/2^{L}) f_{g0}^{(L)}(n/2^{L}-k)}