Bølgetransformation

Bølgekomprimering er en form for datakomprimering, der er velegnet til billedkomprimering (undertiden også videokomprimering og lydkomprimering). Blandt de mest bemærkelsesværdige implementeringer er JPEG 2000, DjVu og ECV for stillbilleder, CineForm og BBC ‘ s Dirac. Målet er at gemme billeddata på så lidt plads som muligt i en fil. Bølgekompression kan enten være tabsfri eller tabsfri. Bølgekodning er en variant af diskret cosinustransformation (DCT) kodning, der bruger bølger i stedet for DCT ‘ s blokbaserede algoritme.

ved hjælp af en bølgetransformation er bølgekomprimeringsmetoderne tilstrækkelige til at repræsentere transienter, såsom percussionslyde i lyd eller højfrekvente komponenter i todimensionelle billeder, for eksempel et billede af stjerner på en nattehimmel. Dette betyder, at de forbigående elementer i et datasignal kan repræsenteres af en mindre mængde information, end det ville være tilfældet, hvis en anden transformation, såsom den mere udbredte diskrete cosinustransformation, var blevet brugt.

diskret bølgetransformation er med succes blevet anvendt til kompression af elektrokardiograf (EKG) signaler i dette arbejde anvendes den høje korrelation mellem de tilsvarende bølgekoefficienter for signaler fra successive hjertecyklusser ved anvendelse af lineær forudsigelse.

Bølgekomprimering er ikke god til alle slags data: forbigående signalegenskaber betyder god bølgekomprimering, mens glatte, periodiske signaler komprimeres bedre ved andre metoder, især traditionel harmonisk kompression (frekvensdomæne, som ved Fourier-transformationer og relateret).

se dagbog for en h264-Udvikler: problemerne med bølger (2010) til diskussion af praktiske spørgsmål om aktuelle metoder ved hjælp af bølger til videokomprimering.

Metoderedit

først anvendes en bølgetransformation. Dette producerer så mange koefficienter, som der er billedpunkter i billedet (dvs.der er ingen komprimering endnu, da det kun er en transformation). Disse koefficienter kan derefter komprimeres lettere, fordi informationen er statistisk koncentreret i nogle få koefficienter. Dette princip kaldes transformationskodning. Derefter kvantiseres koefficienterne, og de kvantiserede værdier er entropi kodet og/eller kørelængde kodet.

et par 1D-og 2D-anvendelser af bølgekomprimering bruger en teknik kaldet “bølgefodaftryk”.

Evalueringredit

krav til billedkomprimeringredit

for de fleste naturlige billeder er spektrumdensiteten af lavere frekvens højere. Som et resultat bevares information om lavfrekvenssignalet (Referencesignal) generelt, mens informationen i detaljesignalet kasseres. Fra perspektivet af billedkomprimering og rekonstruktion, en bølger skal opfylde følgende kriterier, mens du udfører billedkomprimering:

  • at kunne omdanne mere originalt billede til referencesignalet.
  • genopbygning af højeste troskab baseret på referencesignalet.
  • bør ikke føre til artefakter i billedet rekonstrueret fra referencesignalet alene.

krav til skiftvarians og ringeadfærddet

Bølgebilledkomprimeringssystem involverer filtre og decimering, så det kan beskrives som et lineært skiftvariantsystem. Et typisk bølgetransformationsdiagram vises nedenfor:

typisk bølgetransformationsdiagram.png

transformationssystemet indeholder to analysefiltre (et lavpasfilter h 0 ( n ) {\displaystyle h_{0}(n)}

{\displaystyle h_{0} (n)}

og et højpasfilter h 1 ( n ) {\displaystyle h_{1}(n)}

h_{1}(n)

), en decimeringsproces, en interpolationsproces og to syntesefiltre (g 0 (n) {\displaystyle g_{0} (n)}

{\displaystyle g_{0} (n)}

og g 1 (n) {\displaystyle g_{1} (n)}

{\displaystyle g_{1} (n)}

). Kompressions-og rekonstruktionssystemet involverer generelt lavfrekvente komponenter, som er analysefiltrene h 0 (n) {\displaystyle h_{0} (n)}

{\displaystyle h_{0} (n)}

til billedkomprimering og syntesefiltre g 0 ( n ) {\displaystyle g_{0} (n)}

{\displaystyle g_{0} (n)}

til genopbygning. For at evaluere et sådant system kan vi indtaste en impuls-LARP (n − n i) {\displaystyle \ delta (n-n_{i})}

{\displaystyle \ delta (n-n_{i})}

og overhold dens rekonstruktion h (n – n i) {\displaystyle h (n-n_{i})}

{\displaystyle h (N-n_{i})}

; den optimale bølger er dem, der bringer minimum skift varians og sidelobe til h ( n − n i ) {\displaystyle h(n-n_{i})}

{\displaystyle h (N-n_{i})}

. Selvom bølger med streng skiftvarians ikke er realistisk, er det muligt at vælge bølger med kun lille skiftvarians. For eksempel kan vi sammenligne skiftvariansen af to filtre:

Biorthogonale filtre til bølgebilledkomprimering
Længde Filterkoefficienter regelmæssighed
Bølgefilter 1 H0 9 .852699, .377402, -.110624, -.023849, .037828 1.068
G0 7 .788486, .418092, -.040689, -.064539 1.701
Bølgefilter 2 H0 6 .788486, .047699, -.129078 0.701
G0 10 .615051, .133389, -.067237, .006989, .018914 2.068

ved at observere impulsresponserne fra de to filtre kan vi konkludere, at det andet filter er mindre følsomt over for inputplaceringen (dvs.det er mindre skiftvariant).

et andet vigtigt emne for billedkomprimering og rekonstruktion er systemets oscillerende opførsel, hvilket kan føre til alvorlige uønskede artefakter i det rekonstruerede billede. For at opnå dette skal bølgefiltrene have et stort forhold mellem top og sidelobe.

indtil videre har vi diskuteret om en-dimension transformation af billedkomprimeringssystemet. Dette spørgsmål kan udvides til to dimensioner, mens der foreslås et mere generelt udtryk – skiftbar multiskala – transformationer.

afledning af impulsresponsedit

som tidligere nævnt kan impulsrespons bruges til at evaluere billedkomprimerings – /rekonstruktionssystemet.

for indgangssekvensen h (n) = l (n – n i) {\displaystyle h (n)= \ delta (n-n_{i})}

{\(n)=\delta (n-n_{i})}

, referencesignalet r 1 (n) {\displaystyle r_{1} (n)}

{\displaystyle r_{1} (n)}

efter et niveau af nedbrydning er h (N) L h 0 ( n ) {\displaystyle h(n)*H_{0} (n)}

{\(n) * H_{0} (n)}

går gennem decimering med en faktor på to, mens h 0 (n) {\displaystyle h_{0}(n)}

{\displaystyle h_{0} (n)}

er et lavpasfilter. Tilsvarende er det næste Referencesignal r 2 (n) {\displaystyle r_{2}(n)}

{\displaystyle r_{2} (n)}

opnås ved r 1 (n) ren h 0 ( n ) {\displaystyle r_{1}(n)*h_{0} (n)}

{\displaystyle r_{1} (n)*h_{0} (n)}

går gennem decimering med en faktor på to. Efter L niveauer af nedbrydning (og decimering) opnås analyseresponsen ved at beholde en ud af hver 2 L {\displaystyle 2^{L}}

2^{L}

prøver: h A (L) (n , n i ) = f H 0 ( L ) ( n − n i / 2 L) {\displaystyle h_{a}^{(L)} (n,n_{i})=f_{h0}^{(L)} (n-n_{i} / 2^{L})}

{\displaystyle h_{a}^{(L)} (n, n_{i})=f_{h0}^{(L)} (n-n_{i} / 2^{L})}

.

på den anden side, for at rekonstruere signalet h (n), kan vi overveje et Referencesignal r L (n) = prisT (n − n j) {\displaystyle r_{L} (n)= \ delta (n-n_{j})}

{\displaystyle r_{L} (n)= \ delta (n-n_{j})}

. Hvis detaljen signalerer d i (n) {\displaystyle d_{i} (n)}

{\displaystyle d_{i}(n)}

er lig med nul for 1 liter i l {\displaystyle 1\LEKS i\LEKS L}

{\displaystyle 1\LEKS i\LEKS L}

, derefter referencesignalet i det foregående trin ( L − 1 {\displaystyle L-1}

L-1

trin) er R L − 1 ( n ) = g 0 ( n − 2 n j ) {\displaystyle R_{l-1}(n)=G_{0}(n-2n_{j})}

{\displaystyle r_{L-1} (n)=g_{0} (n-2n_{j})}

, som opnås ved interpolering af r L (n) {\displaystyle r_{L} (n)}

{\displaystyle r_{l} (n)}

og omvikling med g 0 ( n) {\displaystyle g_{0} (n)}

{\displaystyle g_{0} (n)}

. Tilsvarende gentages proceduren for at opnå referencesignalet r(n ) {\displaystyle r(n)}

r (n)

i trin L − 2 , L − 3 , . . . . ,1 {\displaystyle L-2, L-3,….,1}

{\displaystyle L-2, L-3,....,1}

. Efter L iterationer beregnes synteseimpulsresponsen: h s (L) (n , n i ) = f g 0 ( L ) ( n / 2 L-N j ) {\displaystyle h_{s}^{(L)}(n,n_{i})=f_{g0}^{(L)}(n/2^{L} – n_{j})}

{\displaystyle h_{s}^{(L)} (n, n_{i})=f_{g0}^{(L)} (n/2^{L}-n_{j})}

, som vedrører referencesignalet r L (n) {\displaystyle r_{L} (n)}

{\displaystyle r_{L} (n)}

og det rekonstruerede signal.

for at opnå det samlede l-niveau analyse/syntesesystem kombineres analysen og synteseresponserne som nedenfor:

h og S ( L ) ( n , n ) = vand k F H 0 ( L ) ( k − n / 2 L ) f G 0 ( L ) ( n / 2 L − k ) {\displaystyle h_{MP}^{(L)}(n,n_{i})=\sum _{k}f_{h0}^{(L)}(k-n_{i}/2^{L})f_{g0}^{(L)}(N/2^{l}-k)}

{\displaystyle h_{MP}^{(L)}(n,n_{i})=\sum _{k}f_{h0}^{(L)} (k-n_{i} / 2^{L})f_{g0}^{(L)} (n/2^{L} - k)}