Diskrete Cosinus -Transformation

A Diskrete Cosinus -Transformation (DCT) drückt eine endliche Folge von aus Datenpunkte in Bezug auf eine Summe von Kosinus Funktionen, die unterschiedlich schwanken Frequenzen. Der DCT, zuerst vorgeschlagen von Nasir Ahmed 1972 ist eine weit verbreitete Transformationstechnik in Signalverarbeitung und Datenkompression. Es wird in den meisten verwendet digitale Medien, einschließlich Digitale Bilder (wie zum Beispiel JPEG und Heif, wo kleine Hochfrequenzkomponenten verworfen werden können), digitales Video (wie zum Beispiel MPEG und H.26X), digitaler Ton (wie zum Beispiel Dolby Digital, MP3 und AAC), digitaler Fernseher (wie zum Beispiel SDTV, HDTV und Vod), digitales Radio (wie zum Beispiel AAC+ und Tupfen+), und Sprachcodierung (wie zum Beispiel AAC-ld, Sirene und Opus). DCTs sind auch für zahlreiche andere Anwendungen in wichtig Wissenschaft und Ingenieurswesen, wie zum Beispiel digitale Signalverarbeitung, Telekommunikation Geräte, reduzieren Netzwerk Bandbreite Verwendung und Spektralmethoden für die numerische Lösung von partielle Differentialgleichungen.

Die Verwendung von Cosinus eher als Sinus Funktionen sind für die Komprimierung von entscheidender Bedeutung, da herausstellt Signal, während für Differentialgleichungen die Cosines eine bestimmte Wahl ausdrücken Randbedingungen. Insbesondere ist ein DCT a Fourier-bezogene Transformation ähnlich wie diskrete Fourier-Transformation (DFT), aber nur verwenden reale Nummern. Die DCTs sind im Allgemeinen mit den Fourier -Serienkoeffizienten einer regelmäßigen und symmetrisch erweiterten Sequenz zusammenhängen, während DFTs mit den Fourier -Serienkoeffizienten nur periodisch erweiterten Sequenzen verwandt sind. DCTs entsprechen DFTs von ungefähr doppelt so hoch wie bei realen Daten mit eben Symmetrie (da die Fourier -Transformation einer realen und gleichmäßigen Funktion real und gleichmäßig ist), während in einigen Varianten die Eingangs- und/oder Ausgangsdaten durch eine halbe Probe verschoben werden. Es gibt acht Standard -DCT -Varianten, von denen vier häufig sind.

Die häufigste Variante der diskreten Cosinus-Transformation ist der Typ-II-DCT, der oft einfach als "DCT" bezeichnet wird. Dies war der ursprüngliche DCT, wie er erstmals von Ahmed vorgeschlagen wurde. Sein umgekehrt, der Typ-III-DCT, wird entsprechend oft als "inverse DCT" oder "die IDCT" bezeichnet. Zwei verwandte Transformationen sind die Diskrete Sinustransformation (DST), was einer DFT von Real und entspricht seltsam Funktionen und die modifizierte diskrete Cosinus -Transformation (MDCT), das auf einer DCT von basiert überlappend Daten. Mehrdimensionale DCTs (MD -DCTs) werden entwickelt, um das Konzept von DCT auf MD -Signale auszudehnen. Es gibt mehrere Algorithmen, um MD DCT zu berechnen. Es wurde eine Vielzahl von schnellen Algorithmen entwickelt, um die rechnerische Komplexität der Implementierung von DCT zu verringern. Eine davon ist die Ganzzahl DCT[1] (INTDCT), a ganze Zahl Näherung des Standard -DCT,[2]:ix, xiii, 1, 141–304 in mehreren verwendet ISO/IEC und Itu-t internationale Standards.[1][2]

Die DCT -Komprimierung, auch als Blockkomprimierung bezeichnet, komprimiert Daten in Sätzen diskreter DCT -Blöcke.[3] DCT -Blöcke können eine Reihe von Größen haben, einschließlich 8x8 Pixel für den Standard -DCT und unterschiedliche Ganzzahl -DCT -Größen zwischen 4x4 und 32 x 32 Pixel.[1][4] Der DCT hat eine starke "Energieverdichtung" -Sachge.[5][6] in der Lage, eine hohe Qualität bei hoch zu erreichen Datenkomprimierungsverhältnisse.[7][8] Blocky jedoch Kompressionsartefakte kann angezeigt werden, wenn eine starke DCT -Kompression angewendet wird.

Geschichte

Nasir Ahmed, der Erfinder der diskreten Cosinus -Transformation (DCT), die er 1972 zum ersten Mal vorschlug.

Die diskrete Cosinus -Transformation (DCT) wurde zuerst durch konzipiert Nasir Ahmedwährend der Arbeit bei Kansas State Universityund er schlug das Konzept dem vor Nationale Wissenschaftsstiftung 1972 beabsichtigte er ursprünglich DCT für Bildkompression.[9][1] Ahmed entwickelte einen praktischen DCT -Algorithmus mit seinem Doktorand T. Raj Natarajan und Freund K. R. Rao Bei der Universität von Texas in Arlington 1973 stellten sie fest, dass es der effizienteste Algorithmus für die Bildkomprimierung war.[9] Sie präsentierten ihre Ergebnisse in einem Papier im Januar 1974 mit dem Titel " Diskrete Cosinus -Transformation.[5][6][10] Es wurde beschrieben, was jetzt als Typ-II DCT (DCT-II) bezeichnet wird.[2]:51 sowie die Typ-III-inverse DCT (IDCT).[5] Es war eine Benchmark -Veröffentlichung,[11][12] und wurde seit seiner Veröffentlichung als grundlegende Entwicklung in Tausenden von Werken zitiert.[13] Die Grundlagenforschungsarbeiten und Ereignisse, die zur Entwicklung des DCT führten, wurden in einer späteren Veröffentlichung von Ahmed zusammengefasst: "Wie ich mit der diskreten Cosinus -Transformation gekommen bin".[9]

Seit seiner Einführung im Jahr 1974 wurden signifikante Untersuchungen zur DCT durchgeführt.[10] 1977 veröffentlichte Wen-Hsiung Chen eine Zeitung mit C. Harrison Smith und Stanley C. Fralick, die einen schnellen DCT-Algorithmus präsentierten.[14][10]Weitere Entwicklungen umfassen ein 1978er Papier von M. J. Narasimha und A.M. Peterson und ein Papier von 1984 von B.G. Lee.[10] Diese Forschungsarbeiten wurden zusammen mit dem ursprünglichen Ahmed Paper von 1974 und dem Chen Paper von 1977 von der zitiert Gemeinsame fotografische Expertengruppe als Grundlage für JPEG'S Lust Bildkomprimierungsalgorithmus im Jahr 1992.[10][15]

1975 adaptierten John A. Roese und Guner S. Robinson die DCT für Zwischenrahmen Bewegung kompensiert Videocodierung. Sie experimentierten mit dem DCT und dem Schnelle Fourier-Transformation (FFT), entwickelte Zwischen-Frame-Hybrid-Codierer für beide und stellte fest, dass der DCT aufgrund seiner reduzierten Komplexität am effizientesten ist, was die Bilddaten auf 0,25 komprimiert kann.bisschen pro Pixel Für ein Videotelephone Szene mit Bildqualität vergleichbar mit einem Intra-Frame-Codierer, der 2-Bit pro Pixel erfordert.[16][17] 1979,, Anil K. Jain und Jaswant R. Jain entwickelte weiter motion-kompensierte DCT-Videokomprimierung,[18][19] auch Blockbewegungskompensation bezeichnet.[19] Dies führte dazu, dass Chen 1981 einen praktischen Videokomprimierungsalgorithmus entwickelte, der als Motion-kompensierte DCT oder adaptive Szenencodierung bezeichnet wurde.[19] Motion-kompensierte DCT wurde später zur Standardcodierungstechnik für die Videokomprimierung ab Ende der 1980er Jahre.[20][21]

Die Ganzzahl DCT wird in verwendet Erweiterte Videocodierung (AVC),[22][1] im Jahr 2003 eingeführt und Hocheffizienz Videocodierung (HEVC),[4][1] eingeführt im Jahr 2013. Die Ganzzahl DCT wird auch in der verwendet Hocheffizienzbildformat (Heif), das eine Teilmenge der verwendet HEVC Video -Codierungsformat zum Codieren von Standbildern.[4]

Eine DCT -Variante, die modifizierte diskrete Cosinus -Transformation (MDCT), wurde von John P. Princen, A.W. Johnson und Alan B. Bradley am Universität Surrey 1987,,[23] Nach früheren Arbeiten von Princen und Bradley im Jahr 1986.[24] Die MDCT wird in den meisten modernsten verwendet Audiokomprimierung Formate wie z. Dolby Digital (AC-3),[25][26] MP3 (die eine hybride DCT-Fft Algorithmus),[27] Erweiterte Audiocodierung (AAC),[28] und Vorbis (Ogg).[29]

Das Diskrete Sinustransformation (DST) wurde aus dem DCT abgeleitet, indem die ersetzt wurde Neumann -Zustand bei x = 0 mit einer Dirichlet -Zustand.[2]:35-36 Die DST wurde im DCT -Papier von 1974 von Ahmed, Natarajan und Rao beschrieben.[5] Ein Typ-I-DST (DST-I) wurde später von beschrieben von Anil K. Jain 1976 wurde ein Typ-II-DST (DST-II) von H.B. Kekra und J.K. Solanka im Jahr 1978.[30]

Nasir Ahmed entwickelte auch einen verlustfreien DCT -Algorithmus mit Giridhar Mandyam und Neeraj Magotra am Universität von New Mexico 1995. Dies ermöglicht die DCT -Technik für die Verwendung Verlustfreie Kompression von Bildern. Es ist eine Modifikation des ursprünglichen DCT -Algorithmus und enthält Elemente von inverser DCT und Delta -Modulation. Es ist ein effektiverer verlustfreier Komprimierungsalgorithmus als Entropie -Codierung.[31] Verlustloser DCT ist auch als LDCT bekannt.[32]

Anwendungen

Der DCT ist die am häufigsten verwendete Transformationstechnik in Signalverarbeitung,[33] und bei weitem die am häufigsten verwendete lineare Transformation in Datenkompression.[34] Unkomprimiert digitale Medien ebenso gut wie Verlustfreie Kompression hatte unpraktisch hoch Erinnerung und Bandbreite Anforderungen, die durch den hocheffizienten DCT erheblich reduziert wurden Verlustige Komprimierung Technik,[7][8] in der Lage zu erreichen Datenkomprimierungsverhältnisse von 8: 1 bis 14: 1 für nahezu studioqualität,[7] bis zu 100: 1 für Inhalte von akzeptabler Qualität.[8] DCT -Komprimierungsstandards werden in digitalen Medientechnologien verwendet, wie z. Digitale Bilder, Digitale Fotos,[35][36] digitales Video,[20][37] Streaming Medien,[38] digitaler Fernseher, Fernsehen streamen, Video auf Nachfrage (VOD),[8] Digitales Kino,[25] Hochdefinitionsvideo (HD -Video) und Hochdefinitionsfernseher (HDTV).[7][39]

Der DCT und insbesondere der DCT-II wird häufig in der Signal- und Bildverarbeitung verwendet, insbesondere für die verlustige Komprimierung, da sie eine starke "Energieverdichtung" -Sache hat:[5][6] In typischen Anwendungen konzentrieren sich die meisten Signalinformationen tendenziell in einigen Niederfrequenzkomponenten des DCT. Für stark korrelierte Markov ProzesseDas DCT kann sich der Verdichtungseffizienz des Karhunen-loève Transform (was im Dekorrelationssinn optimal ist). Wie nachstehend erläutert, stammt dies aus den Randbedingungen, die in den Kosinusfunktionen impliziert sind.

DCTs sind auch bei der Lösung weit verbreitet partielle Differentialgleichungen durch Spektralmethoden, wobei die verschiedenen Varianten des DCT an den beiden Enden des Arrays leicht unterschiedliche gleiche/ungerade Randbedingungen entsprechen.

DCTs sind ebenfalls eng miteinander verbunden mit Chebyshev -Polynomeund schnelle DCT -Algorithmen (unten) werden in verwendet Chebyshev -Annäherung von willkürlichen Funktionen nach Reihe von Chebyshev -Polynomen, zum Beispiel in Clenshaw -Curtis -Quadratur.

Der DCT ist der Codierungsstandard für Multimedia Telekommunikation Geräte. Es wird weit verbreitet für Bitrate Reduktion und Reduzierung Netzwerk Bandbreite Verwendungszweck.[1] Die DCT -Komprimierung reduziert die Menge an Speicher und Bandbreite, die für die erforderlichen für die erforderlichen Zeiten erforderlich sind Digitale Signale.[8]

Allgemeine Anwendungen

Der DCT wird in vielen Anwendungen häufig verwendet, einschließlich der folgenden.

DCT visuelle Medienstandards

Der DCT-II, auch als einfach das DCT bekannt, ist das wichtigste Bildkompression Technik. Es wird in Bildkomprimierungsstandards wie verwendet, z. JPEG, und Video-Kompression Standards wie H.26X, MJPEG, MPEG, Dv, Theora und Daala. Dort die zweidimensionale DCT-II von Blöcke werden berechnet und die Ergebnisse sind quantisiert und Entropie codiert. In diesem Fall, ist typischerweise 8 und die DCT-II-Formel wird auf jede Zeile und die Spalte des Blocks angewendet. Das Ergebnis ist ein 8 × 8 -Transformationskoeffizientenarray, in dem die Element (obere links) ist die DC-Komponente (Zero-Frequency) und die Einträge mit zunehmenden vertikalen und horizontalen Indexwerten stellen höhere vertikale und horizontale räumliche Frequenzen dar.

Erweiterte Videocodierung (AVC) verwendet die Ganzzahl DCT[22][1] (INTDCT), eine Ganzzahl -Näherung des DCT.[2][1] Es werden 4x4- und 8x8 -Ganzzahl -DCT -Blöcke verwendet. Hocheffizienz Videocodierung (HEVC) und die Hocheffizienzbildformat (Heif) Verwenden Sie unterschiedliche Ganzzahl -DCT -Blockgrößen zwischen 4x4 und 32x32 Pixel.[4][1] Ab 2019, AVC ist bei weitem das am häufigsten verwendete Format für die Aufzeichnung, Komprimierung und Verteilung von Videoinhalten, die von 91% der Videoentwickler verwendet wird, gefolgt von HEVC, das von 43% der Entwickler verwendet wird.[47]

Bildformate

Bildkompression Standard Jahr Gemeinsame Anwendungen
JPEG[1] 1992 Die am weitesten gebrauchten Bildkompression Standard[56][57] und digital Bildformat,[50]
JPEG XR 2009 Offene XML -Papierspezifikation
Webp 2010 Ein grafisches Format, das die unterstützt Verlustige Komprimierung von Digitale Bilder. Entwickelt von Google.
Hocheffizienzbildformat (Heif) 2013 Bilddateiformat bezogen auf HEVC Kompression. Es verbessert die Komprimierung über JPEG,[58] und unterstützt Animation mit viel effizienterer Komprimierung als die Animiertes GIF Format.[59]
BPG 2014 Bezogen auf HEVC Kompression
JPEG XL[60] 2020 Ein lizenzfreies Raster-Graphics-Dateiformat, das sowohl verlust- als auch verlustfreie Komprimierung unterstützt.

Videoformate

Videocodierungsstandard Jahr Gemeinsame Anwendungen
H.261[61][62] 1988 Erster einer Familie von Videocodierungsstandards. In erster Linie älter verwendet Videokonferenzen und Video Telefon Produkte.
Bewegung JPEG (MJPEG)[63] 1992 Schnelle Zeit, Videobearbeitung, Nichtlineare Bearbeitung, Digitalkameras
MPEG-1 Video[64] 1993 Digitales Video Verteilung auf CD oder Internetvideo
MPEG-2-Video (H.262)[64] 1995 Lagerung und Handhabung von Digitale Bilder in Rundfunkanwendungen, digitaler Fernseher, HDTV, Kabel, Satellit, Hochgeschwindigkeit Internet, DVD Videoverteilung
Dv 1995 Camcorder, Digitale Kassetten
H.263 (MPEG-4 Teil 2)[61] 1996 Videotelefonie Über öffentliches Fernsprechwählnetz (PSTN), H.320, Digitales Netzwerk integrierter Dienste (ISDN)[65][66]
Erweiterte Videocodierung (AVC / H.264 / MPEG-4)[1][22] 2003 Am gebräuchlichsten HD -Video Aufzeichnung/Komprimierung/Verteilungsformat, Internetvideo, Youtube, Blu-ray-Discs, HDTV Sendungen, Internetbrowser, Fernsehen streamen, mobile Geräte, Verbrauchergeräte, Netflix,[46] Videotelefonie, Facetime[45]
Theora 2004 Internetvideo, Webbrowser
VC-1 2006 Fenster Medien, Blu-ray-Discs
Apfelküste 2007 Fachmann Video Produktion.[54]
Webm Video 2010 A Multimedia Open -Source -Format entwickelt von von Google beabsichtigt, mit verwendet zu werden mit HTML5.
Hocheffizienz Videocodierung (HEVC / H.265)[1][4] 2013 Der aufstrebende Nachfolger des H.264/MPEG-4-AVC-Standards, der die Kompressionsfähigkeit erheblich verbessert hat.
Daala 2013 Forschungsvideoformat von Xiph.org.
AV1[67] 2018 Ein Open -Source -Format basierend auf VP10 (VP9interner Nachfolger), Daala und Thor; Wird von Inhaltsanbietern verwendet, wie z. Youtube[68][69] und Netflix.[70][71]

MDCT -Audiostandards

Allgemeines Audio

Audiokomprimierung Standard Jahr Gemeinsame Anwendungen
Dolby Digital (AC-3)[25][26] 1991 Kino, Digitales Kino, DVD, Blu-Ray, Streaming Medien, Videospiele
Adaptive Transformation akustische Codierung (ATRAC)[25] 1992 Minidisc
MPEG -Schicht III (MP3)[27][1] 1993 Digitaler Ton Verteilung, Mp3-Player, Tragbare Medienspieler, Streaming Medien
Wahrnehmungs -Audio -Coder (PAC)[25] 1996 Digitaler Audio -Radio -Service (Dars)
Erweiterte Audiocodierung (AAC / MP4 Audio)[28][25] 1997 Digitaler Ton Verteilung, Tragbare Medienspieler, Streaming Medien, Spielekonsole, mobile Geräte, iOS, iTunes, Android, Brombeere
Hocheffiziente erweiterte Audiocodierung (AAC+)[72][42]:478] 1997 Digitales Radio, Digital Audio Broadcasting (Dab+),[42] Digital Radio Mondiale (DRM)
Cook Codec 1998 Realaudio
Windows Media Audio (WMA)[25] 1999 Windows Media
Vorbis[29][25] 2000 Digitaler Ton Verteilung, Radio Stationen, Streaming Medien, Videospiele, Spotify, Wikipedia
Hochdefinitions-Codierung (HDC)[43] 2002 Digitales Radio, HD -Radio
Dynamic Resolution Adaptation (DRA)[25] 2008 China National Audio Standard, China Multimedia Mobile Broadcasting, DVB-H
Opus[73] 2012 VoIP,[74] Mobiltelefonie, WhatsApp,[75][76][77] Playstation 4[78]
Dolby AC-4[79] 2017 ATSC 3.0, Ultrahoch-Definition-Fernseher (UHD TV)
MPEG-H 3D-Audio[80]

Sprachcodierung

Sprachcodierung Standard Jahr Gemeinsame Anwendungen
AAC-ld (LD-MDCT)[81] 1999 Mobiltelefonie, Voice-over-ip (VoIP), iOS, Facetime[45]
Sirene[44] 1999 Voip, Breitband -Audio, G.722.1
G.722.1[82] 1999 VoIP, Breitband -Audio, G.722
G.729.1[83] 2006 G.729, VoIP, Breitband -Audio,[83] Mobiltelefonie
EVRC-W[42]:31, 478] 2007 Breitband -Audio
G.718[84] 2008 VoIP, Breitband -Audio, Mobiltelefonie
G.719[42] 2008 Telefonkonferenz, Videokonferenz, Voicemail
KELTE[85] 2011 VoIP,[86][87] Mobiltelefonie
Verbesserte Sprachdienste (EVS)[88] 2014 Mobiltelefonie, VoIP, Breitband -Audio

MD DCT

Multidimensionale DCTs (MD-DCTs) haben mehrere Anwendungen, hauptsächlich 3-D-DCTs wie 3-D-DCT-II, die mehrere neue Anwendungen wie hyperspektrale Bildgebungs-Codierungssysteme aufweisen.[89] variable zeitliche Länge 3-D-DCT-Codierung,[90] Videocodierung Algorithmen,[91] Adaptive Video -Codierung [92] und 3-D-Komprimierung.[93] Aufgrund der Verbesserung der Hardware, Software und Einführung mehrerer schneller Algorithmen nimmt die Notwendigkeit der Verwendung von M-D-DCTs rasch zu. DCT-IV hat für seine Anwendungen bei der schnellen Implementierung von realwerten Polyphase-Filterbanken an Popularität gewonnen.[94] geläutete orthogonale Transformation[95][96] und Cosinus-modulierte Wavelet-Basen.[97]

Digitale Signalverarbeitung

DCT spielt eine sehr wichtige Rolle in digitale Signalverarbeitung. Durch die Verwendung des DCT können die Signale komprimiert werden. DCT kann in verwendet werden Elektrokardiographie Für die Kompression von EKG -Signalen. DCT2 bietet ein besseres Kompressionsverhältnis als DCT.

Der DCT ist weithin implementiert in Digitale Signalprozessoren (DSP) sowie digitale Signalverarbeitungssoftware. Viele Unternehmen haben DSPs auf der Grundlage der DCT -Technologie entwickelt. DCTs werden häufig für Anwendungen wie z. Codierung, Decodierung, Video, Audio, Multiplexing, Kontrollsignale, Signalisierung, und Analog-Digital-Konvertierung. DCTs werden auch häufig für verwendet Hochdefinitionsfernseher (HDTV) -Codierer/Decoder Chips.[1]

Kompressionsartefakte

Ein häufiges Problem bei der DCT -Kompression in digitale Medien sind blockig Kompressionsartefakte,[98] verursacht durch DCT -Blöcke.[3] Der DCT-Algorithmus kann blockbasierte Artefakte verursachen, wenn eine starke Komprimierung angewendet wird. Aufgrund des DCT, der in der Mehrheit von verwendet wird digitales Bild und Videocodierungsstandards (so wie die JPEG, H.26X und MPEG Formate), DCT-basierte blockische Komprimierungsartefakte sind weit verbreitet in digitale Medien. In einem DCT -Algorithmus wird ein Bild (oder einen Rahmen in einer Bildsequenz) in quadratische Blöcke unterteilt, die unabhängig voneinander verarbeitet werden, dann wird die DCT dieser Blöcke entnommen und die resultierenden DCT -Koeffizienten sind quantisiert. Dieser Prozess kann zu Blockieren von Artefakten führen, hauptsächlich bei hoch Datenkomprimierungsverhältnisse.[98] Dies kann auch das "verursachen" verursachen "Mückenrauschen"Effekt, häufig in gefunden in digitales Video (wie die MPEG -Formate).[99]

DCT -Blöcke werden häufig in verwendet Pannenkunst.[3] Der Künstler Rosa Menkman Verwendet von DCT-basierten Komprimierungsartefakten in ihrer Glitch Art,[100] insbesondere die DCT -Blöcke in den meisten digitale Medien Formate wie JPEG Digitale Bilder und MP3 digitaler Ton.[3] Ein anderes Beispiel ist Jpegs vom deutschen Fotografen Thomas Ruff, was absichtlich verwendet JPEG Artefakte als Grundlage des Bildstils.[101][102]

Informeller Übersicht

Wie jede fourierbezogene Transformation drücken diskrete Cosinus-Transformationen (DCTs) eine Funktion oder ein Signal in Bezug auf eine Summe von Sinusoide mit unterschiedlichen Frequenzen und Amplituden. Wie diskrete Fourier-Transformation (DFT) arbeitet ein DCT mit einer endlichen Anzahl diskreter Datenpunkte mit einer Funktion. Die offensichtliche Unterscheidung zwischen einem DCT und einem DFT besteht darin, dass er erstere nur Kosinusfunktionen verwendet, während der letztere sowohl Cosinus als auch Sinus verwendet (in Form von Komplexe Exponentiale). Dieser sichtbare Unterschied ist jedoch lediglich eine Folge einer tieferen Unterscheidung: Ein DCT impliziert unterschiedliche Randbedingungen aus der DFT oder anderen verwandten Transformationen.

Die Fourier-bezogenen Transformationen, die eine Funktion über ein endliches Unternehmen betreiben Domain, wie der DFT oder DCT oder a die Fourierreihe, kann als implizit definiert werden Verlängerung dieser Funktion außerhalb der Domäne. Das heißt, sobald Sie eine Funktion schreiben Als eine Summe von Sinusoiden können Sie diese Summe bei jeder bewerten , sogar für wo das Original wurde nicht angegeben. Die DFT impliziert wie die Fourier -Serie a periodisch Erweiterung der ursprünglichen Funktion. Ein DCT, wie a Cosinus -Transformationimpliziert eine eben Erweiterung der ursprünglichen Funktion.

Darstellung der impliziten gleichmäßigen/ungeraden Erweiterungen von DCT -Eingabedaten für N= 11 Datenpunkte (rote Punkte) für die vier häufigsten Arten von DCT (Typen I-IV).

Da DCT jedoch weitergeht endlich, diskret Sequenzen, zwei Probleme treten auf, die nicht für die kontinuierliche Cosinus -Transformation gelten. Zuerst muss man angeben, ob die Funktion gerade oder ungerade bei ist beide die linke und rechte Grenzen der Domäne (d. H. Die min-n und Max-n Grenzen in den folgenden Definitionen). Zweitens muss man herumspezifizieren welcher Punkt Die Funktion ist ausgeglichen oder ungerade. Betrachten Sie insbesondere eine Sequenz A B C D von vier gleich verteilten Datenpunkten und sagen, dass wir eine gleichmäßige spezifizieren links Grenze. Es gibt zwei vernünftige Möglichkeiten: Beide Daten handeln sogar um die Stichprobe aIn diesem Fall ist die gleichmäßige Erweiterung DCBABCDoder die Daten sind sogar um den Punkt auf halber Strecke zwischen a und der vorherige Punkt, in welchem ​​Fall die gleichmäßige Erweiterung ist DCBAABCD (a wird wiederholt).

Diese Entscheidungen führen zu allen Standardvariationen von DCTs und auch zu Diskrete Sinus -Transformationen (DSTs). Jede Grenze kann entweder gerade oder ungerade sein (2 Auswahlmöglichkeiten pro Grenze) und kann um einen Datenpunkt oder den Punkt auf halber Strecke zwischen zwei Datenpunkten (2 Auswahl pro Grenze) symmetrisch sein, für insgesamt 2 × 2 × 2 × 2 = 16 Möglichkeiten. Die Hälfte dieser Möglichkeiten, bei denen die links Die Grenze ist ausgeglichen, entspricht den 8 Arten von DCT; Die andere Hälfte sind die 8 Arten von DST.

Diese unterschiedlichen Randbedingungen beeinflussen die Anwendungen der Transformation stark und führen zu einzigartig nützlichen Eigenschaften für die verschiedenen DCT -Typen. Am direktesten, wenn Fourier-bezogene Transformationen zur Lösung verwendet werden partielle Differentialgleichungen durch SpektralmethodenDie Randbedingungen werden direkt als Teil des Problems des Problems angegeben. Oder für die MDCT (Basierend auf dem Typ-IV-DCT) sind die Randbedingungen eng an der kritischen Eigenschaft des MDCT für die Stornierung von Zeitdomänen-Aliasing beteiligt. In einer subtileren Weise sind die Randbedingungen für die Eigenschaften der "Energieverfassung" verantwortlich, die DCTs für die Bild- und Audio-Komprimierung nützlich machen, da die Grenzen die Konvergenzrate einer Fourier-ähnlichen Serie beeinflussen.

Insbesondere ist bekannt, dass jeder Diskontinuitäten in einer Funktion reduzieren die Konvergenzrate von der Fourier -Serie, so dass mehr Sinusoide benötigt werden, um die Funktion mit einer bestimmten Genauigkeit darzustellen. Das gleiche Prinzip regelt die Nützlichkeit der DFT und andere Transformationen für die Signalkomprimierung; Je reibungsloser eine Funktion ist, desto weniger Begriffe in seinem DFT oder DCT sind erforderlich, um sie genau darzustellen, und desto mehr kann sie komprimiert werden. (Hier denken wir an die DFT oder DCT als Annäherungen an die die Fourierreihe oder Cosinus -Serie von einer Funktion, um über seine "Glätte" zu sprechen.) Die implizite Periodizität des DFT bedeutet jedoch, dass Diskontinuitäten normalerweise an den Grenzen auftreten: Jedes zufällige Segment eines Signals ist unwahrscheinlich, dass es bei beiden den gleichen Wert hat linke und rechte Grenzen. (Ein ähnliches Problem tritt für die DST auf, bei der die ungerade linke Grenzbedingung eine Diskontinuität für jede Funktion impliziert, die an dieser Grenze nicht null ist.) Im Gegensatz beide Grenzen sind gleichmäßig stets ergibt eine kontinuierliche Verlängerung an den Grenzen (obwohl die Neigung ist im Allgemeinen diskontinuierlich). Aus diesem Grund können DCTs und insbesondere DCTs der Typen I, II, V und VI (die Typen mit zwei gleichmäßigen Grenzen) im Allgemeinen besser für die Signalkomprimierung abschneiden als DFTs und DSTs. In der Praxis wird ein Typ-II-DCT normalerweise für solche Anwendungen bevorzugt, teilweise aus Gründen der Berechnung der Bequemlichkeit.

Formale Definition

Formal ist die diskrete Cosinus -Transformation a linear, invertierbar Funktion (wo bezeichnet den Satz von reale Nummern) oder gleichwertig ein invertierbares N × N quadratische Matrix. Es gibt mehrere Varianten des DCT mit leicht modifizierten Definitionen. Das N reale Nummern werden in die verwandelt N reale Nummern Nach einer der Formeln:

DCT-I

Einige Autoren multiplizieren die weiter und Begriffe von und entsprechend multiplizieren Sie die und Begriffe von was die DCT-I-Matrix macht senkrecht, wenn man sich weiter mit einem Gesamtskala -Faktor von multipliziert bricht aber die direkte Korrespondenz mit einem Real-Even DFT.

Das DCT-I ist genau äquivalent (bis zu einem Gesamtskalierungsfaktor von 2) zu a DFT von reelle Zahlen mit sogar Symmetrie. Zum Beispiel ein DCT-I von reale Nummern entspricht genau einer DFT von acht reellen Zahlen (sogar Symmetrie), geteilt durch zwei. (Im Gegensatz dazu beinhaltet DCT-Typen II-IV eine Verschiebung der halben Stichprobe im äquivalenten DFT.)

Beachten Sie jedoch, dass das DCT-I nicht definiert ist für weniger als 2, während alle anderen DCT -Typen für jeden positiv definiert sind

Somit entspricht das DCT-I den Randbedingungen: ist sogar da Und sogar herum ; Ähnlich für

DCT-II

Das DCT-II ist wahrscheinlich die am häufigsten verwendete Form und wird oft einfach als "DCT" bezeichnet.[5][6]

Diese Transformation ist genau äquivalent (bis zu einem Gesamtskala -Faktor von 2) zu a DFT von Reale Eingaben gleichmäßiger Symmetrie, bei denen die geraden Elemente Null sind. Das heißt, es ist die Hälfte der DFT des Eingänge wo zum und zum DCT-II-Transformation ist auch mit 2 möglich möglichN Signal, gefolgt von einer Multiplikation mit der halben Verschiebung. Dies wird von demonstriert Makhoul.

Einige Autoren multiplizieren die weiter Begriff von und multiplizieren Sie die resultierende Matrix mit einem Gesamtskala -Faktor von (Siehe unten für die entsprechende Änderung in DCT-III). Dies macht die DCT-II-Matrix senkrechtbricht aber die direkte Korrespondenz mit einem Real-Even DFT von halb verschobenen Eingaben. Dies ist die Normalisierung durch MatlabZum Beispiel siehe.[103] In vielen Anwendungen, wie z. JPEGDie Skalierung ist willkürlich, da Skalenfaktoren mit einem nachfolgenden rechnerischen Schritt kombiniert werden können (z. B. die Quantisierung Schritt in JPEG[104]) und eine Skalierung kann ausgewählt werden, mit der der DCT mit weniger Multiplikationen berechnet werden kann.[105][106]

Der DCT-II impliziert die Randbedingungen: ist sogar da Und sogar herum ist sogar da und seltsam herum

DCT-III

Da es sich um die Umkehrung von DCT-II handelt (bis zu einem Skalierungsfaktor, siehe unten), wird diese Form manchmal einfach als "inverse DCT" ("IDCT") bezeichnet.[6]

Einige Autoren teilen die Begriff von anstelle von 2 (was zu einem insgesamt führt Term) und die resultierende Matrix mit einem Gesamtskalierungsfaktor von multiplizieren (Siehe oben für die entsprechende Änderung in DCT-II), so dass die DCT-II und DCT-III voneinander transponiert werden. Dies macht die DCT-III-Matrix senkrechtbricht aber die direkte Korrespondenz mit einem Real-Even DFT von halb verschobener Ausgabe.

Die DCT-III impliziert die Randbedingungen: ist sogar da und seltsam herum ist sogar da Und sogar herum

DCT-IV

Die DCT-IV-Matrix wird senkrecht (und damit eindeutig symmetrisch sein, sein eigenes inverse), wenn man sich mit einem Gesamtskala -Faktor von weiteren multipliziert

Eine Variante des DCT-IV, wobei Daten aus verschiedenen Transformationen sind überlappt, heißt das modifizierte diskrete Cosinus -Transformation (MDCT).[107]

Der DCT-IV impliziert die Randbedingungen: ist sogar da und seltsam herum Ähnlich für

DCT V-VIII

DCTs der Typen I - IV behandeln beide Grenzen konsequent hinsichtlich des Symmetriepunkts: Sie sind entweder um einen Datenpunkt sowohl für Grenzen als auch für die Hälfte zweier Datenpunkte für beide Grenzen ums Leben. Im Gegensatz dazu implizieren DCTs der Typen V-VIII Grenzen, die um einen Datenpunkt für eine Grenze und auf halbem Weg zwischen zwei Datenpunkten für die andere Grenze gleich sind.

Mit anderen Worten, DCT-Typen I-IV entsprechen Real-Even DFTs von gleicher Ordnung (unabhängig davon, ob ist gerade oder ungerade), da die entsprechende DFT von Länge ist (für DCT-i) oder (für DCT-II & III) oder (für DCT-IV). Die vier zusätzlichen Arten diskreter Cosinus -Transformation[108] entsprechen im Wesentlichen auf reale DFTs logisch seltsamer Reihenfolge, die Faktoren von haben im Nenner der Cosinus -Argumente.

Diese Varianten scheinen jedoch in der Praxis selten verwendet zu werden. Ein Grund ist vielleicht das Fft Algorithmen für DFTs mit ungeraden Längen sind im Allgemeinen komplizierter als Fft Algorithmen für gleiche Länge von DFTs (z. B. die einfachsten Radix-2-Algorithmen sind nur für gleiche Längen), und diese erhöhte Komplikation überträgt sich auf die DCTs, wie nachstehend beschrieben.

(Das triviale Real-Even-Array, ein Länge-eins-DFT (ungerade Länge) einer einzelnen Zahl aentspricht einem DCT-V der Länge ))

Inverse Transformationen

Unter Verwendung der oben genannten Normalisierungskonventionen wird die Umkehrung von DCT-I DCT-I mit 2/multipliziert ((N- 1). Die Umkehrung von DCT-IV wird DCT-IV multipliziert mit 2/ multipliziertN. Die Umkehrung von DCT-II ist DCT-III multipliziert mit 2//N und umgekehrt.[6]

Wie für die DFTDer Normalisierungsfaktor vor diesen Transformationsdefinitionen ist lediglich eine Konvention und unterscheidet sich zwischen Behandlungen. Zum Beispiel multiplizieren einige Autoren die Transformationen mit Damit der Inverse keinen zusätzlichen multiplikativen Faktor erfordert. Kombiniert mit geeigneten Faktoren von 2 (Siehe oben) Dies kann verwendet werden, um die Transformationsmatrix zu erstellen senkrecht.

Mehrdimensionale DCTs

Mehrdimensionale Varianten der verschiedenen DCT-Typen folgen direkt aus den eindimensionalen Definitionen: Sie sind einfach ein trennbares Produkt (äquivalent eine Zusammensetzung) von DCTs entlang jeder Dimension.

M-D DCT-II

Beispielsweise ist ein zweidimensionales DCT-II eines Bildes oder eine Matrix einfach die eindimensionale DCT-II von oben, die entlang der Reihen und dann entlang der Spalten (oder umgekehrt) durchgeführt wird. Das heißt, das 2D DCT-II wird durch die Formel angegeben (wie oben unterlassen Normalisierung und andere Skalenfaktoren):

Die Umkehrung eines mehrdimensionalen DCT ist nur ein trennbares Produkt der Inversen der entsprechenden eindimensionalen DCTs (siehe oben), z. Die eindimensionalen Inversen, die entlang einer Dimension jeweils in einem Zeilen-Säulen-Algorithmus angewendet wurden.

Das 3-D DCT-II ist nur die Erweiterung von 2-D DCT-II In dreidimensionalem Raum und mathematisch können durch die Formel berechnet werden

Die Umkehrung von 3-D DCT-II ist 3-D DCT-III und kann aus der Formel berechnet werden

Technisch gesehen berechnet das Berechnen eines zwei-, drei- (oder -multi) -dimensionalen DCT durch Sequenzen eindimensionaler DCTs entlang jeder Dimension als a Zeile Spalte Algorithmus. Wie mit Mehrdimensionale FFT -AlgorithmenEs gibt jedoch andere Methoden, um dasselbe zu berechnen, während die Berechnungen in einer anderen Reihenfolge durchgeführt werden (d. H. Verschachtung/Kombinieren der Algorithmen für die verschiedenen Dimensionen). Aufgrund des schnellen Wachstums der Anwendungen, die auf dem 3-D-DCT basieren, werden mehrere schnelle Algorithmen für die Berechnung von 3-D-DCT-II entwickelt. Vektor-Radix-Algorithmen werden für die Berechnung von M-D-DCT angewendet, um die Rechenkomplexität zu verringern und die Rechengeschwindigkeit zu erhöhen. Um 3-D-DCT-II effizient zu berechnen, wurde ein schneller Algorithmus, eine Vektor-Radix-Dezimierung des Frequenzalgorithmus (VR DIF), entwickelt.

3-d DCT-II VR DIF

Um den VR -Differenzalgorithmus anzuwenden, sind die Eingangsdaten wie folgt formuliert und neu angeordnet.[109][110] Die Transformationgröße N × n × n wird als 2 angenommen.

Die vier grundlegenden Stadien des Computers 3-D DCT-II unter Verwendung des VR-Differenzalgorithmus.
wo

Die Abbildung zum benachbarten zeigt die vier Stadien, die an der Berechnung von 3-D-DCT-II unter Verwendung des VR-Differnens beteiligt sind. Die erste Stufe ist die 3-D-Neuordnung unter Verwendung der durch die obigen Gleichungen dargestellten Indexzuordnung. Die zweite Stufe ist die Schmetterlingsberechnung. Jeder Schmetterling berechnet acht Punkte zusammen, wie in der Abbildung direkt unten gezeigt, wo .

Der ursprüngliche 3-D-DCT-II kann jetzt als geschrieben werden

wo

Wenn der gleiche und die ungeraden Teile von und und werden berücksichtigt, die allgemeine Formel für die Berechnung des 3-D-DCT-II kann als ausgedrückt werden

Die einzelnen Schmetterlingsstadium des VR -Differenzalgorithmus.

wo

Arithmetische Komplexität

Die gesamte 3-D-DCT-Berechnung benötigt Stufen und jede Stufe beinhaltet Schmetterlinge. Der gesamte 3-D-DCT erfordert Schmetterlinge zu berechnen. Jeder Schmetterling benötigt sieben reale Multiplikationen (einschließlich trivialer Multiplikationen) und 24 reale Ergänzungen (einschließlich trivialer Ergänzungen). Daher ist die Gesamtzahl der für diese Phase benötigten realen Multiplikationen und die Gesamtzahl der realen Ergänzungen, d. H. einschließlich der Post-Additions (rekursiv[110]

Die herkömmliche Methode zur Berechnung von MD-DCT-IIs verwendet einen RCF-Ansatz (Row-Säulen-Frame), der bei den meisten fortschrittlichen neuesten Hardware-Plattformen rechnerisch und weniger produktiv ist. Die Anzahl der Multiplikationen, die zur Berechnung des VR -Differenz -Algorithmus im Vergleich zum RCF -Algorithmus erforderlich sind, ist zahlreich. Die Anzahl der Multiplikationen und Ergänzungen, die am RCF -Ansatz beteiligt sind und beziehungsweise. Aus Tabelle 1 ist ersichtlich, dass die Gesamtzahl

Tabelle 1 Vergleich von VR DIF & RCF-Algorithmen zum Computer 3D-DCT-II.
Transformationsgröße 3D VR Mults RCF -Multizen 3D VR fügt hinzu RCF fügt hinzu
8 × 8 × 8 2.625 4.5 10.875 10.875
16 × 16 × 16 3.5 6 15.188 15.188
32 × 32 × 32 4.375 7.5 19.594 19.594
64 × 64 × 64 5.25 9 24.047 24.047

von Multiplikationen, die mit dem 3-D-DCT-VR-Algorithmus verbunden sind, ist geringer als der mit dem RCF-Ansatz um mehr als 40%verbunden. Darüber hinaus beinhaltet der RCF -Ansatz die Matrixtransponung und mehr Indizierung und Datenaustausch als der neue VR -Algorithmus. Dies macht den 3-D-DCT-VR-Algorithmus effizienter und besser für 3-D-Anwendungen geeignet, an denen 3-D-DCT-II wie Videokomprimierung und andere 3-D-Bildverarbeitungsanwendungen beteiligt sind.

Die Hauptüberlegung bei der Auswahl eines schnellen Algorithmus besteht darin, rechnerische und strukturelle Komplexitäten zu vermeiden. Wenn die Technologie von Computern und DSPs voranschreitet, wird die Ausführungszeit des arithmetischen Betriebs (Multiplikationen und Ergänzungen) sehr schnell und die regelmäßige Rechenstruktur wird zum wichtigsten Faktor.[111] Obwohl der oben vorgeschlagene 3-D-VR-Algorithmus nicht die theoretische Untergrenze für die Anzahl der Multiplikationen erreicht, erreicht[112] Es hat eine einfachere Rechenstruktur im Vergleich zu anderen 3-D-DCT-Algorithmen. Es kann mit einem einzelnen Schmetterling an Ort und Stelle implementiert werden und besitzt die Eigenschaften der Cooley -Tukey -FFT -Algorithmus in 3-d. Daher enthält der 3-D-VR eine gute Wahl, um arithmetische Operationen bei der Berechnung des 3-D-DCT-II zu reduzieren, während die einfache Struktur beibehält, die das Schmetterlingsstil charakterisiert Cooley -Tukey -FFT -Algorithmen.

Zweidimensionale DCT-Frequenzen aus der JPEG DCT

Das Bild rechts zeigt eine Kombination aus horizontalen und vertikalen Frequenzen für eine 8 × 8 Zweidimensionales DCT. Jeder Schritt von links nach rechts und oben nach unten ist eine Zunahme der Frequenz um 1/2 Zyklus. Zum Beispiel ergibt sich die rechte Bewegung vom oberen linken Quadrat nach einer Horizontalfrequenz. Ein weiterer Schritt nach rechts liefert zwei halbe Zyklen. Eine Bewegung nach unten liefert zwei halbe Zyklen horizontal und ein halbes Zyklus vertikal. Die Quelldaten (8 × 8) wird in a transformiert lineare Kombination dieser 64 Frequenzquadrate.

MD-DCT-IV

Das M-D DCT-IV ist nur eine Erweiterung von 1-d DCT-IV auf zu MDimensionsdomäne. Das 2-D-DCT-IV einer Matrix oder ein Bild ist gegeben

zum und

Wir können das MD DCT-IV mit der regulären Zeilen-Säulenmethode berechnen oder die Polynomtransformationsmethode verwenden[113] Für die schnelle und effiziente Berechnung. Die Hauptidee dieses Algorithmus besteht darin, die Polynomtransformation zu verwenden, um die mehrdimensionale DCT direkt in eine Reihe von 1-D-DCTs umzuwandeln. MD DCT-IV hat auch mehrere Anwendungen in verschiedenen Bereichen.

Berechnung

Obwohl die direkte Anwendung dieser Formeln erforderlich wäre Operationen ist möglich, dasselbe zu berechnen, mit nur mit Komplexität durch Faktorisierung der Berechnung ähnlich wie die Schnelle Fourier-Transformation (FFT). Man kann auch DCTs über FFTs in Kombination mit mit dem mit berechnen Schritte vor und nach der Verarbeitung. Im Algemeinen, Methoden zur Berechnung von DCTs sind als FAST Cosinus Transform (FCT) -Algorithmen bekannt.

Die effizientesten Algorithmen sind im Prinzip normalerweise diejenigen, die direkt für den DCT spezialisiert sind, anstatt ein gewöhnliches FFT Plus zu verwenden Zusätzliche Operationen (siehe unten für eine Ausnahme). Aber selbst "spezialisierte" DCT -Algorithmen (einschließlich aller, die die niedrigsten bekannten Arithmetikzahlen erreichen, zumindest für Kraft von zwei Größen) stehen typischerweise eng mit FFT-Algorithmen zusammen-da DCTs im Wesentlichen DFT-DFT-Daten sind, kann man einen schnellen DCT-Algorithmus entwerfen, indem man einen FFT nimmt und die redundanten Vorgänge aufgrund dieser Symmetrie beseitigt. Dies kann sogar automatisch durchgeführt werden (Frigo & Johnson 2005). Algorithmen basierend auf der Cooley -Tukey -FFT -Algorithmus sind am häufigsten, aber jeder andere FFT -Algorithmus ist ebenfalls anwendbar. Zum Beispiel führt der Winograd FFT-Algorithmus zu Algorithmen für minimalmultiplikmische Algorithmen für den DFT, wenn auch im Allgemeinen auf Kosten mehr Ergänzungen, und ein ähnlicher Algorithmus wurde vorgeschlagen von (((Feig, Winograd & Juli 1992) für die DCT. Da die Algorithmen für DFTs, DCTs und ähnliche Transformationen alle so eng miteinander verbunden sind, führt jede Verbesserung der Algorithmen für eine Transformation theoretisch zu unmittelbaren Gewinnen für die anderen Transformationen (Duhamel & Vetterli 1990).

Während DCT -Algorithmen, bei denen ein nicht modifiziertes FFT verwendet wird, im Vergleich zu den besten spezialisierten DCT -Algorithmen häufig einen theoretischen Overhead aufweist, haben erstere auch einen deutlichen Vorteil: Hoch optimierte FFT -Programme sind weit verbreitet. In der Praxis ist es daher oft einfacher, eine hohe Leistung für allgemeine Längen zu erzielen N mit FFT-basierten Algorithmen.[a] Spezialisierte DCT -Algorithmen hingegen siehe weit verbreitete Verwendung für Transformationen kleiner, fester Größen wie die 8 × 8 DCT-II verwendet in JPEG Kompression oder kleine DCTs (oder MDCTs), die typischerweise bei Audiokomprimierung verwendet werden. (Reduzierte Codegröße kann auch ein Grund für die Verwendung eines spezialisierten DCT für Anwendungen für eingebettete Geräte sein.)

Tatsächlich entsprechen sogar die DCT-Algorithmen, die ein gewöhnliches FFT unter Verwendung eines gewöhnlichen FFT verwenden, manchmal dem Beschneiden der redundanten Operationen aus einer größeren FFT real-symmetrischer Daten und können sogar aus der Sicht der arithmetischen Zahlen optimal sein. Zum Beispiel entspricht ein Typ-II-DCT einem DFT von Größe mit realähnlichen Symmetrie, deren geradindexierte Elemente Null sind. Eine der häufigsten Methoden zur Berechnung dieser über ein FFT (z. B. die in verwendete Methode Fftpack und Fftw) wurde beschrieben durch Narasimha & Peterson (1978) und Makhoul (1980)Und diese Methode im Nachhinein kann als ein Schritt eines Radix-4-Dezimierungs-in-Time-Cooley-Tukey-Algorithmus angesehen werden, der auf den "logischen" realen DFT angewendet wird, der dem DCT-II entspricht.[b] Da die gleichberechtigten Elemente Null sind, entspricht dieser Radix-4-Schritt genau wie ein Split-Radix-Schritt. Wenn die nachfolgende Größe Real-Data FFT wird auch von einer echten Daten durchgeführt Split-Radix-Algorithmus (wie in Sorensen et al. (1987)), dann übereinstimmt der resultierende Algorithmus tatsächlich mit der langsten veröffentlichten Arithmetikanzahl für die zwei-zwei-DCT-II ( Real-Arithmetische Operationen[c]).

Eine kürzlich reduzierte Reduzierung der Operation zählte auf Verwendet auch eine echte FFT.[114] Es ist also nichts an sich, dass das DCT über eine FFT aus arithmetischer Sicht das DCT berechnet - manchmal ist es nur eine Frage, ob der entsprechende FFT -Algorithmus optimal ist. (In der Praktik Dies ist jedoch eher eine Implementierung als eine algorithmische Frage, da sie durch Ablösen oder Einbinden gelöst werden kann.)

Beispiel für IDCT

Ein Beispiel, das acht verschiedene Filter zeigt, die auf ein Testbild (oben links) angewendet werden, indem sein DCT -Spektrum (oben rechts) mit jedem Filter multipliziert wird.

Betrachten Sie dieses 8x8 Graustufenbild des Kapitalbuchstabens A.

Originalgröße, skaliert 10x (nächster Nachbar), skaliert 10x (bilinear).
Basisfunktionen der diskreten Cosinus -Transformation mit entsprechenden Koeffizienten (spezifisch für unser Bild).
DCT des Bildes = .

Jede Basisfunktion wird mit ihrem Koeffizienten multipliziert und dann wird dieses Produkt dem endgültigen Bild hinzugefügt.

Links befindet sich das endgültige Bild. In der Mitte befindet sich die gewichtete Funktion (multipliziert mit einem Koeffizienten), der dem endgültigen Bild hinzugefügt wird. Rechts befindet sich die aktuelle Funktion und den entsprechenden Koeffizienten. Die Bilder werden (unter Verwendung bilinearer Interpolation) mit Faktor 10 × skaliert.

Siehe auch

Anmerkungen

  1. ^ Die algorithmische Leistung auf moderner Hardware wird in der Regel nicht hauptsächlich durch einfache arithmetische Zählungen bestimmt, und eine Optimierung erfordert erhebliche technische Anstrengungen, um die verfügbare integrierte Hardwareoptimierung in den intrinsischen Grenzen bestmöglich zu nutzen.
  2. ^ Der Radix-4-Schritt reduziert die Größe DFT bis vier Größe DFTs realer Daten, von denen zwei Null sind und zwei durch die gleichmäßige Symmetrie gleich einander sind. Daher eine einzelne Größe geben FFT von Real Data Plus SchmetterlingeSobald die trivialen und / oder doppelten Teile eliminiert und / oder verschmolzen sind.
  3. ^ Die genaue Anzahl realer arithmetischer Operationen und insbesondere die Anzahl realer Multiplikationen hängt etwas von der Skalierung der Transformationsdefinition ab. Das Die Anzahl ist für die hier gezeigte DCT-II-Definition; Zwei Multiplikationen können gespeichert werden, wenn die Transformation durch ein Gesamt skaliert wird Faktor. Zusätzliche Multiplikationen können gespeichert werden, wenn man es zulässt, dass die Ausgaben der Transformation einzeln skaliert werden, wie es gezeigt wurde Arai, Agui & Nakajima (1988) Für den in JPEG verwendeten Fall der Größe 8.

Verweise

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab AC Stanković, Radomir S.; Astola, Jaakko T. (2012). "Erinnerungen an die frühen Arbeiten in DCT: Interview mit K. R. Rao" (PDF). Nachdrucke aus den frühen Tagen der Informationswissenschaften. Tampere Internationales Zentrum für Signalverarbeitung. 60. ISBN 978-9521528187. ISSN 1456-2774. Archiviert (PDF) vom Original am 30. Dezember 2021. Abgerufen 30. Dezember 2021 - via Ethw.
  2. ^ a b c d e Britanak, Vladimir; Yip, Patrick C.; Rao, K. R. (6. November 2006). Diskrete Cosinus- und Sinus -Transformationen: Allgemeine Eigenschaften, schnelle Algorithmen und ganzzahlige Näherungen. Akademische Presse. ISBN 978-0123736246. Lccn 2006931102. OCLC 220853454. Ol 18495589m. S2CID 118873224.{{}}: CS1 Wartung: Datum und Jahr (Link)
  3. ^ a b c d Alikhani, Darya (1. April 2015). "Jenseits der Lösung: Rosa Menkmans Glitch Art". Postmatter. Abgerufen 19. Oktober 2019.
  4. ^ a b c d e Thomson, Gavin; Shah, Athar (2017). "Heif und HEVC einführen" (PDF). Apple Inc. Abgerufen 5. August 2019.
  5. ^ a b c d e f Ahmed, Nasir; Natarajan, T. Raj; Rao, K.R. (1. Januar 1974). "Diskrete Cosinus -Transformation". IEEE -Transaktionen auf Computern. IEEE Computer Society. C-23 (1): 90–93. doi:10.1109/t-c.1974.223784. EISSN 1557-9956. ISSN 0018-9340. Lccn 75642478. OCLC 1799331. S2CID 206619973.{{}}: CS1 Wartung: Datum und Jahr (Link)
  6. ^ a b c d e f Rao, K. Ramamohan; Yip, Patrick C. (11. September 1990). Diskrete Cosinus -Transformation: Algorithmen, Vorteile, Anwendungen. Signal, Bild und Sprachverarbeitung. Akademische Presse. doi:10.1016/c2009-0-22279-3. ISBN 978-0125802031. Lccn 89029800. OCLC 1008648293. Ol 2207570m. S2CID 12270940.{{}}: CS1 Wartung: Datum und Jahr (Link)
  7. ^ a b c d e f g Barbero, M.; Hofmann, H.; Wells, N. D. (14. November 1991). "DCT -Quellcodierung und aktuelle Implementierungen für HDTV". EBU Technischer Bewertung. Europäische Rundfunk Union (251): 22–33. Abgerufen 4. November 2019.
  8. ^ a b c d e f Lea, William (1994). "Video on Demand: Forschungspapier 94/68". House of Commons Library. Abgerufen 20. September 2019.
  9. ^ a b c Ahmed, Nasir (Januar 1991). "Wie ich mich mit der diskreten Cosinus -Transformation ausgedacht habe". Digitale Signalverarbeitung. 1 (1): 4–5. doi:10.1016/1051-2004 (91) 90086-Z.
  10. ^ a b c d e "T.81-Digitale Komprimierung und Codierung von ständigen Standbildern-Anforderungen und Richtlinien" (PDF). Ccitt. September 1992. Abgerufen 12. Juli 2019.
  11. ^ Ausgewählte Arbeiten zur visuellen Kommunikation: Technologie und Anwendungen, (Spie Press Book), Herausgeber T. Russell Hsing und Andrew G. Tescher, April 1990, S. 145-149 [1].
  12. ^ Ausgewählte Papiere und Tutorial in der digitalen Bildverarbeitung und -analyse, Band 1, Digitale Bildverarbeitung und -analyse, (IEEE Computer Society Press), Herausgeber R. Chellappa und A. A. Sawchuk, Juni 1985, p. 47.
  13. ^ DCT -Zitate über Google Scholar [2].
  14. ^ Chen, Wen-Hsiung; Smith, C. H.; Fralick, S. C. (September 1977). "Ein schneller Rechenalgorithmus für die diskrete Cosinus -Transformation". IEEE -Transaktionen zur Kommunikation. 25 (9): 1004–1009. doi:10.1109/tcom.1977.1093941.
  15. ^ Smith, C.; Fralick, S. (1977). "Ein schneller Rechenalgorithmus für die diskrete Cosinus -Transformation". IEEE -Transaktionen zur Kommunikation. 25 (9): 1004–1009. doi:10.1109/tcom.1977.1093941. ISSN 0090-6778.
  16. ^ Huang, T. S. (1981). Bildsequenzanalyse. Springer Science & Business Media. p. 29. ISBN 9783642870378.
  17. ^ Roese, John A.; Robinson, Guner S. (30. Oktober 1975). "Kombinierte räumliche und zeitliche Codierung digitaler Bildsequenzen". Effiziente Übertragung von Bildinformationen. Internationale Gesellschaft für Optik und Photonik. 0066: 172–181. Bibcode:1975spie ... 66..172r. doi:10.1117/12.965361. S2CID 62725808.
  18. ^ Cianci, Philip J. (2014). High Definition Television: Die Erstellung, Entwicklung und Implementierung der HDTV -Technologie. McFarland. p. 63. ISBN 9780786487974.
  19. ^ a b c "Geschichte der Videokomprimierung". Itu-t. Joint Video Team (JVT) von ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 und ITU-T SG16 Q.6). Juli 2002. S. 11, 24–9, 33, 40–1, 53–6. Abgerufen 3. November 2019.
  20. ^ a b c Ghanbari, Mohammed (2003). Standard -Codecs: Bildkomprimierung zur erweiterten Videocodierung. Institution für Ingenieurwesen und Technologie. S. 1–2. ISBN 9780852967102.
  21. ^ Li, Jian Ping (2006). Proceedings der Internationalen Computerkonferenz 2006 über Wavelet Active Media Technology und Information Processing: Chongqing, China, 29.-31. August 2006. Welt wissenschaftlich. p. 847. ISBN 9789812709998.
  22. ^ a b c Wang, Hanli; Kwong, S.; Kok, C. (2006). "Effizienter Vorhersagealgorithmus der Ganzzahl -DCT -Koeffizienten für H.264/AVC -Optimierung". IEEE -Transaktionen zu Schaltkreisen und Systemen für die Videotechnik. 16 (4): 547–552. doi:10.1109/tcsvt.2006.871390. S2CID 2060937.
  23. ^ Princen, John P.; Johnson, A.W.; Bradley, Alan B. (1987). "Subband-/Transformationskodierung mithilfe der Filterbankdesigns basierend auf der Aliasing -Stornierung von Zeitdomänen". ICASSP '87. IEEE Internationale Konferenz über Akustik, Sprache und Signalverarbeitung. 12: 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
  24. ^ Princen, J.; Bradley, A. (1986). "Analyse-/Synthese -Filterbankdesign basierend auf dem Zeitungsdomänen -Aliasing -Stornieren". IEEE -Transaktionen zur Akustik, Sprache und Signalverarbeitung. 34 (5): 1153–1161. doi:10.1109/tASP.1986.1164954.
  25. ^ a b c d e f g h i j k Luo, FA-Long (2008). Mobile Multimedia -Rundfunkstandards: Technologie und Praxis. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  26. ^ a b Britanak, V. (2011). "Über Eigenschaften, Beziehungen und vereinfachte Implementierung von Filterbanken in den Dolby Digital (Plus) AC-3-Audio-Codierungsstandards". IEEE -Transaktionen zu Audio-, Sprach- und Sprachverarbeitung. 19 (5): 1231–1241. doi:10.1109/tasl.2010.2087755. S2CID 897622.
  27. ^ a b Guckert, John (Frühjahr 2012). "Die Verwendung von FFT und MDCT in MP3 -Audiokomprimierung" (PDF). Universität von Utah. Abgerufen 14. Juli 2019.
  28. ^ a b Brandenburg, Karlheinz (1999). "MP3 und AAC erklärten" (PDF). Archiviert (PDF) vom Original am 2017-02-13.
  29. ^ a b XIPH.org Foundation (2009-06-02). "Vorbis I -Spezifikation - 1.1.2 Klassifizierung". XIPH.org Foundation. Abgerufen 2009-09-22.
  30. ^ Dhamija, Swati; Jain, Priyanka (September 2011). "Vergleichende Analyse für die diskrete Sinustransformation als geeignete Methode zur Rauschschätzung". IJCSI International Journal of Information. 8 (5, Nr. 3): 162–164 (162). Abgerufen 4. November 2019.
  31. ^ Mandyam, Giridhar D.; Ahmed, Nasir; Magotra, Neeraj (17. April 1995). "DCT-basiertes Schema für verlustfreie Bildkomprimierung". Digitale Videokomprimierung: Algorithmen und Technologien 1995. Internationale Gesellschaft für Optik und Photonik. 2419: 474–478. Bibcode:1995spie.2419..474m. doi:10.1117/12.206386. S2CID 13894279.
  32. ^ Komatsu, K.; Sezaki, Kaoru (1998). "Reversible diskrete Cosinus -Transformation". Proceedings der IEEE International Conference für Akustik, Sprach- und Signalverarbeitung von 1998, ICASSP '98 (Kat. Nr. 98CH36181). 3: 1769–1772 Vol.3. doi:10.1109/ICASSP.1998.681802. ISBN 0-7803-4428-6. S2CID 17045923.
  33. ^ Muchahary, D.; Mondal, A. J.; Parmar, R. S.; Borah, A. D.; Majumder, A. (2015). "Ein vereinfachter Entwurfsansatz für eine effiziente Berechnung von DCT". Fünfte Internationale Konferenz 2015 über Kommunikationssysteme und Netzwerktechnologien: 483–487. doi:10.1109/csnt.2015.134. ISBN 978-1-4799-1797-6. S2CID 16411333.
  34. ^ Chen, Wai Kai (2004). Das Handbuch für Elektrotechnik. Elsevier. p. 906. ISBN 9780080477480.
  35. ^ a b c "Was ist ein JPEG? Das unsichtbare Objekt, das Sie jeden Tag sehen". Der Atlantik. 24. September 2013. Abgerufen 13. September 2019.
  36. ^ a b c Pessina, Laure-Anne (12. Dezember 2014). "JPEG hat unsere Welt verändert". EPFL -Nachrichten. École Polytechnique Fédérale de Lausanne. Abgerufen 13. September 2019.
  37. ^ a b Lee, Ruby Bei-Loh; Beck, John P.; Lamm, Joel; Severson, Kenneth E. (April 1995). "Echtzeit-Software-MPEG-Video-Decoder auf Multimedia-verstärkten PA 7100LC-Prozessoren" (PDF). Hewlett-Packard Journal. 46 (2). ISSN 0018-1153.
  38. ^ a b c Lee, Jack (2005). Skalierbare kontinuierliche Medien -Streaming -Systeme: Architektur, Design, Analyse und Implementierung. John Wiley & Sons. p. 25. ISBN 9780470857649.
  39. ^ a b c Shishikui, Yoshiaki; Nakanishi, Hiroshi; Imaizumi, Hiroyuki (26. bis 28. Oktober 1993). "Ein HDTV-Codierungsschema mit adaptivdimensionalem DCT". Signalverarbeitung von HDTV: Verfahren des Internationalen Workshops zu HDTV '93, Ottawa, Kanada. Elsevier: 611–618. doi:10.1016/b978-0-444-81844-7.50072-3. ISBN 9781483298511.
  40. ^ a b Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Diskrete Cosinus -Transformation, zweite Ausgabe. CRC Press. S. 1–3, 129. ISBN 9781351396486.
  41. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab AC Anzeige ae Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Diskrete Cosinus -Transformation, zweite Ausgabe. CRC Press. S. 1–3. ISBN 9781351396486.
  42. ^ a b c d e Britanak, Vladimir; Rao, K. R. (2017). Cosinus-/Sinus-modulierte Filterbanken: Allgemeine Eigenschaften, schnelle Algorithmen und ganzzahlige Näherungen. Springer. p. 478. ISBN 9783319610801.
  43. ^ a b Jones, Graham A.; Layer, David H.; Osenkowsky, Thomas G. (2013). National Association of Broadcasters Engineering Handbook: NAB Engineering Handbuch. Taylor & Francis. S. 558–9. ISBN 978-1-136-03410-7.
  44. ^ a b c Ihre Olivier; Petit, Jean-Pierre; Gurle, David (2005). Über VoIP -Protokolle hinaus: Verständnis der Sprachtechnologie und Netzwerktechniken für die IP -Telefonie. John Wiley & Sons. p. 55. ISBN 9780470023631.
  45. ^ a b c d e Daniel Eran Dilger (8. Juni 2010). "Innerhalb iPhone 4: Facetime Video Calling". Appleinsider. Abgerufen 9. Juni, 2010.
  46. ^ a b c d Netflix Technology Blog (19. April 2017). "Effizientere mobile Codes für Netflix -Downloads". Medium.com. Netflix. Abgerufen 20. Oktober 2019.
  47. ^ a b "Video Developer Report 2019" (PDF). Bitmovin. 2019. Abgerufen 5. November 2019.
  48. ^ Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Diskrete Cosinus -Transformation, zweite Ausgabe. CRC Press. p. 186. ISBN 9781351396486.
  49. ^ a b c d McKernan, Brian (2005). Digitales Kino: Die Revolution in Kinematographie, Postproduktion, Vertrieb. McGraw-Hill. p. 58. ISBN 978-0-07-142963-4. DCT wird in den meisten Kompressionssystemen verwendet, die von der Moving Picture Experts Group (MPEG) standardisiert wurden, ist die dominierende Technologie für die Bildkomprimierung. Insbesondere ist es die Kerntechnologie von MPEG-2, dem für DVDs verwendeten System, digitales Fernsehsendungsradition, das für viele der Versuche des digitalen Kinos verwendet wurde.
  50. ^ a b Baraniuk, Chris (15. Oktober 2015). "Kopierschutz könnte zu JPEGs kommen". BBC News. BBC. Abgerufen 13. September 2019.
  51. ^ Ascher, Steven; Pincus, Edward (2012). Das Handbuch des Filmemachers: Ein umfassender Leitfaden für das digitale Zeitalter: fünfte Ausgabe. Pinguin. S. 246–7. ISBN 978-1-101-61380-1.
  52. ^ Bertalmio, Marcelo (2014). Bildverarbeitung für Kino. CRC Press. p. 95. ISBN 978-1-4398-9928-1.
  53. ^ Zhang, Hongjiang (1998). "Content-basierte Video-Browser und Abruf". In Furht, Borko (Hrsg.). Handbuch für Internet- und Multimedia -Systeme und Anwendungen. CRC Press. pp.83–108 (89). ISBN 9780849318580.
  54. ^ a b "Apple PRORES 422 CODEC -Familie". Kongressbibliothek. 17. November 2014. Abgerufen 13. Oktober 2019.
  55. ^ Potluri, U. S.; Madanayake, A.; Cintra, R. J.; Bayer, F. M.; Rajapaksha, N. (17. Oktober 2012). "Multiplikator-freie DCT-Näherungen für HF-Multi-Strahl-Digital Aperture-Array-Weltraumbildgebung und Richtungsempfindung". Messwissenschaft und Technologie. 23 (11): 114003. doi:10.1088/0957-0233/23/11/114003. ISSN 0957-0233.
  56. ^ Hudson, Graham; Léger, Alain; Niss, Birger; Sebestyén, István; Vaaben, Jørgen (31. August 2018). "JPEG-1 Standard 25 Jahre: Vergangenheit, Gegenwart und zukünftige Gründe für einen Erfolg". Zeitschrift für elektronische Bildgebung. 27 (4): 1. doi:10.1117/1.jei.27.4.040901.
  57. ^ "Das JPEG -Bildformat erklärt". Bt.com. BT -Gruppe. 31. Mai 2018. Abgerufen 5. August 2019.
  58. ^ Thomson, Gavin; Shah, Athar (2017). "Heif und HEVC einführen" (PDF). Apple Inc. Abgerufen 5. August 2019.
  59. ^ "HEIF -Vergleich - Bilddateiformat mit hoher Effizienz". Nokia Technologies. Abgerufen 5. August 2019.
  60. ^ Alakuijala, Jyrki; Sneyers, Jon; Verari, Luca; Wassenberg, Januar (22. Januar 2021). "JPEG XL White Paper" (PDF). JPEG org. Archiviert (PDF) vom Original am 2. Mai 2021. Abgerufen 14. Januar 2022. DCT variabler Größe (quadratisch oder rechteckig von 2x2 bis 256x256) dient als schnelle Näherung der optimalen Dekorrelattransformation.
  61. ^ a b Wang, Yao (2006). "Videocodierungsstandards: Teil I" (PDF). Archiviert von das Original (PDF) 2013-01-23.
  62. ^ Wang, Yao (2006). "Videocodierungsstandards: Teil II" (PDF). Archiviert von das Original (PDF) 2013-01-23.
  63. ^ Hoffman, Roy (2012). Datenkomprimierung in digitalen Systemen. Springer Science & Business Media. p. 255. ISBN 9781461560319.
  64. ^ a b Rao, K.R.; Hwang, J. J. (18. Juli 1996). Techniken und Standards für Bild-, Video- und Audiocodierung. Prentice Hall. JPEG: Kapitel 8; H.261: Kapitel 9; MPEG-1: Kapitel 10; MPEG-2: Kapitel 11. ISBN 978-0133099072. Lccn 96015550. OCLC 34617596. Ol 978319m. S2CID 56983045.{{}}: CS1 Wartung: Datum und Jahr (Link)
  65. ^ Davis, Andrew (13. Juni 1997). "Die Übersicht über die Empfehlung von H.320". EE mal. Abgerufen 7. November 2019.
  66. ^ IEEE Wescanex 97: Kommunikation, Strom und Computer: Konferenzbereitschaft. Universität Manitoba, Winnipeg, Manitoba, Kanada: Institut für Elektro- und Elektronikingenieure. 22. bis 23. Mai 1997. p. 30. ISBN 9780780341470. H.263 ist ähnlich, aber komplexer als H.261. Es ist derzeit der am häufigsten verwendete internationale Video -Komprimierungsstandard für die Videufiseponie auf Telefonleitungen ISDN (Integrated Services Digital Network).
  67. ^ Peter de Rivaz; Jack Haughton (2018). "AV1 Bitstream & Decodierungsprozessspezifikation" (PDF). Allianz für offene Medien. Abgerufen 2022-01-14.
  68. ^ YouTube -Entwickler (15. September 2018). "AV1 Beta Launch Playlist". Abgerufen 14. Januar 2022. Die ersten Videos, die die AV1 -Transcodes von YouTube erhalten.
  69. ^ Brinkmann, Martin (13. September 2018). "So aktivieren Sie die AV1 -Unterstützung auf YouTube". Abgerufen 14. Januar 2022.
  70. ^ Netflix Technology Blog (5. Februar 2020). "Netflix streamen AV1 jetzt auf Android". Abgerufen 14. Januar 2022.
  71. ^ Netflix Technology Blog (9. November 2021). "AV1 -Streaming in die Fernseher der Netflix -Mitglieder bringen". Abgerufen 14. Januar 2022.
  72. ^ Herre, J.; Dietz, M. (2008). "MPEG-4 High-Efficiency AAC-Codierung [Standards in der Kurzschale]". IEEE Signal Processing Magazine. 25 (3): 137–142. Bibcode:2008ispm ... 25..137h. doi:10.1109/msp.2008.918684.
  73. ^ Valin, Jean-Marc; Maxwell, Gregory; Terriberry, Timothy B.; Vos, Koen (Oktober 2013). Hochwertige Musikcodierung mit niedrigem Delay im Opus-Codec. 135. AES -Übereinkommen. Audio Engineering Society. Arxiv:1602.04845.
  74. ^ "Opus codec". Opus (Startseite). XIPH.org Foundation. Abgerufen 31. Juli, 2012.
  75. ^ Leyden, John (27. Oktober 2015). "WhatsApp gelegt: Info-Sucking-Apps Innereien untersucht". Das Register. Abgerufen 19. Oktober 2019.
  76. ^ Hazra, Sudip; Mateti, Prabhaker (13. bis 16. September 2017). "Herausforderungen in der Android -Forensik". In Thampi, Sabu M.; Pérez, Gregorio Martínez; Westphall, Carlos Becker; Hu, Jiankun; Fan, Chun I.; Mármol, Félix Gómez (Hrsg.). Sicherheit in Computer und Kommunikation: 5. Internationales Symposium, SSCC 2017. Springer. S. 286–299 (290). doi:10.1007/978-981-10-6898-0_24. ISBN 9789811068980.
  77. ^ Srivastava, Saurabh Ranjan; Dube, Sachin; Shrivastaya, Gulshan; Sharma, Kavita (2019). "Smartphone löste Sicherheitsherausforderungen aus: Probleme, Fallstudien und Prävention". In LE, DAC-NHUONG; Kumar, Raghvendra; Mishra, Brojo Kishore; Chatterjee, Jyotir Moy; Khari, Manju (Hrsg.). Cybersicherheit im parallelen und verteilten Computer: Konzepte, Techniken, Anwendungen und Fallstudien. Cybersicherheit parallel und verteiltes Computing. John Wiley & Sons. S. 187–206 (200). doi:10.1002/9781119488330.ch12. ISBN 9781119488057.
  78. ^ "Open Source -Software, die in PlayStation 4 verwendet wird". Sony Interactive Entertainment Inc.. Abgerufen 2017-12-11.
  79. ^ "Dolby AC-4: Audio-Lieferung für Unterhaltungsdienste der nächsten Generation" (PDF). Dolby Laboratories. Juni 2015. Abgerufen 11. November 2019.
  80. ^ Bledt, R. L.; Senden.; Niedermeier, a.; Czelhan, b.; Küg, S.; et al. (2017). "Entwicklung des MPEG-H-TV-Audiosystems für ATSC 3.0" (PDF). IEEE -Transaktionen zum Rundfunk. 63 (1): 202–236. doi:10.1109/tbc.2017.2661258. S2CID 30821673.
  81. ^ Schnell, Markus; Schmidt, Markus; Jander, Manuel; Albert, Tobias; Geiger, Ralf; Ruoppila, Vesa; Ekstrand, per; Bernhard, Grill (Oktober 2008). MPEG -4 verbesserte AAC mit geringer Verzögerung - ein neuer Standard für hochwertige Kommunikation (PDF). 125. AES -Übereinkommen. Fraunhofer iis. Audio Engineering Society. Abgerufen 20. Oktober 2019.
  82. ^ Lutzky, Manfred; Schuller, Gerald; Gayer, Marc; Krämer, Ulrich; Wabnik, Stefan (Mai 2004). Eine Richtlinie für Audio -Codec -Verzögerung (PDF). 116. AES -Übereinkommen. Fraunhofer iis. Audio Engineering Society. Abgerufen 24. Oktober 2019.
  83. ^ a b Nagireddi, Sivannarayana (2008). VoIP -Sprach- und Faxsignalverarbeitung. John Wiley & Sons. p. 69. ISBN 9780470377864.
  84. ^ "ITU-T SG 16 Work Program (2005-2008)-G.718 (ex g.vbr-ev)".
  85. ^ Terriberry, Timothy B. Präsentation des Celt -Codecs. Das Ereignis erfolgt nach 65 Minuten., Auch "Celt -Codec -Präsentationsleitungen" (PDF).
  86. ^ "Ekiga 3.1.0 verfügbar".
  87. ^ "FreeSwitch: Neue Veröffentlichung für das neue Jahr".
  88. ^ "Enhanced Voice Services (EVS) Codec" (PDF). Fraunhofer iis. März 2017. Abgerufen 19. Oktober 2019.
  89. ^ Abousleman, G. P.; Marcellin, M. W.; Hunt, B. R. (Januar 1995), "Kompression von hyperspektralen Bildern unter Verwendung von 3-D-DCT und hybridem DPCM/DCT", IEEE trans. Geosci. Remote Sens., 33 (1): 26–34, Bibcode:1995itgrs..33 ... 26a, doi:10.1109/36.368225
  90. ^ Chan, Y.; Siu, W. (Mai 1997), "Variable zeitliche Länge 3-D Discrete Cosinus Transformation Codierung" (PDF), IEEE trans. Bildverarbeitung., 6 (5): 758–763, Bibcode:1997itip .... 6..758c, Citeseerx 10.1.1.516.2824, doi:10.1109/83.568933, PMID 18282969
  91. ^ Lied, J.; Sxiong, Z.; Liu, X.; Liu, Y., "Ein Algorithmus für die Codierung und Übertragung von Layered Video", " Proc. Viertes int. Conf./exh. Hochleistungs -Comput. Asiatische Pazifik-Region, 2: 700–703
  92. ^ Tai, S.-C; Gi, y.; Lin, C.-W. (September 2000), "Ein adaptiver 3-D-diskreter Cosinus-Transformationscodierer für die Komprimierung medizinischer Bild", IEEE trans. Inf. Technol. Biomed., 4 (3): 259–263, doi:10.1109/4233.870036, PMID 11026596, S2CID 18016215
  93. ^ Yeo, b.; Liu, B. (Mai 1995), "Volumenwiedergabe von DCT-basierten komprimierten 3D-Skalardaten", IEEE trans. Computer. Grafik., 1: 29–43, doi:10.1109/2945.468390
  94. ^ Chan, S.C.; Liu, W.; Ho, K.I. (2000). "Perfekte Rekonstruktionsmodulierte Filterbanken mit Summe der Zwei-Zwei-Koeffizienten". 2000 IEEE International Symposium über Schaltkreise und Systeme. Aufkommende Technologien für das 21. Jahrhundert. Proceedings (IEEE CAT Nr. 00CH36353). Vol. 2. S. 73–76. doi:10.1109/iscas.2000.856261. HDL:10722/46174. ISBN 0-7803-5482-6. S2CID 1757438.
  95. ^ Queiroz, R. L.; Nguyen, T. Q. (1996). "Verrückt Transformationen für effiziente Transformation/Subband -Codierung". IEEE trans. Signalprozess. 44 (5): 497–507.
  96. ^ Malvar 1992.
  97. ^ Chan, S. C.; Luo, L.; Ho, K. L. (1998). "M-Channel unterstützt biorthogonaler Cosinus-moduliertes Wavelet-Basen". IEEE trans. Signalprozess. 46 (2): 1142–1151. Bibcode:1998itsp ... 46.1142c. doi:10.1109/78.668566. HDL:10722/42775.
  98. ^ a b Katsaggelos, Aggelos K.; Babacan, S. Derin; Chun-Je, Tsai (2009). "Kapitel 15 - iterative Bildwiederherstellung". Der wesentliche Leitfaden zur Bildverarbeitung. Akademische Presse. S. 349–383. ISBN 9780123744579.
  99. ^ "Mückenrauschen". PC Magazine. Abgerufen 19. Oktober 2019.
  100. ^ Menkman, Rosa (Oktober 2011). Der Störungsmoment (ähm) (PDF). Institut für Netzwerkkulturen. ISBN 978-90-816021-6-7. Abgerufen 19. Oktober 2019.
  101. ^ Ruff, Thomas (31. Mai 2009). "jpegs". Öffnung. p. 132. ISBN 9781597110938.
  102. ^ Colberg, Jörg (17. April 2009). "Bewertung: JPEGS von Thomas Ruff".
  103. ^ "Diskrete Cosinus -Transformation - Matlab DCT". www.mathworks.com. Abgerufen 2019-07-11.
  104. ^ Pennebaker, William B.; Mitchell, Joan L. (31. Dezember 1992). JPEG: Standbilddatenkomprimierungsstandard. ISBN 9780442012724.
  105. ^ Arai, Y.; Agui, T.; Nakajima, M. (1988). "Ein schnelles DCT-SQ-Schema für Bilder". IECE -Transaktionen. 71 (11): 1095–1097.
  106. ^ Shao, Xuanchg; Johnson, Steven G. (2008). "Typ-II/III-DCT/DST-Algorithmen mit reduzierter Anzahl arithmetischer Operationen". Signalverarbeitung. 88 (6): 1553–1564. Arxiv:CS/0703150. doi:10.1016/j.sigpro.2008.01.004. S2CID 986733.
  107. ^ Malvar 1992
  108. ^ Martucci 1994
  109. ^ Chan, S.C.; Ho, K.L. (1990). "Direkte Methoden zur Berechnung diskreter sinusförmiger Transformationen". IEE -Verfahren F Radar und Signalverarbeitung. 137 (6): 433. doi:10.1049/IP-F-2.1990.0063.
  110. ^ a b Alshibami, O.; Boussakta, S. (Juli 2001). "Dreidimensionaler Algorithmus für den 3-D-DCT-III". Proc. Sechster int. Symp. Kommun., Theoretische Anwendungen: 104–107.
  111. ^ Guoaner Bi; Gang li; Kai-kuang MA; Tan, T.C. (2000). "Über die Berechnung von zweidimensionalem DCT". IEEE -Transaktionen zur Signalverarbeitung. 48 (4): 1171–1183. Bibcode:2000itsp ... 48.1171b. doi:10.1109/78.827550.
  112. ^ Feig, E.; Winograd, S. (Juli 1992). "Über die multiplikative Komplexität diskreter Cosinus -Transformationen". IEEE -Transaktionen zur Informationstheorie. 38 (4): 1387–1391. doi:10.1109/18.144722.
  113. ^ Nussbaumer, H. J. (1981). Schnelle Fourier -Transformations- und Faltungsalgorithmen (1. Aufl.). New York: Springer-Verlag.
  114. ^ Shao, Xuanchg; Johnson, Steven G. (2008). "Typ-II/III-DCT/DST-Algorithmen mit reduzierter Anzahl arithmetischer Operationen". Signalverarbeitung. 88 (6): 1553–1564. Arxiv:CS/0703150. doi:10.1016/j.sigpro.2008.01.004. S2CID 986733.

Weitere Lektüre

Externe Links