MP3

MP3
Mp3.svg
Dateiname Erweiterung .mp3
.bit (vor 1995)[1]
Internet -Medientyp
  • audio/mpeg[2]
  • audio/MPA[3]
  • audio/mpa-robust[4]
Entwickelt von Karlheinz Brandenburg, Ernst Eberlein, Heinz Gerhäuser, Bernhard Grill, Jürgen Herre und Harald Popp (alle Fraunhofer Society),[5] und andere
Erstveröffentlichung 6. Dezember 1991; vor 30 Jahren[6]
Neueste Erscheinung
ISO/IEC 13818-3: 1998
April 1998; Vor 24 Jahren
Art des Formats Verlust Audio-
Enthalten von Mpeg-es
Standards
Offenes Format? Ja[9]
Freies Format? Abgelaufene Patente[10]

MP3 (formal MPEG-1 Audio Layer III oder MPEG-2 Audio Layer III)[4] ist ein Codierungsformat zum digitaler Ton weitgehend von der entwickelt Fraunhofer Society in Deutschland mit Unterstützung anderer digitaler Wissenschaftler in den USA und anderswo. Ursprünglich definiert als drittes Audioformat der MPEG-1 Standard, es wurde beibehalten und weiter erweitert-Definition zusätzlicher Bit-Rates und Unterstützung für mehr Audiokanäle - als drittes Audioformat der nachfolgenden MPEG-2 Standard. Eine dritte Version, die als MPEG 2.5 bekannt ist - erweitert, um niedrigere Bitraten besser zu unterstützen, wird häufig implementiert, ist jedoch kein anerkannter Standard.

MP3 (oder MP3) Als ein Datei Format Bestimmt häufig Dateien mit einer Elementarstrom von MPEG-1-Audio- oder MPEG-2-Audio-codierten Daten ohne andere Komplexitäten des MP3-Standards.

Hinsichtlich Audiokomprimierung (Der Aspekt des Standards für Endbenutzer, für den es am bekanntesten ist), verwendet MP3 Verlusthafte Datenkompression Daten mithilfe ungenauer Annäherungen und das teilweise Abwurf von Daten zu codieren. Dies ermöglicht eine große Verringerung der Dateigrößen im Vergleich zu unkomprimiertem Audio. Die Kombination aus kleiner Größe und akzeptabler Treue führte zu einem Boom in der Verteilung der Musik über das Internet Mitte bis Ende der 1990er Jahre, wobei MP3 als Aktivierungstechnologie zu einer Zeit diente, in der Bandbreite und Speicher noch in einer Premium waren. Das MP3 -Format wurde bald mit Kontroversen in Verbindung gebracht, die umgeben sind Copyright-Verletzung, Musikpiraterieund die Datei Ripping/Teilen Dienstleistungen Mp3.com und Napster, unter anderen. Mit dem Aufkommen von Tragbare Medienspieler, eine Produktkategorie auch einschließlich Smartphones, MP3-Unterstützung bleibt nahezu universell.

MP3 -Komprimierung funktioniert, indem die Genauigkeit bestimmter Klangkomponenten reduziert (oder approximiert) wird (durch psychoakustische Analyse) als über das hinausgeht Hörfähigkeit von den meisten Menschen. Diese Methode wird üblicherweise als Wahrnehmungscodierung oder als bezeichnet psychoakustisch Modellieren.[11] Die verbleibenden Audioinformationen werden dann auf platzeffizienter Weise unter Verwendung MDCT und Fft Algorithmen. Verglichen mit Digitales Audio in CD-QualitätDie MP3 -Komprimierung kann üblicherweise eine Größe der Größe um 75 bis 95% erreichen. Beispielsweise würde ein MP3 -kodiert mit einem konstanten Bitrate von 128 kbit/s zu einer Datei etwa 9% der Größe des ursprünglichen CD -Audio führen.[12] In den frühen 2000er Jahren übernahm Compact Disc -Player zunehmend die Unterstützung für die Wiedergabe von MP3 -Dateien auf Daten -CDs.

Das Experten für bewegte Bildexperten (MPEG) entworfen MP3 als Teil seiner MPEG-1, und später MPEG-2, Standards. MPEG-1-Audio (MPEG-1 Teil 3), der MPEG-1-Audioschicht I, II und III enthielt, wurde als Ausschussentwurf für eine genehmigt ISO/IEC Standard im Jahr 1991,[13][14] abgeschlossen im Jahr 1992,[15] und 1993 als ISO/IEC 11172-3: 1993 veröffentlicht.[7] Eine MPEG-2-Audio-Erweiterung (MPEG-2 Part 3) mit niedrigeren Proben- und Bit-Raten wurde 1995 als ISO/IEC 13818-3: 1995 veröffentlicht.[8][16] Es erfordert nur minimale Modifikationen an vorhandenen MPEG-1-Decodern (Erkennung des MPEG-2-Bits im Header und Zugabe der neuen niedrigeren Stichprobe und der Bitraten).

Geschichte

Hintergrund

Der MP3 -Verlust Audiodatenkomprimierung Der Algorithmus nutzt eine Wahrnehmungsbeschränkung des menschlichen Gehörs genannt Hörmaskierung. 1894 der amerikanische Physiker Alfred M. Mayer berichtete, dass ein Ton durch einen weiteren Ton mit niedrigerer Frequenz unverständlich gemacht werden könnte.[17] 1959 beschrieb Richard Ehmer eine vollständige Reihe von Hörkurven in Bezug auf dieses Phänomen.[18] Zwischen 1967 und 1974, Eberhard Zwicker arbeitete in den Bereichen des Tunings und Maskierens kritischer Frequenzbänder,[19][20] was wiederum auf der grundlegenden Forschung in der Region ausgebaut wurde Harvey Fletcher und seine Mitarbeiter bei Bell Labs.[21]

Die Wahrnehmungscodierung wurde zuerst für verwendet Sprachcodierung Komprimierung mit Lineare Vorhersagecodierung (LPC),[22] das hat Ursprung in der Arbeit von Fumitada itakura (Universität Nagoya) und Shuzo Saito (Nippon Telegraph und Telefon) im Jahr 1966.[23] 1978,, Bishnu S. Atal und Manfred R. Schroeder In Bell Labs schlug eine LPC -Rede vor Codec, genannt Adaptive VorhersagecodierungDas verwendete eine psychoakustische Codierungs-Algorithmus, die die Maskierungseigenschaften des menschlichen Ohrs ausnutzte.[22][24] Eine weitere Optimierung von Schroeder und Atal mit J. L. Hall wurde später in einer Arbeit von 1979 gemeldet.[25] Im selben Jahr wurde auch eine psychoakustische Maskierungs -Codec von M. A. Krasner vorgeschlagen,[26] die Hardware für Sprache veröffentlicht und produzierte (nicht als Musikbitkompression nutzbar), aber die Veröffentlichung seiner Ergebnisse in einem relativ dunklen Lincoln Laboratory Technischer Bericht[27] hat den Mainstream der psychoakustischen Codec-Entwicklung nicht sofort beeinflusst.

Das Diskrete Cosinus -Transformation (DCT), eine Art von Art von Transformationskodierung zum Verlustige Komprimierung, vorgeschlagen von Nasir Ahmed 1972 wurde Ahmed mit T. Natarajan und entwickelt K. R. Rao 1973; Sie veröffentlichten ihre Ergebnisse 1974.[28][29][30] Dies führte zur Entwicklung der modifizierte diskrete Cosinus -Transformation (MDCT), vorgeschlagen von J. P. Princen, A. W. Johnson und A. B. Bradley im Jahr 1987,[31] Nach früheren Arbeiten von Princen und Bradley im Jahr 1986.[32] Die MDCT wurde später ein Kernteil des MP3 -Algorithmus.[33]

Ernst Terhardt et al. konstruierte einen Algorithmus, der 1982 die auditive Maskierung mit hoher Genauigkeit beschreibt.[34] Diese Arbeit fügte eine Vielzahl von Berichten von Autoren hinzu, die zu Fletcher zurückreichen, und zu den Arbeiten, die zunächst kritische Verhältnisse und kritische Bandbreiten bestimmt haben.

1985 präsentierten Atal und Schroeder Code angeregte lineare Vorhersage (CELP), ein LPC-basierter Wahrnehmungssprachkodierungsalgorithmus mit auditorischer Maskierung, der einen signifikanten erreichte Datenkomprimierungsverhältnis für seine Zeit.[22] IEEE'S Schiedsrichter Journal über ausgewählte Bereiche in Kommunikation Berichtet über eine Vielzahl von (meist wahrnehmbaren) Audio -Komprimierungsalgorithmen im Jahr 1988.[35] Die im Februar 1988 veröffentlichte Ausgabe "Voice Coding for Communications" berichtete über eine breite Palette etablierter, funktionierender Audio -Bit -Komprimierungstechnologien,[35] Einige von ihnen, die als Teil ihres grundlegenden Designs auditorische Maskierung verwenden, und einige zeigen Echtzeit-Hardware-Implementierungen.

Entwicklung

Die Entstehung der MP3 -Technologie wird in einem Papier von Professor Hans Musmann vollständig beschrieben.[36] der mehrere Jahre lang die ISO MPEG -Audiogruppe leitete. Im Dezember 1988 forderte MPEG einen Audio -Codierungsstandard. Im Juni 1989 wurden 14 Audio -Codierungsalgorithmen eingereicht. Aufgrund bestimmter Ähnlichkeiten zwischen diesen Codierungsvorschlägen wurden sie in vier Entwicklungsgruppen zusammengefasst. Die erste Gruppe war Aspec, von Fraunhofer Gesellschaft, AT&T, Frankreich Telecom, Deutsche und Thomson-Brandt. Die zweite Gruppe war Musicam, durch Matsushita, CCETT, Itt und Philips. Die dritte Gruppe war ATAC (ATRAC -Codierung), von Fujitsu, JVC, NEC und Sony. Und die vierte Gruppe war SB-ADPCM, durch Ntt und Btrl.[36]

Die unmittelbaren Vorgänger von MP3 waren "optimale Codierung in der Frequenzdomäne" (OCF).[37] und Wahrnehmungstransformationskodierung (PXFM).[38] Diese beiden Codecs, zusammen mit Block-Switching-Beiträgen von Thomson-Brandt, wurden in einen Codec namens ASPEC zusammengeführt, der an MPEG eingereicht wurde und der den Qualitätswettbewerb gewann, das jedoch fälschlicherweise als zu komplex abgelehnt wurde, um umzusetzen. Die erste praktische Implementierung eines Audio Perceptual Codierers (OCF) in Hardware (Krasner -Hardware war zu mühsam und langsam für den praktischen Gebrauch), war eine Implementierung eines psychoakustischen Transformationscodierers basierend auf Motorola 56000 DSP Chips.

Ein weiterer Vorgänger des MP3-Formats und der Technologie ist im Wahrnehmungs-Codec-Musikam auf der Grundlage einer ganzzahligen Arithmetics 32-Unterbänder-Filterbank zu finden, die von einem psychoakustischen Modell angetrieben wird. Es wurde hauptsächlich für digitales Audio-Rundfunk (digitales Radio) und digitales Fernsehen konzipiert, und seine Grundprinzipien wurden von CCETT (Frankreich) und IRT (Deutschland) in Atlanta während einer IEEE-ICASP-Konferenz im Jahr 1991 der wissenschaftlichen Gemeinschaft offenbart.[39] Nachdem er an Musicam mitgearbeitet hatte mit Matsushita und Philips seit 1989.[36]

Dieser Codec in ein Rundfunksystem unter Verwendung der CoFDM -Modulation wurde auf Luft und im Feld nachgewiesen[40] Mit Radio Canada und CRC Canada während der NAB Show (Las Vegas) im Jahr 1991. Die Implementierung des Audio-Teils dieses Rundfunksystems basierte auf einem Zwei-Chips Team von G. Stoll (IRT Deutschland), später bekannt als psychoakustisches Modell I) und ein Echtzeit -Decoder mit einem Motorola 56001 DSP Chip mit einer Ganzzahl -Arithmetik -Software, die von Y.F. entworfen wurde. Deherys Team (CCETT, Frankreich). Die Einfachheit des entsprechenden Decoders zusammen mit der hohen Audioqualität dieses Codec, die zum ersten Mal eine 48 -kHz Input Studio Standard) waren die Hauptgründe, um später die Eigenschaften von MusicAM als grundlegende Funktionen für eine fortschrittliche digitale Musikkomprimierungs -Codec zu übernehmen.

Während der Entwicklung der MusicAM-Codierungssoftware nutzten Stoll und Deherys Team eine Reihe hochwertiger Audiobewertungsmaterialien gründlich[41] Ausgewählt von einer Gruppe von Audio -Fachleuten aus der Europäischen Rundfunkunion und später als Referenz für die Bewertung von Musikkomprimierungscodecs. Die Subband-Codierungstechnik war nicht nur für die Wahrnehmungscodierung der hochwertigen Schallmaterial der MusicAM Sub-Band-Filterbank (dieser Vorteil ist ein spezifisches Merkmal der Kurztransform-Codierungstechniken).

Als Doktorand bei Deutschlands Universität von Erlangen-Nuremberg, Karlheinz Brandenburg begann in den frühen 1980er Jahren mit der Arbeit an digitaler Musikkomprimierung zu arbeiten und konzentrierte sich darauf, wie Menschen Musik wahrnehmen. Er absolvierte seine Doktorarbeit im Jahr 1989.[42] MP3 stammt direkt von OCF und PXFM ab und repräsentiert das Ergebnis der Zusammenarbeit von Brandenburg-Arbeit als Postdoktorand bei AT & T-Bell Labs mit James D. Johnston ("JJ") von AT & T-Bell Labs-mit dem Fraunhofer Institute für integrierte Schaltungen, Erlangen (wo er arbeitete Bernhard Grill und vier weitere Forscher - "The Original Six"[43]) mit relativ geringen Beiträgen aus dem MP2-Zweig der psychoakustischen Unterbandcodierer. 1990 wurde Brandenburg Assistenzprofessor bei Erlangen-Nuremberg. Dort arbeitete er weiter an der Musikkomprimierung mit Wissenschaftlern am Fraunhofer Society's Heinrich Herz Institute. 1993 trat er den Mitarbeitern von Fraunhofer HHI bei.[42] Das Lied "Tom's Diner" durch Suzanne Vega war das erste Lied von Karlheinz Brandenburg zur Entwicklung des MP3 -Formats. Brandenburg übernahm das Lied zu Testzwecken und hörte es jedes Mal immer wieder an, wenn er das System verfeinerte, und stellte sicher, dass es die Subtilität von Vegas Stimme nicht nachteilig beeinflusste.[44] Dementsprechend nannte er Vega die "Mutter von MP3".[45]

Standardisierung

Im Jahr 1991 gab es zwei verfügbare Vorschläge, die für einen MPEG -Audio -Standard bewertet wurden: Musicam (MNachfragen angepasst UNiversal SUbband INTERMALATED COding And MUltiplexing) und ASPEC (ADaptive Spraktaler PErceptuell ENtropie COding). Die Musicam -Technik, vorgeschlagen von Philips (Niederlande), CCETT (Frankreich), die Institut für Broadcast -Technologie (Deutschland) und Matsushita (Japan),[46] wurde aufgrund seiner Einfachheit und Fehlerrobustheit sowie seiner hohen Recheneffizienz ausgewählt.[47] Das Musicam -Format basiert auf Subband-Codierung, wurde die Grundlage für das MPEG -Audio -Komprimierungsformat, das beispielsweise seine Rahmenstruktur, das Header -Format, die Stichprobenraten usw. enthielt.

Während ein Großteil der MusicAM -Technologie und -ideen in die Definition von MPEG Audio Layer I und Layer II einbezogen wurde, blieb die Filterbank allein und die Datenstruktur auf der Grundlage von 1152 Proben (Dateiformat und Byte -orientiertes Strom) von MusicAM in der Layer III (Layer III MP3) Format als Teil des rechnerisch ineffizienten Hybrids Filter Bank. Unter dem Vorsitz von Professor Musmann von der Leibniz University HannoverDie Bearbeitung des Standards wurde an Leon van de Kerkhof (Niederlande), Gerhard Stoll (Deutschland) und Yves-François Dehery (Frankreich) delegiert, der auf Schicht I und Layer II arbeitete. ASPEC war der gemeinsame Vorschlag von AT & T Bell Laboratories, Thomson Consumer Electronics, Fraunhofer Society und CNET.[48] Es bot die höchste Codierungseffizienz.

A Arbeitsgruppe bestehend aus van de kerkhof, stoll, Leonardo Chiariglione (Cselt VP for Media), Yves-François Dehery, Karlheinz Brandenburg (Deutschland) und James D. Johnston (Vereinigte Staaten) haben Ideen von ASPEC genommen, die Filterbank aus der Schicht II integriert, einige ihrer eigenen Ideen wie die gemeinsame Stereo-Codierung von hinzugefügt Musicam und erstellt das MP3 -Format, das mit 128 die gleiche Qualität erreicht wurdekbit/s wie MP2 bei 192 kbit/s.

Die Algorithmen für MPEG-1-Audioschicht I, II und III wurden 1991 genehmigt[13][14] und 1992 abgeschlossen[15] im Rahmen MPEG-1, die erste Standardsuite von MPEG, was zum internationalen Standard führte ISO/IEC 11172-3 (a.k.a. MPEG-1-Audio oder MPEG-1 Teil 3), veröffentlicht 1993.[7] Dateien oder Datenströme, die diesem Standard entsprechen Mp3-Player und Decoder. Somit die erste Generation von MP3 definiert 14 × 3 = 42 Interpretationen von MP3 -Frame -Datenstrukturen und Größenlayouts.

Weitere Arbeiten an MPEG -Audio[49] wurde 1994 im Rahmen der zweiten Suite von MPEG -Standards abgeschlossen, MPEG-2, formal eher als internationaler Standard bekannt ISO/IEC 13818-3 (a.k.a. MPEG-2 Teil 3 oder rückwärts kompatibel MPEG-2-Audio oder MPEG-2 Audio BC[16]), ursprünglich 1995 veröffentlicht.[8][50] MPEG-2 Teil 3 (ISO/IEC 13818-3) definierte 42 zusätzliche Bitraten und Stichprobenraten für MPEG-1-Audioschicht I, II und III. Die neuen Stichprobenraten sind genau die Hälfte der der ursprünglich in MPEG-1-Audio definierten Personen. Diese Verringerung der Stichprobenrate dient dazu, die verfügbare Frequenztreue in zwei Hälften zu senken und gleichzeitig das Bitrate um 50%zu senken. MPEG-2 Teil 3 verbesserte auch das Audio von MPEG-1, indem er die Kodierung von Audioprogrammen mit mehr als zwei Kanälen bis zu 5,1 Multichannel ermöglichte.[49] Ein MP3-Codieren mit MPEG-2 führt zur Hälfte der Bandbreitenreproduktion von MPEG-1, die für Klavier und Gesang geeignet sind.

Eine dritte Generation von "MP3" -Stil -Datenströmen (Dateien) erweiterte die MPEG-2 Ideen und Implementierung, wurde aber benannt MPEG-2.5 Audio, da MPEG-3 bereits eine andere Bedeutung hatte. Diese Erweiterung wurde bei Fraunhofer IIS, den registrierten Patentinhabern von MP3, entwickelt, indem das Feld Rahmensynchronisation im MP3 -Header von 12 bis 11 Bit reduziert wurde. Wie beim Übergang von MPEG-1 zu MPEG-2 fügt MPEG-2,5 zusätzliche Stichprobenraten genau die Hälfte derjenigen hinzu, die mit MPEG-2 verfügbar sind. Es erweitert somit den Umfang von MP3, um menschliche Sprache und andere Anwendungen einzubeziehen, erfordert jedoch nur 25% der Bandbreite (Frequenzreproduktion), die unter Verwendung von MPEG-1-Stichprobenraten möglich sind. MPEG-2.5 ist zwar kein ISO-anerkannter Standard, ist zwar sowohl von kostengünstigen chinesischen als auch von digitalem Audio-Playern von Marken genannt, sowie von MP3-Codierern auf Computer-Software (computergestützte Software (LAHM), Decoder (FFMPEG) und Spieler (MPC) Hinzufügen 3 × 8 = 24 Zusätzliche MP3 -Frame -Typen. Jede Generation von MP3 unterstützt somit 3 Stichprobenraten genau die Hälfte der der vorherigen Generation für insgesamt 9 Sorten von MP3 -Formatdateien. Die Stichprobenrate-Vergleichstabelle zwischen MPEG-1, 2 und 2,5 ist später im Artikel angegeben.[51][52] MPEG-2.5 wird von Lame (seit 2000), dem Media Player Classic (MPC), iTunes und FFMPEG unterstützt.

MPEG-2.5 wurde von MPEG nicht entwickelt (siehe oben) und nie als internationaler Standard zugelassen. MPEG-2.5 ist somit eine inoffizielle oder proprietäre Erweiterung des MP3-Formats. Trotzdem ist es allgegenwärtig und besonders vorteilhaft für menschliche Sprachanwendungen mit niedrigem Bit.

MPEG Audio Layer III -Versionen[7][8][14][51][52][53]
Ausführung Internationaler Standard[*] Erstausgabe Public Erscheinungsdatum Letzte Ausgabe Public erschien Datum
MPEG-1 Audio Layer III ISO/IEC 11172-3 (MPEG-1 Teil 3) 1993
MPEG-2 Audio Layer III ISO/IEC 13818-3 (MPEG-2 Teil 3) 1995 1998
MPEG-2.5 Audio Layer III Nicht standardmäßig, proprietär 2000 2008

  • Das ISO-Standard ISO/IEC 11172-3 (a.k.a. mpeg-1 audio) definierte drei Formate: die MPEG-1-Audioschicht I, Layer II und Layer III. Die ISO-Standard-ISO/IEC 13818-3 (a.k.a. MPEG-2 Audio) definierte die erweiterte Version des MPEG-1-Audio: MPEG-2 Audio Layer I, Layer II und Layer III. MPEG-2-Audio (MPEG-2 Teil 3) sollte nicht mit MPEG-2 AAC (MPEG-2 Teil 7-ISO/IEC 13818-7) verwechselt werden.[16]

Die Komprimierungseffizienz von Encodern wird typischerweise durch die Bitrate definiert, da das Komprimierungsverhältnis von der abhängt Bitstiefe und Abtastrate des Eingangssignals. Trotzdem werden häufig Komprimierungsverhältnisse veröffentlicht. Sie können die verwenden Compact Disc (CD) Parameter als Referenzen (44.1 KHz, 2 Kanäle bei 16 Bit pro Kanal oder 2 × 16 Bit) oder manchmal die Digitales Audioband (DAT) SP -Parameter (48 kHz, 2 × 16 Bit). Komprimierungsverhältnisse mit dieser letzteren Referenz sind höher, was das Problem bei der Verwendung des Begriffs zeigt Kompressionsrate für verlustige Encoder.

Karlheinz Brandenburg verwendete eine CD -Aufnahme von Suzanne Vega's Lied "Tom's Diner"Um die MP3 zu bewerten und zu verfeinern Kompressionsalgorithmus. Dieses Lied wurde wegen seines fast ausgewählt monophon Natur und breite spektrale Inhalte, sodass es einfacher ist, Unvollkommenheiten im Komprimierungsformat während der Wiedergabe zu hören. Dieser spezielle Track hat eine interessante Eigenschaft, als die beiden Kanäle fast, aber nicht vollständig, dasselbe sind, was zu einem Fall führt, in dem die Depression von Bina -Maskierungsniveaus eine räumliche Entlarvung von Geräuschartefakten verursacht, es sei denn Detailliert im MPEG-2 AAC Psychoacustic Model. Einige kritische Audioausschnitte (Glockenspiel, Dreieck, Akkordeonusw.) wurden aus dem genommen Ebu V3/SQAM -Referenz -Kompakt -Disc und wurden von professionellen Soundingenieuren verwendet, um die subjektive Qualität der MPEG -Audioformate zu bewerten. Lame ist der fortschrittlichste MP3 -Encoder. LAME enthält eine VBR -Variable -Bit -Rate -Codierung, die eher einen Qualitätsparameter als ein Bitrate -Ziel verwendet. Spätere Versionen (2008+) unterstützen ein Qualitätsziel von N.NNN, das automatisch MPEG-2- oder MPEG-2,5-Stichprobenraten für menschliche Sprachaufzeichnungen ausgewählt wird, die nur 5512 Hz Bandbreitenauflösung benötigen.

Veröffentlichen

Eine Referenzsimulationssoftware -Implementierung, geschrieben in der C -Sprache und später als bekannt als ISO 11172-5, wurde (1991–1996) von den Mitgliedern des ISO -MPEG -Audiokomitees entwickelt, um bitkonforme MPEG -Audio -Dateien (Layer 1, Layer 2, Layer 3) zu erstellen. Es wurde im März 1994 als Ausschussentwurf des ISO/IEC-technischen Berichts genehmigt und im April 1994 als Dokument CD 11172-5 gedruckt.[54] Es wurde als Entwurf des technischen Berichts (DTR/Dis) im November 1994 genehmigt.[55] 1996 abgeschlossen und als internationales Standard-ISO/IEC TR 11172-5: 1998 1998 veröffentlicht.[56] Das Referenzsoftware In C wurde die Sprache später als frei verfügbarer ISO -Standard veröffentlicht.[57] In einer nicht realen Zeit an einer Reihe von Betriebssystemen war es in der Lage, die erste Echtzeit-Hardware-Dekodierung zu demonstrieren (DecodingDSP basierend) von komprimiertem Audio. Einige andere Echtzeit -Implementierungen von MPEG -Audio -Encodern und Decoders[58] waren zum Zwecke des digitalen Rundfunks (Radio TUPFEN, Fernsehen DVB) in Richtung Verbraucherempfänger und Setzen Sie Top -Boxen.

Am 7. Juli 1994 die Fraunhofer Society veröffentlichte den ersten Software -MP3 -Encoder mit dem Namen l3enc.[59] Das Dateiname Erweiterung .mp3 wurde vom Fraunhofer -Team am 14. Juli 1995 ausgewählt (zuvor wurden die Dateien benannt .bisschen).[1] Mit dem ersten Echtzeit-Software-MP3-Player WinPlay3 (Veröffentlicht am 9. September 1995) Viele Menschen konnten MP3 -Dateien auf ihren PCs codieren und zurückspielen. Wegen der relativ kleinen Festplatte der Zeit (~ 500–1000 Mb) Verlusthafte Komprimierung war unerlässlich, um die Musik mehrerer Alben auf einem Heimcomputer als vollständige Aufnahmen zu speichern (im Gegensatz dazu MIDI Notation, oder Tracker Dateien, die Notation mit kurzen Aufnahmen von Instrumenten kombinierten, die einzelne Notizen spielen).

Fraunhofer Beispielimplementierung

Ein Hacker namens Soloh entdeckte das Quellcode des "dist10" MPEG Referenzimplementierung Kurz nach der Veröffentlichung auf den Servern der Universität Erlangen. Er entwickelte eine höherwertige Version und verbreitete sie im Internet. Dieser Code begann die weit verbreitete CD -Riss und digitale Musikverteilung als MP3 über das Internet.[60][61][62][63]

Internetverteilung

In der zweiten Hälfte der 1990er Jahre verbreiten sich MP3 -Dateien auf dem Internetoft über unterirdische Raubkopien -Song -Netzwerke. Das erste bekannte Experiment in der Internetverteilung wurde Anfang der neunziger Jahre von der organisiert Internet -Underground -Musikarchiv, besser bekannt durch das Akronym Iuma. Nach einigen Experimenten[64] Unter Verwendung unkomprimierter Audiodateien lieferte dieses Archiv das native weltweite Internet mit niedrigem Geschwindigkeit ein. Einige komprimierte MPEG-Audio-Dateien mit dem MP2 (Layer II) -Format (Layer II) und später verwendeten MP3-Dateien, wenn der Standard vollständig abgeschlossen war. Die Popularität von MP3s begann mit dem Aufkommen schnell zu steigen NullsoftAudio -Player Winamp, veröffentlicht 1997. 1998 der erste tragbare Solid State Digital Audio Player Mpman, entwickelt von Saehan Informationssysteme, das seinen Hauptsitz in Seoul, Südkorea, wurde freigelassen und die Rio PMP300 wurde danach 1998 verkauft, trotz rechtlicher Unterdrückungsbemühungen durch die Riaa.[65]

Im November 1997 die Website mp3.com bot Tausende von MP3s, die von unabhängigen Künstlern kostenlos erstellt wurden.[65] Die geringe Größe der MP3 -Dateien ist weit verbreitet, die weit verbreitet sind Peer-To-Peer Datenaustausch Der Musik zerrissen von CDs, was bisher fast unmöglich gewesen wäre. Das erste große Peer-to-Peer-Filesharing-Netzwerk, Napster, wurde 1999 gestartet. Die einfache Erstellung und Freigabe von MP3s führte zu weit verbreiteter Copyright-Verletzung. Große Plattenfirmen argumentierten, dass diese kostenlose gemeinsame Nutzung der Musik den Umsatz reduzierte und ihn nannte. "Musikpiraterie". Sie reagierten, indem sie Klagen gegen die Verfahren gegen Napster, der schließlich geschlossen und später verkauft wurde und gegen einzelne Benutzer, die sich mit der Dateifreigabe befassten.[66]

Nicht autorisierte MP3-Dateifreigabe wird in der nächsten Generation fortgesetzt Peer-to-Peer-Netzwerke. Einige autorisierte Dienste, wie z. Beatport, Piep, Juno Records, MUSIC, Zune Marketplace, Walmart.com, Rhapsodie, Die Aufzeichnungsbranche genehmigte die Wiedereinkarnation von Napster, und Amazon.com Verkaufen Sie uneingeschränkte Musik im MP3 -Format.

Entwurf

Dateistruktur

Diagram of the structure of an MP3 file
Diagramm der Struktur einer MP3 -Datei (MPEG Version 2.5 nicht unterstützt, daher 12 anstelle von 11 Bit für MP3 -Synchronisationspunkte).

Eine MP3 -Datei besteht aus MP3 -Frames, die aus einem Header und einem Datenblock bestehen. Diese Abfolge von Frames heißt ein Elementarstrom. Aufgrund des "Bit -Reservoirs" sind Frames keine unabhängigen Elemente und können normalerweise nicht an willkürlichen Rahmengrenzen extrahiert werden. Die MP3 -Datenblöcke enthalten die (komprimierten) Audioinformationen in Bezug auf Frequenzen und Amplituden. Das Diagramm zeigt, dass der MP3 -Header aus a besteht Word synchronisieren, die verwendet wird, um den Beginn eines gültigen Rahmens zu identifizieren. Darauf folgt ein bisschen, dass dies das ist MPEG Standard- und zwei Bits, die darauf hinweisen, dass Schicht 3 verwendet wird; Daher MPEG-1 Audio Layer 3 oder MP3. Danach unterscheiden sich die Werte je nach MP3 -Datei. ISO/IEC 11172-3 Definiert den Wertebereich für jeden Abschnitt des Headers zusammen mit der Spezifikation des Headers. Die meisten MP3 -Dateien heute enthalten heute ID3 Metadaten, was den MP3 -Frames vorausgeht oder folgt, wie im Diagramm angegeben. Der Datenstrom kann eine optionale Prüfsumme enthalten.

Gemeinsame Stereoanlage wird nur auf Frame-to-Frame-Basis durchgeführt.[67]

Codierung und Dekodierung

Der MP3 -Codierungsalgorithmus ist im Allgemeinen in vier Teile aufgeteilt. Teil 1 unterteilt das Audiosignal in kleinere Stücke, genannt Rahmen und a modifizierte diskrete Cosinus -Transformation (MDCT) Filter wird dann am Ausgang durchgeführt. Teil 2 übergibt die Probe in einen 1024 Punkte Schnelle Fourier-Transformation (Fft), dann die psychoakustisch Das Modell wird angewendet und ein weiterer MDCT -Filter wird am Ausgang durchgeführt. Teil 3 quantifiziert und codiert jede Probe, die als Rauschallokation bezeichnet wird und sich selbst anpasst, um die zu erfüllen Bitrate und Schallmaskierung Bedarf. Teil 4 formatiert die Bitstream, ein Audiorahmen, der aus 4 Teilen besteht, die Header, Fehlerprüfung, Audiodaten, und Zusatzdaten.[33]

Das MPEG-1 Standard enthält keine genaue Spezifikation für einen MP3-Encoder, bietet jedoch Beispiele für psychoakustische Modelle, Ratenschleife und dergleichen im nicht normativen Teil des ursprünglichen Standards.[68] MPEG-2 verdoppelt die Anzahl der Stichprobenraten, die unterstützt werden, und MPEG-2.5 fügt 3 weitere hinzu. Wenn dies geschrieben wurde, waren die vorgeschlagenen Implementierungen ziemlich veraltet. Implementierer des Standards sollten ihre eigenen Algorithmen entwickeln, die zum Entfernen von Teilen der Informationen aus dem Audioeingang geeignet sind. Infolgedessen wurden viele verschiedene MP3 -Encoder verfügbar, wobei jeder Dateien mit unterschiedlicher Qualität produzierte. Vergleiche waren weit verbreitet, daher war es für einen potenziellen Benutzer eines Encoders einfach, die beste Wahl zu erforschen. Einige Encoder, die mit höheren Bitraten kodieren konnten (wie z. LAHM) waren nicht unbedingt so gut mit niedrigeren Bitraten. Im Laufe der Zeit entwickelte sich Lame auf der SourceForge -Website, bis es zum De -facto -CBR -MP3 -Encoder wurde. Später wurde ein ABR -Modus hinzugefügt. Die Arbeiten zur echten variablen Bitrate unter Verwendung eines Qualitätsziels zwischen 0 und 10. Schließlich könnten Zahlen (z. B. -V 9.600) eine hervorragende Qualität mit niedriger Bitrate -Sprachcodierung von nur 41 kbit/s unter Verwendung der MPEG -2.5 -Erweiterungen erzeugen.

Während der Codierung werden 576 Zeitdomänenproben entnommen und in 576 transformiert Frequenzdomänenproben.[Klarstellung erforderlich] Wenn da ein ... ist vorübergehend, 192 Proben werden anstelle von 576 entnommen. Dies wird durchgeführt, um die zeitliche Ausbreitung von Quantisierungsrauschen zu begrenzen, die den Transienten begleiten (siehe Psychoakustik). Die Frequenzauflösung wird durch die kleine lange Blockfenstergröße begrenzt, wodurch die Codierungseffizienz verringert wird.[67] Die zeitliche Auflösung kann für hochübergreifende Signale zu niedrig sein und das Verschmieren von perkussiven Geräuschen verursachen.[67]

Aufgrund der Baumstruktur der Filterbank werden die Probleme vor dem Echo verschlechtert, da die kombinierte Impulsantwort der beiden Filterbanken keine optimale Lösung bei Zeit-/Frequenzauflösung liefert.[67] Darüber hinaus erzeugt die Kombination der beiden Ergebnisse der Filterbanken Aliasing -Probleme, die teilweise durch das Stadium der "Aliasing -Kompensation" behandelt werden müssen. Dies schafft jedoch überschüssige Energie, die im Frequenzbereich codiert werden sollen, wodurch die Codierungseffizienz verringert wird.[69]

Das Dekodieren hingegen wird sorgfältig im Standard definiert. Die meisten Decoder sind "Bitstream konform ", was bedeutet, dass die dekomprimierte Ausgabe, die sie aus einer bestimmten MP3 -Datei erzeugen Rundung Toleranz, wie die Ausgabe mathematisch im ISO/IEC-hohen Standarddokument (ISO/IEC 11172-3) angegeben. Daher basiert der Vergleich von Decoder normalerweise darauf, wie rechnerisch effizient sie sind (d. H. Wie viel Erinnerung oder Zentralprozessor Zeit, die sie im Dekodierungsprozess verwenden). Im Laufe der Zeit ist dieses Problem weniger zu einem Problem geworden, da die CPU -Geschwindigkeit von MHz nach GHZ überging. Die Gesamtverzögerung von Encoder/Decoder ist nicht definiert, was bedeutet, dass es keine offizielle Bestimmung gibt Gaplose Wiedergabe. Einige Encoder wie Lame können jedoch zusätzliche Metadaten anbringen, mit denen Spieler, die damit umgehen können, eine nahtlose Wiedergabe liefern.

Qualität

Bei der Durchführung einer verlustenden Audio-Codierung wie dem Erstellen eines MP3-Datenstroms besteht ein Kompromiss zwischen der Menge der generierten Daten und der Schallqualität der Ergebnisse. Die Person, die eine MP3 erzeugt, wählt a aus Bitrate, was angibt, wie viele Kilobits pro Sekunde von Audio ist erwünscht. Je höher die Bitrate, desto größer wird der MP3 -Datenstrom und im Allgemeinen, je näher er der ursprünglichen Aufnahme klingt. Mit zu niedriger Bitrate, Kompressionsartefakte (d. H. Geräusche, die in der ursprünglichen Aufnahme nicht vorhanden waren) können in der Reproduktion hörbar sein. Ein gewisser Audio ist aufgrund seiner Zufälligkeit und scharfen Angriffe schwer zu komprimieren. Wenn diese Art von Audio komprimiert ist, Artefakte wie Klingeln oder Pre-Echo werden normalerweise gehört. Eine Probe von Applaus oder einem Dreiecksinstrument mit einer relativ niedrigen Bitrate liefert gute Beispiele für Kompressionsartefakte. Die meisten subjektiven Tests von Wahrnehmungs-Codecs vermeiden tendenziell die Verwendung dieser Arten von Schallmaterialien. Die durch perkussiven Klänge erzeugten Artefakte sind jedoch aufgrund des spezifischen zeitlichen Maskierungsmerkmals der 32 Unterbandfilterbank von Layer II kaum wahrnehmbar, auf der das Format basiert, auf dem das Format basiert, auf dem sich das Format basiert, auf dem das Format basiert, auf dem sich das Format basiert, auf dem sich das Format basiert, auf dem sich das Format basiert. .

Neben der Bitrate eines codierten Audio -Stücks hängt die Qualität des mp3 -codierten Sounds auch von der Qualität des Encoder -Algorithmus sowie von der Komplexität des zu codierenden Signals ab. Da der MP3 -Standard mit Codierungsalgorithmen eine Menge Freiheit ermöglicht, bieten verschiedene Encoder eine ganz andere Qualität, selbst mit identischen Bitraten. Als Beispiel in einem öffentlichen Hörtest mit zwei frühen MP3 -Encodern auf etwa 128 kbit/s,[70] Einer erzielte 3,66 auf einer Skala von 1–5, während der andere nur 2,22 erzielte. Die Qualität hängt von der Auswahl von Encoder- und Codierungsparametern ab.[71]

Diese Beobachtung verursachte eine Revolution bei der Audio -Codierung. Schon früh war Bitrate die Haupt- und einzige Überlegung. Zu der Zeit waren MP3 -Dateien vom einfachsten Typ: Sie verwendeten die gleiche Bitrate für die gesamte Datei: Dieser Prozess wird als bezeichnet als Konstante Bit-Rate (CBR) Codierung. Die Verwendung einer konstanten Bitrate macht die Codierung einfacher und weniger CPU -intensiv. Es ist jedoch auch möglich, Dateien zu erstellen, bei denen sich die Bitrate in der gesamten Datei ändert. Diese sind bekannt als als Variable Bitrate. Das Bit-Reservoir und die VBR-Codierung waren tatsächlich Teil des ursprünglichen MPEG-1-Standards. Das Konzept dahinter ist, dass in jedem Audio einige Abschnitte leichter zu komprimieren sind, wie Stille oder Musik, die nur wenige Töne enthalten, während andere schwieriger zu komprimieren sind. Die Gesamtqualität der Datei kann also durch die Verwendung einer niedrigeren Bitrate für die weniger komplexen Passagen und eine höhere für die komplexeren Teile erhöht werden. Bei einigen erweiterten MP3 -Encodern ist es möglich, eine bestimmte Qualität anzugeben, und der Encoder passt die Bitrate entsprechend an. Benutzer, die eine bestimmte "Qualitätseinstellung" wünschen, dh dh transparent Für ihre Ohren können diesen Wert bei der Codierung ihrer gesamten Musik verwenden und im Allgemeinen keine Sorgen mehr machen, persönliche Hörtests auf jedem Musikstück durchzuführen, um die richtige Bitrate zu bestimmen.

Die wahrgenommene Qualität kann durch Hörumgebung (Umgebungsgeräusche), Aufmerksamkeit der Hörer und Hörertraining sowie in den meisten Fällen durch Hörer -Audiogeräte (wie Soundkarten, Lautsprecher und Kopfhörer) beeinflusst werden. Darüber hinaus kann eine ausreichende Qualität durch eine geringere Qualitätsumgebung für Vorlesungen und menschliche Sprachanwendungen erreicht werden und verkürzt die Codierungszeit und -komplexität. Ein Test, der neuen Schülern von vorgelegt wurde von Universität in Stanford Musikprofessor Jonathan Berger hat gezeigt, dass jedes Jahr die Präferenz für die Präferenz für die Musik in MP3-Qualität aufgestiegen ist. Berger sagte, die Schüler scheinen die "Brutzel" -Säule zu bevorzugen, die MP3s zur Musik bringen.[72]

Eine eingehende Studie über MP3-Audioqualität, Soundist und Komponistin Ryan Maguires Projekt "The Ghost in the MP3" isoliert die Sounds, die während der MP3-Komprimierung verloren gegangen sind. 2015 veröffentlichte er den Titel "Modernist" (ein Anagramm von "Tom's Diner"), das ausschließlich aus den Klängen komponiert wurde, die während der MP3 -Komprimierung des Songs "Tom's Diner" gelöscht wurden.[73][74][75] Der Track, der ursprünglich in der Formulierung des MP3 -Standards verwendet wurde. Ein detaillierter Bericht über die Techniken, die zur Isolierung der während der MP3 -Komprimierung gelöschten Sounds sowie der konzeptionellen Motivation des Projekts verwendet wurden, wurde in den Proceedings of the International Computer Music Conference 2014 veröffentlicht.[76]

Bitrate

MPEG Audio Layer III
verfügbare Bitraten (Kbit/s)[14][51][52][53][77]
MPEG-1
Audioschicht III
MPEG-2
Audioschicht III
MPEG-2.5
Audioschicht III
8 8
16 16
24 24
32 32 32
40 40 40
48 48 48
56 56 56
64 64 64
80 80
96 96
112 112
128 128
n / A 144
160 160
192
224
256
320
Unterstützte Stichprobenraten
nach MPEG -Audioformat[14][51][52][53]
MPEG-1
Audioschicht III
MPEG-2
Audioschicht III
MPEG-2.5
Audioschicht III
8000 Hz
11025 Hz
12000 Hz
16000 Hz
22050 Hz
24000 Hz
32000 Hz
44100 Hz
48000 Hz

Bitrate ist das Produkt der Stichprobenrate und der Anzahl der Bits pro Probe, die zur Codierung der Musik verwendet werden. CD -Audio beträgt 44100 Proben pro Sekunde. Die Anzahl der Bits pro Probe hängt auch von der Anzahl der Audiokanäle ab. CD ist Stereo und 16 Bit pro Kanal. Multiplizieren Sie 44100 mit 32 1411200 - die Bitrate unkomprimierter digitaler CD -Audio. MP3 wurde entwickelt, um diese 1411 kbit/s -Daten zu 320 kbit/s oder weniger zu codieren. Da weniger komplexe Passagen durch MP3 -Algorithmen erkannt werden, können niedrigere Bitrate verwendet werden. Bei der Verwendung von MPEG-2 anstelle von MPEG-1 unterstützt MP3 nur niedrigere Stichprobenraten (16000, 22050 oder 24000 Proben pro Sekunde) und bietet eine Bitrate-Auswahl von nur 8 kbit/s, aber nicht höher als 160 kbit/s. Durch die Senkung der Stichprobenrate entfernt MPEG-2-Schicht III alle Frequenzen über der Hälfte der neuen Stichprobenrate, die im Quell-Audio möglicherweise vorhanden war.

Wie in diesen beiden Tabellen gezeigt, wurden 14 ausgewählt Bitraten sind in MPEG-1 Audio Layer III Standard: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 und 320 kbit/zusammen mit den 3 höchsten verfügbaren Abtastfrequenzen von 32, 44.1 und 48KHz.[52] MPEG-2 Audio Layer III ermöglicht auch 14 etwas anders (und meistens niedriger) Bitraten von 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s mit Abtastfrequenzen von 16, 22.05 und 24KHz die genau die Hälfte der von MPEG-1 sind.[52] MPEG-2.5 Audio Layer III-Rahmen sind auf nur 8 begrenzt Bitraten von 8, 16, 24, 32, 40, 48, 56 und 64 kbit/s mit 3 sogar niedriger Abtastfrequenzen von 8, 11.025 und 12 kHz. Bei früheren Systemen, die nur den MPEG-1-Audio-Layer-III-Standard unterstützen, können MP3-Dateien mit einer Bitrate von unter 32 kbit/s zurückgespielt und aufgeregt werden.

Frühere Systeme fehlen ebenfalls Schnelle Weiterleitung und Wiederaufspeisensteuerung auf MP3 zurückspulen.[78][79]

MPEG-1-Frames enthalten das Detail im 320 kbit/s-Modus, die am höchsten zulässige Bitrate-Einstellung,[80] mit Stille und einfachen Tönen, die noch 32 kbit/s erfordern. MPEG-2-Frames können bis zu 12 kHz-Sound-Reproduktionen bis zu 160 kbit/s erfassen. MP3-Dateien mit MPEG-2 haben keine 20-kHz-Bandbreite aufgrund der Nyquist -Shannon -Probenahme Theorem. Die Frequenzreproduktion ist immer streng weniger als die Hälfte der Stichprobenfrequenz, und unvollständige Filter benötigen einen größeren Fehler (Rauschpegel gegenüber Filterschärfe), sodass eine 8 -kHz Die Rate begrenzt eine MP3 auf maximal 24 kHz -Schallwiedergabe. MPEG-2 verwendet Hälfte und MPEG-2,5 nur ein Viertel der MPEG-1-Stichprobenraten.

Für das allgemeine Bereich der menschlichen Sprachreproduktion reicht eine Bandbreite von 5512 Hz aus, um hervorragende Ergebnisse (für die Sprache) unter Verwendung der Stichprobenrate von 11025 und VBR -Codierung aus 44100 (Standard) WAV -Datei zu erzielen. Englische Sprecher durchschnittlich 41–42 kbit/s mit -V 9,6 Einstellung, dies kann jedoch mit der Menge an Stille oder der Lieferrate (WPM) variieren. Resampling auf 12000 (6K -Bandbreite) wird durch den lahmen Parameter -v 9.4 ausgewählt. Ebenso wählt -v 9.2 16000 Probenrate und eine daraus resultierende 8K -Tiefpassfilterung. Weitere Informationen finden Sie unter Nyquist - Shannon. Ältere Versionen von LAME und FFMPEG unterstützen nur Ganzzahlargumente für den Parameter zur Auswahl der variablen Bitratequalität. Der N.NNN-Qualitätsparameter (-V) ist bei lame.sourceForge.net dokumentiert, wird jedoch nur in Lame mit dem neuen Selektor der VBR-Variablen-Bit-Rate-Qualität unterstützt-nicht durchschnittliche Bitrate (ABR).

Eine Stichprobenrate von 44,1 kHz wird üblicherweise für die Musikreproduktion verwendet, da dies auch für verwendet wird CD -AudioDie Hauptquelle zum Erstellen von MP3 -Dateien. Im Internet wird eine große Vielfalt von Bitraten verwendet. Eine Bitrate von 128 kbit/s wird üblicherweise verwendet,[81] Bei einem Kompressionsverhältnis von 11: 1, das eine angemessene Audioqualität in einem relativ kleinen Raum bietet. Als Internet Bandbreite Verfügbarkeits- und Festplattengrößen haben zugenommen, höhere Bitraten bis zu 320 kbit/s sind weit verbreitet. Unkomprimiertes Audio, das auf einem Audio-CD gespeichert ist vertreten Kompressionsverhältnisse von ungefähr 11: 1, 9: 1 bzw. 7: 1.

Nicht standardmäßige Bitraten von bis zu 640 kbit/s können mit dem erreicht werden LAHM Encoder und die FreeFormat -Option, obwohl nur wenige MP3 -Player diese Dateien abspielen können. Gemäß dem ISO -Standard müssen Decoder nur in der Lage sein, Streams bis zu 320 kbit/s zu dekodieren.[82][83][84] Frühe MPEG -Schicht -III -Encoder verwendeten das, was jetzt genannt wird Konstante Bit-Rate (CBR). Die Software konnte nur ein einheitliches Bitrate für alle Frames in einer MP3 -Datei verwenden. Später differenziertere MP3 -Encoder konnten das Bit -Reservoir verwenden, um auf einen zu zielen durchschnittliche Bitrate Auswählen der Codierungsrate für jeden Frame basierend auf der Komplexität des Schalls in diesem Teil der Aufnahme.

Ein ausgefeilterer MP3 -Encoder kann produzieren Variable Bitrate Audio. MPEG Audio kann Bitrate-Switching auf einer Basis pro Rahmen verwenden, aber nur Layer III-Decoder müssen diese unterstützen.[52][85][86][87] VBR wird verwendet, wenn das Ziel darin besteht, ein festes Qualitätsniveau zu erreichen. Die endgültige Dateigröße einer VBR -Codierung ist weniger vorhersehbar als mit Konstante Bit-Rate. Durchschnittliche Bitrate ist eine Art von VBR, die als Kompromiss zwischen den beiden implementiert wird: Die Bitrate dürfte sich für eine konsistentere Qualität variieren, wird jedoch so gesteuert, dass sie in der Nähe eines vom Benutzer ausgewählten Durchschnittswerts für vorhersehbare Dateigrößen bleiben. Obwohl ein MP3 -Decoder VBR dazu beitragen muss, Standards zu sein, haben einige Decoder in der Vergangenheit Fehler mit VBR -Dekodierung, insbesondere bevor VBR -Encoder weit verbreitet wurden. Der am besten entwickelte lahme MP3 -Encoder unterstützt die Generation von VBR-, ABR- und sogar älteren CBR -MP3 -Formaten.

Layer III -Audio kann auch ein "Bit Reservoir" verwenden, die die Fähigkeit eines teilweise Vollbildmeisters, einen Teil der Audiodaten des nächsten Frame zu halten, und ermöglicht temporäre Änderungen des effektiven Bitrats, selbst in einem konstanten Bitrate -Stream.[52][85] Die interne Handhabung des Bit -Reservoirs erhöht die Codierungsverzögerung. Für Frequenzen über ca. 16 gibt es keine Skalierungsfaktorbande 21 (SFB21)KHzden Encoder zwingt, zwischen einer weniger genauen Darstellung in Band 21 oder weniger effizienter Speicher in allen Bändern unter dem Band 21 zu wählen, was zu einer verschwendeten Bitrate bei der VBR -Codierung führte.[88]

Zusatzdaten

Mit dem Feld Zusatzdaten kann verwendet werden, um benutzerdefinierte Daten zu speichern. Die Zusatzdaten sind optional und die Anzahl der verfügbaren Bits wird nicht ausdrücklich angegeben. Die Zusatzdaten befinden sich nach den Huffman -Code -Bits und reicht dorthin, wo der Main_Data_Begin des nächsten Frame zeigt. Encoder mp3pro Verwendete Zusatzdaten, um zusätzliche Informationen zu codieren, die die Audioqualität verbessern könnten, wenn sie mit einem eigenen Algorithmus dekodiert werden.

Metadaten

Ein "Tag" in einer Audiodatei ist ein Abschnitt der Datei, die enthält Metadaten wie der Titel, Künstler, Album, Tracknummer oder andere Informationen über den Inhalt der Datei. Die MP3 -Standards definieren keine Tag -Formate für MP3 -Dateien, noch gibt es einen Standard Containerformat Das würde Metadaten unterstützen und die Notwendigkeit von Tags vermeiden. Jedoch mehrere de facto Standards für Tag -Formate existieren. Ab 2010 sind die am weitesten verbreiteten sind ID3V1 und ID3V2und die kürzlich eingeführten Apev2. Diese Tags sind normalerweise am Anfang oder am Ende von MP3 -Dateien eingebettet, getrennt von den tatsächlichen MP3 -Frame -Daten. MP3-Decoder extrahieren entweder Informationen aus den Tags oder behandeln Sie sie einfach als ignorlose, nicht-mp3-Junk-Daten.

Das Spielen und Bearbeiten von Software enthält häufig Tag -Bearbeitungsfunktionen, aber es gibt auch Tag Editor Anwendungen, die dem Zweck gewidmet sind. Neben Metadaten, die sich auf den Audioinhalt beziehen, können auch Tags verwendet werden DRM.[89] Noch einmal spielen ist ein Standard zum Messen und Speichern der Lautstärke einer MP3 -Datei (Audionormalisierung) In seinem Metadaten-Tag können Sie einen replaygain-konformen Player ermöglichen, um das Gesamtwiedergabevolumen für jede Datei automatisch anzupassen. Mp3gain Kann verwendet werden, um die Dateien reversibel basierend auf Replaygain -Messungen zu ändern, sodass die angepasste Wiedergabe bei Spielern ohne Wiederholungsfähigkeit erreicht werden kann.

Lizenzierung, Eigentum und Gesetzgebung

Die grundlegende MP3-Dekodierungs- und Codierungstechnologie ist in der Europäischen Union patentfrei, alle Patente sind bis spätestens 2012 abgelaufen. In den Vereinigten Staaten wurde die Technologie am 16. April 2017 erheblich patentfrei (siehe unten). MP3 -Patente sind zwischen 2007 und 2017 in den USA abgelaufen. In der Vergangenheit haben viele Organisationen das Eigentum beansprucht Patente Bezogen auf MP3 -Dekodierung oder Codierung. Diese Behauptungen führten zu einer Reihe von rechtlichen Bedrohungen und Maßnahmen aus einer Vielzahl von Quellen. Infolgedessen müssen die Unsicherheit darüber, welche Patente lizenziert worden sein müssen, um MP3 -Produkte zu erstellen, ohne eine Patentverletzung in Ländern zu begehen, die dies zulassen Software -Patente war ein gemeinsames Merkmal der frühen Stadien der Einführung der Technologie.

Der anfängliche MPEG-1-Standard (Teile 1, 2 und 3) war am 6. Dezember 1991 als ISO-CD 11172 öffentlich verfügbar.[90][91] In den meisten Ländern können Patente nicht eingereicht werden, nachdem frühere Kunst veröffentlicht wurde, und Patente verfallen 20 Jahre nach dem ersten Anmeldetag, der bis zu 12 Monate später für Einreichungen in anderen Ländern betragen kann. Infolgedessen sind Patente, die zur Implementierung von MP3 erforderlich sind, bis Dezember 2012, 21 Jahre nach der Veröffentlichung von ISO CD 11172, in den meisten Ländern abgelaufen.

Eine Ausnahme sind die Vereinigten Staaten, in denen Patente vor dem 8. Juni 1995 nach 17 Jahren ab dem Ausgabendatum oder 20 Jahren ab dem Prioritätsdatum abgelaufen sind. Ein langwieriges Patentverfolgungsprozess kann dazu führen, dass ein Patent viel später als normalerweise erwartet wird (siehe U -Boot -Patente). Die verschiedenen MP3-bezogenen Patente sind an Daten von 2007 bis 2017 in den USA abgelaufen.[92] Patente für alles, was in der ISO -CD 11172 eingereicht wurde, die ein Jahr nach der Veröffentlichung eingereicht wurden, sind fraglich. Wenn nur die bekannten MP3-Patente, die bis Dezember 1992 eingereicht wurden, berücksichtigt werden, ist in den USA seit dem 22. September 2015, wann US -Patent 5.812.672, die im Oktober 1992 eine PCT -Einreichung hatte, lief ab.[93][94][95] Wenn das am längsten laufende Patent, das in den oben genannten Referenzen erwähnt wird, als Maß angenommen wird, wurde die MP3-Technologie am 16. April 2017 in den USA patentfrei US -Patent 6.009.399, gehaltenen[96] und verabreicht von Technicolor,[97] abgelaufen. Infolgedessen viele Kostenlose und Open-Source-Software Projekte wie die Fedora -Betriebssystem, haben beschlossen, standardmäßig mit dem Versand von MP3 -Support zu beginnen, und Benutzer müssen nicht mehr auf die Installation inoffizieller Pakete zurückgreifen, die von Software -Repositories von Drittanbietern für MP3 -Wiedergabe oder -codierung gepflegt werden.[98]

Technicolor (Früher als Thomson Consumer Electronics bezeichnet) behauptete, die MP3 -Lizenzierung der Patente der Schicht 3 in vielen Ländern, einschließlich der Länder der Vereinigten Staaten, Japan, Kanada und der EU, zu kontrollieren.[99] Technicolor hatte diese Patente aktiv durchgesetzt.[100] MP3 -Lizenzeinnahmen aus der Verwaltung von Technicolor erzielten 2005 für die Fraunhofer Society etwa 100 Millionen Euro.[101] Im September 1998 schickte das Fraunhofer -Institut einen Brief an mehrere Entwickler von MP3 -Software, in denen eine Lizenz erforderlich war, um "Decoder und/oder Encoder zu verteilen und/oder zu verkaufen". In dem Brief wurde behauptet, dass nicht lizenzierte Produkte "die Patentrechte von Fraunhofer und Thomson verletzen. Um Produkte mithilfe des [MPEG Layer-3] -Standards und somit unsere Patente zu produzieren, zu verkaufen oder zu vertreiben, müssen Sie eine Lizenz unter diesen Patenten von uns erhalten."[102] Dies führte zu der Situation, in der die LAHM MP3 -Encoder -Projekt konnte seinen Benutzern offizielle Binärdateien nicht anbieten, die auf ihrem Computer ausgeführt werden könnten. Die Position des Projekts war, dass Lame als Quellcode einfach eine Beschreibung des MP3 -Encoders war könnte implementiert werden. Inoffiziell waren zusammengestellte Binärdateien aus anderen Quellen erhältlich.

SISUVEL S.P.A., ein in Luxemburg ansässiges Unternehmen, verwaltet Lizenzen für Patente, die sich für MPEG Audio bewerben.[103] Zusammen mit dem US -amerikanischen Tochtergesellschaft Audio Mpeg, Inc. verklagten sie Thomson zuvor wegen Patentverletzung gegen MP3 -Technologie.[104] Aber diese Streitigkeiten wurden im November 2005 beigelegt, wobei Sstel Thomson ihren Patenten eine Lizenz gewährte. Motorola folgte kurz darauf und unterschrieb im Dezember 2005 bei SISEVEL, um MP3-bezogene Patente zu lizenzieren.[105] Mit Ausnahme von drei Patenten, die von SISEL verwalteten US[106] waren alle im Jahr 2015 abgelaufen. Die drei Ausnahmen waren: US -Patent 5.878.080, abgelaufen, im Februar 2017; US -Patent 5.850.456, abgelaufen, im Februar 2017; und US -Patent 5.960.037, abgelaufen am 9. April 2017.

Im September 2006 beschlagnahmten deutsche Beamte MP3 -Player von Sandisk's Stand am IFA Show In Berlin gewann ein italienisches Patentunternehmen eine einstweilige Verfügung im Namen von Sstel gegen Sandisk in einem Streit über Lizenzrechte. Die einstweilige Verfügung wurde später von einem Berliner Richter rückgängig gemacht,[107] Aber diese Umkehrung wurde wiederum am selben Tag von einem anderen Richter aus demselben Gericht blockiert, was "das Patent wild nach Westen nach Deutschland brachte" in den Worten eines Kommentators.[108] Im Februar 2007 verklagte Texas MP3 Technologies Apple, Samsung Electronics und Sandisk in Bundesgericht Osttexas, die Verstöße gegen ein tragbares MP3 -Player -Patent, das Texas MP3 zugewiesen worden war. Apple, Samsung und Sandisk haben alle die Ansprüche gegen sie im Januar 2009 beigelegt.[109][110]

Alcatel-Lucent hat mehrere MP3-Codierungs- und Komprimierungspatente behauptet, die angeblich von AT & T-Bell Labs in eigenen Rechtsstreitigkeiten geerbt wurden. Im November 2006 vor dem Zusammenschluss der Unternehmen Alcatel verklagt Microsoft für angebliche Verletzung von sieben Patenten. Am 23. Februar 2007 verlieh eine Jury in San Diego Alcatel-Lucent Schadensersatz in Höhe von 1,52 Milliarden US -Dollar wegen Verstoßes gegen zwei von ihnen.[111] Das Gericht widerrief anschließend die Auszeichnung jedoch fest, dass ein Patent nicht verletzt worden war und dass der andere nicht im Besitz Alcatel-Lucent; Es wurde gemeinsam von AT&T und Fraunhofer, der es lizenziert hatte Microsoft, der Richter entschied.[112] Dieses Verteidigungsurteil wurde 2008 im Berufungsverfahren bestätigt.[113] Sehen Alcatel-Lucent gegen Microsoft für mehr Informationen.

Alternative Technologien

Andere verlustige Formate existieren. Unter diesen, Erweiterte Audiocodierung (AAC) ist der am häufigsten verwendete und wurde als Nachfolger von MP3 ausgelegt. Es gibt auch andere verlustige Formate wie z. mp3pro und MP2. Sie sind Mitglieder derselben technologischen Familie wie MP3 und sind ungefähr ähnlich abhängig Psychoakustische Modelle und MDCT Algorithmen. Während MP3 einen Hybrid -Codierungsansatz verwendet, der Teil MDCT und Teil ist FftAAC ist rein mdct und verbessert die Kompressionseffizienz signifikant.[114] Viele der Basis Patente Die zugrunde liegenden Formate werden von gehalten Fraunhofer SocietyAlcatel-Lucent, Thomson Consumer Electronics,[114] Glocke, Dolby, LG -Elektronik, NEC, Ntt Docomo, Panasonic, Sony Corporation,[115] ETRI, JVC Kenwood, Philips, Microsoft, und Ntt.[116]

Als der digitale Audio -Player -Markt startete, wurde MP3 weithin als Standard verwendet, weshalb der beliebte Name "MP3 -Player". Sony war eine Ausnahme und benutzte ihre eigenen Atrac Codec von ihrem entnommen Minidisc Format, das Sony behauptete, war besser.[117] Nach Kritik und niedriger als erwartet Walkman Verkäufe im Jahr 2004 stellten Sony seine Walkman -Spieler zum ersten Mal einheimische MP3 -Support vor.[118]

Es gibt auch offene Komprimierungsformate wie Opus und Vorbis das sind kostenlos und ohne bekannte Patentbeschränkungen erhältlich. Einige der neueren Audiokomprimierungsformate, wie AAC, WMA Pro und Vorbis, sind frei von einigen Einschränkungen, die dem MP3 -Format innewohnt, das von keinem MP3 -Encoder überwunden werden kann.[92]

Neben verlustigen Komprimierungsmethoden,, Verlustlose Formate sind eine signifikante Alternative zu MP3, da sie unveränderten Audioinhalten bereitstellen, jedoch mit einer erhöhten Dateigröße im Vergleich zu verlustiger Komprimierung. Verlustlose Formate umfassen Flac (Kostenloser verlustfreier Audio -Codec), Apfelverlustlos und viele andere.

Siehe auch

Verweise

  1. ^ a b "Alles Gute zum Geburtstag mp3!". Fraunhofer iis. 12. Juli 2005. Abgerufen 18. Juli 2010.
  2. ^ "Der Audio/MPEG -Medientyp - RFC 3003". Ietf. November 2000. Abgerufen 7. Dezember 2009.
  3. ^ "MIME -Typ Registrierung von RTP -Nutzlastformaten - RFC 3555". Ietf. Juli 2003. Abgerufen 7. Dezember 2009.
  4. ^ a b "Ein mehr verlusttoleranter RTP-Nutzlastformat für MP3-Audio-RFC 5219". Ietf. Februar 2008. Abgerufen 4. Dezember 2014.
  5. ^ "Das MP3 -Team". Fraunhofer iis. Abgerufen 12. Juni 2020.
  6. ^ Patel K, Smith BC, Rowe LA (1. September 1993). "Leistung eines Software -MPEG -Video -Decoders". Verfahren der ersten ACM International Conference on Multimedia. ACM Multimedia. New York City: Vereinigung für Computermaschinen: 75–82. doi:10.1145/166266.166274. ISBN 978-0-89791-596-0. Referenz 3 im Papier ist der Ausschussentwurf des Standards von Standard ISO/IEC 11172, 6. Dezember 1991.
  7. ^ a b c d "ISO/IEC 11172-3: 1993-Informationstechnologie-Codierung von bewegten Bildern und zugehörigen Audio für digitale Speichermedien mit bis zu etwa 1,5 Mbit/s-Teil 3: Audio". ISO. 1993. Abgerufen 14. Juli 2010.
  8. ^ a b c d "ISO/IEC 13818-3: 1995-Informationstechnologie-Generisches Codieren von bewegten Bildern und zugehörigen Audioinformationen-Teil 3: Audio". ISO. 1995. Abgerufen 14. Juli 2010.
  9. ^ "MP3 -Technologie bei Fraunhofer IIS". Fraunhofer iis. Archiviert von das Original am 15. August 2021. Abgerufen 12. Juni 2020.
  10. ^ MP3 (MPEG Layer III Audio -Codierung) (Voller Entwurf). Nachhaltigkeit digitaler Formate. Washington, D.C.: Kongressbibliothek. 3. Mai 2017. Abgerufen 1. Dezember 2021.
  11. ^ Jayant, Nikil; Johnston, James; Safranek, Robert (Oktober 1993). "Signalkomprimierung basierend auf Modellen der menschlichen Wahrnehmung". Proceedings of the IEEE. 81 (10): 1385–1422. doi:10.1109/5.241504.
  12. ^ "MP3 (MPEG Layer III Audio -Codierung)". Die Bibliothek des Kongresses. 27. Juli 2017. Abgerufen 9. November 2017.
  13. ^ a b ISO (November 1991). "MPEG Pressemitteilung, Kurihama, November 1991". ISO. Archiviert von das Original am 3. Mai 2011. Abgerufen 17. Juli 2010.
  14. ^ a b c d e ISO (November 1991). "CD 11172-3-Codierung von bewegten Bildern und zugehörigen Audio für digitale Speichermedien mit bis zu 1,5 Mbit/S Teil 3 Audio" (PDF). Archiviert von das Original (PDF) am 30. Dezember 2013. Abgerufen 17. Juli 2010.
  15. ^ a b ISO (6. November 1992). "MPEG Pressemitteilung, London, 6. November 1992". Chiariglione. Archiviert von das Original am 12. August 2010. Abgerufen 17. Juli 2010.
  16. ^ a b c ISO (Oktober 1998). "MPEG Audio FAQ Version 9-MPEG-1 und MPEG-2 BC". ISO. Abgerufen 28. Oktober 2009.
  17. ^ Mayer, Alfred Marshall (1894). "Forschungen in Akustik". London, Edinburgh und Dublin Philosophical Magazine. 37 (226): 259–288. doi:10.1080/14786449408620544.
  18. ^ Ehmer, Richard H. (1959). "Maskierung durch Töne gegen Rauschbänder". Das Journal der Acoustical Society of America. 31 (9): 1253. Bibcode:1959asaj ... 31.1253e. doi:10.1121/1.1907853.
  19. ^ Zwicker, Eberhard (1974). "Auf einem psychoakustischen Äquivalent von Tuning -Kurven". Fakten und Modelle im Hören. Fakten und Modelle im Gehör (Verfahren des Symposiums über psychophysikalische Modelle und physiologische Tatsachen im Gehör; in Tuzing, Oberbayern, 22. bis 26. April 1974). Kommunikation und Kybernetik. Vol. 8. pp.132–141. doi:10.1007/978-3-642-65902-7_19. ISBN 978-3-642-65904-1.
  20. ^ Zwicker, Eberhard; Feldtkeller, Richard (1999) [1967]. Das Ohr als nachrichtenempfänger [Das Ohr als Kommunikationsempfänger]. Trans. Von Hannes Müsch, Søren Buus und Mary Florentine. Archiviert von das Original am 14. September 2000. Abgerufen 29. Juni 2008.
  21. ^ Fletcher, Harvey (1995). Sprache und Hörhör in Kommunikation. Akustische Gesellschaft von Amerika. ISBN 978-1-56396-393-3.
  22. ^ a b c Schroeder, Manfred R. (2014). "Bell Laboratories". Akustik, Informationen und Kommunikation: Gedenkvolumen zu Ehren von Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
  23. ^ Gray, Robert M. (2010). "Eine Geschichte der digitalen Real -Real -Sprache in Paketnetzwerken: Teil II der linearen Vorhersagecodierung und des Internet -Protokolls" (PDF). Gefunden. Trendssignalprozess. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
  24. ^ Atal, b.; Schroeder, M. (1978). "Vorhersagecodierung von Sprachsignalen und subjektiven Fehlerkriterien". ICASSP '78. IEEE Internationale Konferenz über Akustik, Sprache und Signalverarbeitung. 3: 573–576. doi:10.1109/ICASSP.1978.1170564.
  25. ^ Schroeder, M.R.; Atal, B.S.; Hall, J. L. (Dezember 1979). "Optimierung digitaler Sprachcodierer durch Nutzung von Maskierungseigenschaften des menschlichen Ohrs". Das Journal der Acoustical Society of America. 66 (6): 1647. Bibcode:1979asaj ... 66.1647s. doi:10.1121/1.383662.
  26. ^ Krasner, M. A. (18. Juni 1979). Digitale Codierung von Sprach- und Audiosignalen basierend auf den Wahrnehmungsanforderungen des Hörsystems (These). Massachusetts Institute of Technology. HDL:1721.1/16011.
  27. ^ Krasner, M. A. (18. Juni 1979). "Digitale Codierung der Sprache basierend auf der Wahrnehmungsanforderung des Hörsystems (Technischer Bericht 535)" (PDF). Archiviert (PDF) Aus dem Original am 3. September 2017.
  28. ^ Ahmed, Nasir (Januar 1991). "Wie ich mich mit der diskreten Cosinus -Transformation ausgedacht habe". Digitale Signalverarbeitung. 1 (1): 4–5. doi:10.1016/1051-2004 (91) 90086-Z.
  29. ^ Ahmed, Nasir; Natarajan, T.; Rao, K. R. (Januar 1974), "Discrete Cosinus Transform", IEEE -Transaktionen auf Computern, C-23 (1): 90–93, doi:10.1109/t-c.1974.223784
  30. ^ Rao, K. R.; Yip, P. (1990), Diskrete Cosinus -Transformation: Algorithmen, Vorteile, Anwendungen, Boston: Akademische Presse, ISBN 978-0-12-580203-1
  31. ^ J. P. Princen, A. W. Johnson und A. B. Bradley: Subband-/Transformationskodierung mithilfe der Filterbank -Designs basierend auf der Aliasing -Stornierung von Zeitdomänen, IEEE Proc. Intl. Konferenz über Akustik, Sprache und Signalverarbeitung (ICASSP), 2161–2164, 1987
  32. ^ John P. Princen, Alan B. Bradley: Analyse-/Synthese -Filterbankdesign basierend auf dem Zeitungsdomänen -Aliasing -Stornieren, IEEE Trans. Akust. Sprachsignalverarbeitung, ASSP-34 (5), 1153–1161, 1986
  33. ^ a b Guckert, John (Frühjahr 2012). "Die Verwendung von FFT und MDCT in MP3 -Audiokomprimierung" (PDF). Universität von Utah. Abgerufen 14. Juli 2019.
  34. ^ Terhardt, E.; Stoll, G.; Sewann, M. (März 1982). "Algorithmus für die Extraktion von Tonhöhen und Tonhöhen Salience aus komplexen Tonsignalen". Das Journal der Acoustical Society of America. 71 (3): 679. Bibcode:1982asaj ... 71..679t. doi:10.1121/1.387544.
  35. ^ a b "Sprachcodierung für Kommunikation". IEEE Journal über ausgewählte Bereiche in Kommunikation. 6 (2). Februar 1988.
  36. ^ a b c Genesis des MP3 -Audio -Codierungsstandards in IEEE -Transaktionen zu Consumer Electronics, IEEE, Vol. 52, nr. 3, S. 1043–1049, August 2006
  37. ^ Brandenburg, Karlheinz; Seitzer, Dieter (3. bis 6. November 1988). OCF: Codierung hochwertiger Audio mit Datenraten von 64 kbit/s. 85. Konvention der Audio Engineering Society.
  38. ^ Johnston, James D. (Februar 1988). "Transformation der Codierung von Audiosignalen unter Verwendung von Wahrnehmungsrauschenkriterien". IEEE Journal über ausgewählte Bereiche in Kommunikation. 6 (2): 314–323. doi:10.1109/49.608.
  39. ^ Y.F. Dehery et al. (1991) Ein MusicAM-Quelle Codec für digitale Audio-Rundfunk- und Speicherverfahren IEEE-ICASSP 91 Seiten 3605–3608 Mai 1991
  40. ^ "Ein DAB -Kommentar von Alan Box, EZ Kommunikation und Vorsitzender NAB DAB Task Force" (PDF).
  41. ^ EBU SQAM CD -Klangqualitätsbewertungsmaterialaufzeichnungen für subjektive Tests. 7. Oktober 2008.
  42. ^ a b Ewing, Jack (5. März 2007). "Wie MP3 geboren wurde". Bloomberg BusinessWeek. Abgerufen 24. Juli 2007.
  43. ^ Witt, Stephen (2016). Wie Musik frei wurde: Das Ende einer Branche, die Jahrhundertwende und der Patient Null der Piraterie. Vereinigte Staaten von Amerika: Penguin -Bücher. p. 13. ISBN 978-0143109341. Brandenburg und Grill wurden von vier anderen Fraunhofer -Forschern begleitet. Heinz Gerhauser überwachte die Audioforschungsgruppe des Instituts. Harald Popp war ein Hardware -Spezialist; Ernst Eberlein war ein Signalverarbeitungsexperte; Jürgen Herre war eine weitere Doktorandin, deren mathematische Fähigkeiten konkurrierten Brandenburgs eigene. In späteren Jahren würde sich diese Gruppe als "die ursprünglichen sechs" bezeichnen.
  44. ^ Jonathan Sterne (17. Juli 2012). MP3: Die Bedeutung eines Formats. Duke University Press. p. 178. ISBN 978-0-8223-5287-7.
  45. ^ "Suzanne Vega | Bio". Die offizielle Gemeinschaft von Suzanne Vega. Abgerufen 17. Januar 2022.
  46. ^ Digitales Video- und Audio -Rundfunk -Technologie: Ein praktischer Technikhandbuch (Signale und Kommunikationstechnologie) ISBN3-540-76357-0 p. 144: "Im Jahr 1988 wurde die Mascam -Methode im Institut für RundfunkTechnik (IRT) in München zur Vorbereitung auf das digitale Audio -Rundfunksystem (DAB) aus Mascam, The Musicam (Masking Muster Universal Subband Integrated Coding and Multiplexing) entwickelt. Die Methode wurde 1989 in Zusammenarbeit mit CCETT, Philips und Matsushita entwickelt. "
  47. ^ "Statusbericht von ISO MPEG" (Pressemitteilung). Internationale Standardisierungsorganisation. September 1990. archiviert von das Original am 14. Februar 2010.
  48. ^ "ASPEC-adaptive spektrale Entropie-Codierung hochwertiger Musiksignale". AES E-Bibliothek. 1991. Abgerufen 24. August 2010.
  49. ^ a b "Adoptiert am 22. WG11 -Treffen" (Pressemitteilung). Internationale Standardisierungsorganisation. 2. April 1993. archiviert von das Original am 6. August 2010. Abgerufen 18. Juli 2010.
  50. ^ Brandenburg, Karlheinz; Bosi, Marina (Februar 1997). "Überblick über MPEG Audio: Aktuelle und zukünftige Standards für die Audiocodierung mit niedrigem Bit-Rate". Zeitschrift der Audio Engineering Society. 45 (1/2): 4–21. Abgerufen 30. Juni 2008.
  51. ^ a b c d "MP3-technische Details (MPEG-2 und MPEG-2.5)". Fraunhofer iis. September 2007. archiviert von das Original am 24. Januar 2008. "MPEG-2.5" ist der Name einer proprietären Erweiterung, die von Fraunhofer IIS entwickelt wurde. Es ermöglicht MP3, bei sehr niedrigen Bitraten zufriedenstellend zu arbeiten, und führt die zusätzlichen Abtastfrequenzen von 8 kHz, 11,025 kHz und 12 kHz ein.
  52. ^ a b c d e f g h Supurovic, Predrag (22. Dezember 1999). "MPEG Audio Frame Header". Abgerufen 29. Mai 2009.
  53. ^ a b c "ISO/IEC 13818-3: 1994 (E)-Informationstechnologie-Generisches Codieren von bewegten Bildern und zugehörigen Audio: Audio" (POSTLEITZAHL). 11. November 1994. Abgerufen 4. August 2010.
  54. ^ MPEG (25. März 1994). "Genehmigt am 26. Treffen (Paris)". Archiviert von das Original am 26. Juli 2010. Abgerufen 5. August 2010.
  55. ^ MPEG (11. November 1994). "Auf dem 29. Treffen genehmigt". Archiviert von das Original am 8. August 2010. Abgerufen 5. August 2010.
  56. ^ ISO. "ISO/IEC TR 11172-5: 1998-Informationstechnologie-Codierung von bewegten Bildern und zugehörigen Audio für digitale Speichermedien mit bis zu etwa 1,5 Mbit/S-Teil 5: Software-Simulation". Abgerufen 5. August 2010.
  57. ^ "ISO/IEC TR 11172-5: 1998-Informationstechnologie-Codierung von bewegten Bildern und zugehörigen Audio für digitale Speichermedien mit bis zu etwa 1,5 Mbit/S-Teil 5: Software-Simulation (Referenzsoftware)" (POSTLEITZAHL). Abgerufen 5. August 2010.
  58. ^ Dehery, Yves-Francois (1994). Ein hochwertiger Soundcodierungsstandard für Rundfunk-, Telekommunikations- und Multimedia-Systeme. Niederlande: Elsevier Science bv. S. 53–64. ISBN 978-0-444-81580-4. Dieser Artikel bezieht
  59. ^ "MP3 Die heutige Technologie". Viele informative Informationen über Musik. 2005. archiviert von das Original am 4. Juli 2008. Abgerufen 15. September 2016.
  60. ^ Die himmlische Jukebox an Der Atlantik "Um den Industrien zu zeigen, wie man den Codec verwendet, stapfte MPEG ein kostenloses Beispielprogramm, das Musik in MP3-Dateien umgewandelt hat. Die Demonstrationssoftware hat einen Sound von schlechter Qualität erstellt, und Fraunhofer beabsichtigte nicht, dass sie verwendet werden soll. Der" Quellcode "der Software"-- Die zugrunde liegenden Anweisungen - wurden auf einem leicht zugänglichen Computer der Universität von Erlangen gespeichert, von dem es von einem Soloh, einem Hacker in den Niederlanden, heruntergeladen wurde (und, wie man einen Star Wars -Fan) Software, die Compact-Disc in Musikdateien von akzeptabler Qualität umgewandelt hat. " (2000)
  61. ^ Pop -Idole und Piraten: Konsummechanismen und globaler Zirkulation ... Von Dr. Charles Fairchild
  62. ^ Technologien der Piraterie? - Erforschung des Zusammenspiels zwischen Kommerzialismus und Idealismus bei der Entwicklung von MP3 und Divx von Hendrik Storstein Spilker, Svein Höier, Seite 2072
  63. ^ www.euronet.nl/~soloh/mpegenc/ (Archive.org)
  64. ^ "Über das Internet -Underground -Musikarchiv".
  65. ^ a b Schubert, Ruth (10. Februar 1999). "Tech-versierte Musik für einen Song; Branche frustriert, dass das Internet kostenlose Musik einfach macht". Seattle Post-Intelligencer. Abgerufen 22. November 2008.
  66. ^ Giesler, Markus (2008). "Konflikt und Kompromiss: Drama in Marketplace Evolution". Journal of Consumer Research. 34 (6): 739–753. Citeseerx 10.1.1.564.7146. doi:10.1086/522098. S2CID 145796529.
  67. ^ a b c d Bouvigne, Gabriel (2003). "MP3 -Tech - Einschränkungen". Archiviert von das Original am 7. Januar 2011.
  68. ^ "ISO/IEC 11172-3: 1993/Cor 1: 1996". Internationale Standardisierungsorganisation. 2006. Abgerufen 27. August 2009.
  69. ^ Liberman, Serbio. DSP - Die Technologie hinter Multimedia.
  70. ^ Amorim, Roberto (3. August 2003). "Ergebnisse von 128 kbit/s -Erweiterungs -öffentlicher Hörtest". Abgerufen 17. März 2007.
  71. ^ Mares, Sebastian (Dezember 2005). "Ergebnisse des öffentlichen Multiformat -Hörtests bei 128 Kbit / s". Abgerufen 17. März 2007.
  72. ^ Dougherty, Dale (1. März 2009). "Der brutzelnde Klang der Musik". O'Reilly Radar.
  73. ^ "Treffen Sie den musikalischen Hellseher, der Geister in Ihren MP3s findet.". Noisey. 18. März 2015.
  74. ^ "Die Geister in der MP3". 15. März 2015.
  75. ^ "Lost and Found: U.Va. Doktorstudent entdeckt Geister in der MP3". UVA heute. 23. Februar 2015.
  76. ^ Der Geist im MP3
  77. ^ "Anleitung zu Befehlszeilenoptionen (in CVS)". Abgerufen 4. August 2010.
  78. ^ "JVC RC-EX30-Betriebshandbuch" (PDF) (in mehreren Sprachen). 2004. p. 14. archiviert von das Original (PDF) am 20. August 2020. Suche - Lokalisierung einer gewünschten Position auf Thedisc (nur Audio -CD) (2004 Boombox)
  79. ^ "DV-RW250H Operation-Manual GB" (PDF). 2004. p. 33. • Schnelle Stürmer und Überprüfung der Wiedergabe funktioniert nicht mit einem MP3/WMA/JPEG-CD.
  80. ^ "Soundqualitätsvergleich von Hi-Rees-Audio vs. CD vs. MP3". www.sonony.com. Sony. Abgerufen 11. August 2020.
  81. ^ Woon-Seng Gan; Sen-Maw Kuo (2007). Eingebettete Signalverarbeitung mit der Mikrosignalarchitektur. Wiley-ieee Press. p. 382. ISBN 978-0-471-73841-1.
  82. ^ Bouvigne, Gabriel (28. November 2006). "Freeformat bei 640 kbit/s und foobar2000, Möglichkeiten?". Abgerufen 15. September 2016.
  83. ^ "Lame (1): MP3 -Audio -Dateien erstellen - Linux Man Page". Linux.die.net. Abgerufen 22. August 2020.
  84. ^ "Linux Manpages Online - Man.cx Manual Pages". Man.cx. Abgerufen 22. August 2020.
  85. ^ a b "Gpsycho - variable Bitrate". Lame MP3 -Encoder. Abgerufen 11. Juli 2009.
  86. ^ "Twolame: MPEG Audio Layer II VBR". Abgerufen 11. Juli 2009.
  87. ^ ISO MPEG Audio -Untergruppe. "MPEG Audio FAQ Version 9: MPEG-1 und MPEG-2 BC". Abgerufen 11. Juli 2009.
  88. ^ "Lahm Y Switch". Hydrogenaudio Knowledge. Abgerufen 23. März 2015.
  89. ^ Rae, Casey. "Metadaten und du". Zukunft der Musikkoalition. Abgerufen 12. Dezember 2014.
  90. ^ Patel, Ketan; Smith, Brian C.; Rowe, Lawrence A. Leistung eines Software -MPEG -Videodecoders (PDF). ACM Multimedia 1993 Konferenz.
  91. ^ "Der MPEG-FAQ, Version 3.1". 14. Mai 1994. archiviert von das Original am 23. Juli 2009.
  92. ^ a b "Eine große Liste von MP3 -Patenten (und vermeintlichen Ablaufdaten)". Melodie. 26. Februar 2007.
  93. ^ Cogliati, Josh (20. Juli 2008). "Patentstatus von MPEG-1, H.261 und MPEG-2". Kuro5Hin. Diese Arbeit konnte keine Patentabteilungen und -bestandteile berücksichtigen.
  94. ^ US -Patent Nr. 5812672
  95. ^ "US-Patentablauf für MP3, MPEG-2, H.264". Osnews.com.
  96. ^ "Patent US6009399 - Methode und Apparat für die Codierung digitaler Signale ... - Google Patents".
  97. ^ "mp3licensing.com - Patente". mp3licensing.com.
  98. ^ "Vollständige MP3 -Unterstützung, die bald nach Fedora kommt". 5. Mai 2017.
  99. ^ "Akustische Datenkomprimierung - MP3 -Basispatent". Grundlage für eine kostenlose Informationsinfrastruktur. 15. Januar 2005. archiviert von das Original am 15. Juli 2007. Abgerufen 24. Juli 2007.
  100. ^ "Geistiges Eigentum & Lizenzierung". Technicolor. Archiviert von das Original am 4. Mai 2011.
  101. ^ Kistenfeger, Muzinée (Juli 2007). "Die Fraunhofer Society (Fraunhofer-Gegschaft, FHG)". Britisch-Generalkonsulat München. Archiviert von das Original am 18. August 2002. Abgerufen 24. Juli 2007.
  102. ^ "Frühe MP3 -Patent -Durchsetzung". Clearinghouse Chilling Effects. 1. September 1998. Abgerufen 24. Juli 2007.
  103. ^ "Sstels MPEG -Audio -Lizenzprogramm".
  104. ^ "Audio MPEG und SISEL: Thomson verklagte wegen Patentverletzung in Europa und den USA - MP3 -Player, die vom Zoll angehalten wurden.". Zdnet India. 6. Oktober 2005. archiviert von das Original am 11. Oktober 2007. Abgerufen 24. Juli 2007.
  105. ^ "Zuschüsse Motorola und MPEG und MPEG 2 Audio Patentlizenz". Schwester. 21. Dezember 2005. archiviert von das Original am 21. Januar 2014. Abgerufen 18. Januar 2014.
  106. ^ "US -MPEG -Audio -Patente" (PDF). Schwester.
  107. ^ Ogg, Erica (7. September 2006). "Sandisk MP3 -Anfallsauftrag umgestoßen". CNET News. Archiviert von das Original am 4. November 2012. Abgerufen 24. Juli 2007.
  108. ^ "Sisevel bringt Patent Wild West nach Deutschland". IPEG -Blog. 7. September 2006. Abgerufen 24. Juli 2007.
  109. ^ "Apfel, Sandisk Settle Texas MP3 Patent Spucke". IP Law360. 26. Januar 2009. Abgerufen 16. August 2010.
  110. ^ "Baker Botts LLP Professionals: Lisa Catherine Kelly - Repräsentative Engagements". Baker Botts LLP. Archiviert von das Original am 10. Dezember 2014. Abgerufen 15. September 2016.
  111. ^ "Microsoft sieht 1,5 Mrd. USD MP3 -Auszahlung aus". BBC News. 22. Februar 2007. Abgerufen 30. Juni 2008.
  112. ^ "Microsoft gewinnt die Umkehrung der MP3 -Patententscheidung". CNET. 6. August 2007. Abgerufen 17. August 2010.
  113. ^ "Berufungsgericht für die Entscheidung des Bundeskreislaufs" (PDF). 25. September 2008. archiviert von das Original (PDF) am 29. Oktober 2008.
  114. ^ a b Brandenburg, Karlheinz (1999). "MP3 und AAC erklärten". Archiviert von das Original (PDF) am 19. Oktober 2014.
  115. ^ "Via Lizenzierung kündigt aktualisierte AAC Joint Patent Lizenz an". Geschäftsdraht. 5. Januar 2009. Abgerufen 18. Juni 2019.
  116. ^ "AAC -Lizenzgeber". Via corp. Abgerufen 6. Juli 2019.
  117. ^ Marriott, Michel (30. September 1999). "News Watch; neuer Spieler von Sony nickt MP3 zu nicken". Die New York Times.
  118. ^ "Sony NW-E105 Network Walkman".

Weitere Lektüre

Externe Links