Video-Codierung mit MPEG-2

Breites Spektrum

Auch wenn der Spielfilm auf Abruf doch noch etwas länger auf sich warten läßt, hat sich mit MPEG-2 bereits ein Standard für die Übertragung von bewegten Bildern herauskristalisiert. Im Gegensatz zu MPEG-1 ist er genau auf die speziellen Anforderungen in diesem Bereich zugeschnitten(js).

Mit der fortschreitenden Verschmelzung von analogen Massenmedien mit den digitalen Computertechnologien ist ein weiterer Standard zur Kodierung und Komprimierung von Videobildern entstanden: MPEG-2.


Unterschiedliche Kodierungsstandards werden durch unterschiedliche Anwendungprofile bestimmt, die wiederum andere Techniken zur Komprimierung der umfangreichen digitalen Bilddaten erfordern (ein Studiofernsehsignal benötigt eine Datenrate von 166Mbit/s). MPEG-2 ist deshalb keine Weiterentwicklung des bereits bestehenden Standards MPEG-1 im technischen Sinne. Eine Entwicklung des Standards MPEG-2 heißt nicht, daß MPEG-1 nun veraltet wäre. MPEG-2 ist nur eine komplexere, umfassendere Kodierung, geschaffen für ein vollständig anderes Umfeld. MPEG- 1 wurde auf die Kodierung von Video auf CD-ROMs zugeschnitten und wird heute genutzt, um Video- und Audiodatenströme für Anwendungen wie Video-CDs (CD-V), CD-Interactive (CD-I) und Spielekonsolen wie den Amiga CD-32 zu kodieren. Der Audioteil der MPEG-1-Kodierung wird heute bei der Digital-Compact-Cassette, der Sony Mini-Disc und für Audio-On-Demand z.B. im Internet eingesetzt; die zumeist geringe Datenrate von MPEG-1-Videos ermöglicht nicht die Kodierung und Übertragung von digitalem Video in Studioqualität. MPEG-2 wurde deshalb für den Einsatz im Fernsehfunk optimiert (broadcasting). MPEG-2 ermöglicht die Übertragung von bis zu 30 digitalen Fernsehprogrammen auf nur einem Satellitenkanal und wird die Erweiterung von MPEG-1 werden, die Rücksicht auf die hardwaretechnischen Neuerungen und Erfordernisse nimmt. Einsatzgebiete der MPEG-2 Kodierung sind dabei Video-On-Demand im Konsumerbereich (Home Cinema), hochqualitative und verlustfreie Übertragung von Video im Studiobereich und die Verringerung der Kosten bei Satellitenübertragungen.

Die verwendeten Mechanismen von MPEG-2 sind daher sehr ähnlich zu MPEG-1. Es werden auch Einzelbilder mit temporären Abhängigkeiten (IPB-frames) und zeitliche Verschiebungen von Bildinhalten kodiert (motion vectors). Wie bei MPEG-1 werden mathematische Verfahren zur Datenreduktion genutzt (Dikrete-Kosinus-Transform-Kodierung, Huffman- und Lauflängenkodierung).

Es wurde Funktion der Skalierbarkeit hinzugefügt, die ein der Hardware angepaßtes Konsumieren von Videos ermöglichen wird. Ist also die Dekodierungshardware schnell genug, kann die Qualität des Bildes erhöht werden. Durch ein spezielle, räumliche Skalierbarkeit wird bei einem für HDTV (High-Definition Television, zukünftiges hochauflösendes Fernsehen) kodiertem Bild im Format 16:9 die Abwärtskompatibilität zum herkömmlichen 4:3 Fernsehbild garantiert. Durch ein Erhöhung der Datenrate und der wahlweisen Kodierung aller Farbwerte ist eine fast verlustfreie Übertragung zwischen z.B. Studios möglich.

MPEG-2 verfolgt genau wie MPEG-1 das grundlegende Prinzip des ungleichen Enkodier- und Dekodierverhältnisses (Studio-/Home-Hardware), um die Kodierung zu optimieren. Die Kodierung erfordert ungleich mehr Rechenleistung bzw. Hardwareeinsatz als die Rekonstruktion des Videos beim Endnutzer. Diese Eigenschaft paßt jedoch zu dem angestrebten Benutzerprofil. Das MPEG-2 Format wurde nicht für Anwendungen, wie z.B. Videokonferenzen entwickelt, die ein synchrones Kodierungsverhältnis und eine geringe Kodierungsverzögerung erfordern (durch die Anzahl der verschiedenen Frametypen und die temporären Abhängigkeiten zwischen den Einzelbildern entsteht bei den MPEG-Kodierungen immer eine zeitliche Verzögerung zwischem analogen Videosignal und digitalem Videodatenstrom von einer halben bis zu 3 Sekunden). Für Zwecke der Videokonferenz wurde z.B. die Kodierung H.261 standardisiert. Folgende grundlegende Anforderungen werden durch das MPEG-2 Format erfüllt:

Im November 1994 wurde der internationale Standard MPEG-2 (ISO 13818) mit dem übersetzten Titel "Generische Kodierung von Bewegtbildern und synchronisiertem Audio" vorgelegt. Der Standard besteht aus drei Hauptteilen, dem Video-, dem Audio- und dem Systemteil. Im Standard selber wird zwar ein weiterer, vierter Conformance-Teil (der die Charakteristiken von MPEG-2- Bitstreams und Testergebnisse enthalten wird) erwähnt, er wurde jedoch bis jetzt noch nicht öffentlich gemacht. Drei grundlegende neue Kodierungsmethoden wurden in MPEG-2 beschrieben: Profiles und Levels, Scalability sowie Security.

Profiles und Levels schränken die zur Verfügung stehenden Parameter der Kodierung ein, um diese Einschränkungen dann in den Kompressionsalgorithmen ausnutzen zu können. Gleichzeitig standardisieren die Profiles und Levels auch die Kodierungsparameter. Die Kombination von Profiles (complexity of compression) und Levels (sample rate, frame dimension, coded bitrates) läßt dabei aber immer genügend Spielraum für die unterschiedlichsten Anwendungen (siehe Tabelle 1-3). MPEG-2 soll laut Anwendungsprofil auf alle Eventualitäten in der digitalen Video-, Übertragungs- und Fernsehtechnik vorbereitet sein. Ein wichtiges feature ist daher die Rückwärtskompatibilität zu existierenden digitalen Kodierungen wie MPEG-1 oder H.261. Diese Rückwärtskompatibilität bedeutet keine Bitübereinstimmung der resultierenden Datenströme, sondern sorgt über die Benutzung und Variierung der Profiles und Levels nur dafür, daß Hard- und Software, die z.B. zum Einsatz von MPEG-1 bestimmt war, auch mit MPEG-2 (mit reduzierten Möglichkeiten dann natürlich, denn MPEG-2 ist von der benötigten Rechenleistung zur Dekodierung viel aufwendiger) zu betreiben ist. Allerdings sind auch sogenannte Sub-Kodierer innerhalb eines MPEG-2-Kodierers realisiert, die exakt rückwärtskompatible Datenströme erzeugen. Z.B. ergibt die Kombination von Video Main Profile (wie MPEG-1) und Video Main Level (CCIR 601, Studio TV) eine MPEG-1-ähnliche Kodierung, die abgekürzt als MP@ML bezeichnet wird.


Die Scalability liefert die Möglichkeit von unterschiedlicher Endnutzung bei ein- und derselben feststehenden Kodierung. So kann der Endnutzer entscheiden, welche Teile einer Übertragung er konsumieren möchte. Leonardo Chiariglione, Chairman der MPEG-2-Gruppe sagt dazu: "Scalability ist die Möglichkeit des Dekoders, Teile eines Datenstroms zu ignorieren und doch sinnvolle und angepaßte Video- und Audioausgaben zu erzeugen". Dadurch wird MPEG-2 weitgehend speicher- und übertragunsmedienunabhängig. Z.B. wird eine zeitliche Scalability ermöglicht (siehe Bild 1), d.h. wenn die Ressourcen des konsumierenden Systems ausreichen, kann die Bildrate erhöht werden, indem in den normalen Ablauf des "Base Layers" zusätzliche B-frames des "Enhancement Layers" dekodiert werden. Die Qualität der Videoübertragung läßt sich verbessern, wenn anstelle der ungenaueren B-frames des "Base Layers" P-frames des "Enhancement Layers" dekodiert und angezeigt werden (siehe Bild 2). Dies erfordert natürlich mehr Rechenzeit. Zusätzlich sind noch die Kodierung von 3-dimensionalen Bildern (stereoscopic view) und die sichere oder geheime Übertragung von Teilströmen mit der Scalability-Funktion möglich. Schließlich gibt es noch die Pan-Scan-Scalability (siehe Bild 3). Diese ermöglicht die Definition von Ausschnitten im aktuellen Bild. Diese Ausschnitte können zwar von Bild zu Bild unterschiedlich eingeteilt werden, die Hauptanwendung ist jedoch die Definition eines 4:3 Fernsehbildes innerhalb eines 16:9 HDTV-Bildes.


Bild 1: Zeitliche Scalability.


Bild 2: Qualitative Scalability.


Bild 3: Pan-Scan Scalability.

MPEG-2 ist weiterhin der erste der Standards und Formatspezifikationen im Bereich Multimedia und Video, in dem auch der Bereich der Sicherheit (Vertraulichkeit und Integrität) mit konzipiert wurde. MPEG-1 hatte schon im Audio-Strom einen rudimentären Cyclic-Redundance-Check (CRC) eingeführt. MPEG-2 ist robust gegenüber Bitfehlern und Zellenverlusten. Ein speziell für MPEG-2 optimierter, schneller Chiffrier-Algorithmus ist beschrieben, der eine Verschlüsselung und Überprüfung des kompletten Datenstroms ermöglicht. Die Verschlüsselung kann insbesondere für die sichere Satellitenübertragungen (z.B. von einem Produktionsstudio zum anderen) und für Pay- TV genutzt werden, durch die Verwendung von Integritätschecksummen ist jederzeit gewährleistet, daß Fehler in der Übertragung erkannt werden, die ansonsten den Abspielvorgang unterbrechen oder blockieren könnten. Mutwillige Modifikationen des Datenstroms werden damit auch erkannt.

In MPEG-2 sind weitere neue Verfahren und Möglichkeiten integriert worden, auf die jedoch hier nicht ausführlich eingegangen werden kann. Z.B. können einzelne Macroblöcke mehrfach, in verschiedenen Qualitätsstufen kodiert (Makroblock-Scalability) werden. Das Erkennen von relativen Bewegungen einzelner Blöcke im Vergleich von Bild zu Bild wird im MPEG-2 Format viel einfacher realisiert (Block-based Motion Compression Prediction (MCP)). Das Auffinden von ganzen, gleichen Frames innerhalb des Datenstroms (Frame Motion Prediction) und das Auffinden von gleichen, wie auch immer geformten Teilen in verschiedenen Bildern und auch innerhalb des aktuellen Bildes (Field Motion Prediction) wird ermöglicht. Die Verwandschaft zum Bildkompressionsformat JPEG zeigt sich nun deutlich in der für Videoformate neuen Nutzung von variablen Makroblockgrößen und auf das aktuelle Video zugeschnittenen Lauflängen- und Variablenkodierungs- und Quantisierungstabellen. Die Bereitstellung eines variablen Farbraums ist insbesondere für den Studiobereich notwendig, ein Farbverlust ist während der Produktionsphase von Filmen nicht akzeptabel (der Farbraum wurde bei MPEG-1 immer im Verhältnis 4:1:1 beschnitten, d.h. die Luminanzinformationen wurde komplett erhalten, während die Farbinformationen schon vor der eigentlichen Komprimierung um den Faktor 4 reduziert wurden).

Der Audioteil von MPEG-2 ist genau wie bei MPEG-1 auf die Kodierung von Audiosignalen hoher Qualität (CD, Studio) zugeschnitten, weist aber eine viel höhere Flexibilität auf. Zusätzlich zu den festgelegten, bereits bei MPEG-1 benutzten, Sampling-Frequenzen von 33, 44 oder 48 kHz sind auch solche von 8, 11, 16, 22 oder 24 kHz möglich, dies insbesondere zur Kodierung von Signalen aus digitalen Quellen wie ISDN, G.722 oder Signale aus dem Studiobereich. Ein variables Bit-pro-Sample-Verhältnis wird erlaubt. Um die Rückwärtskompatibilität zu MPEG-1 und insbesondere die Unterstützung von HDTV und Dolby-Surround zu ermöglichen, kann man in MPEG-2 bis zu 5 Kanäle kodieren (plus einen Kanal mit tiefstfrequenten Anteilen bis zu 100 Hz für Spezialeffekte). Von diesen Kanälen können drei (links, mitte, rechts) für HDTV genutzt werden, die anderen beiden als Raumkanäle (z.B. Dolby-Surround). Speziell über die drei Kanäle lassen sich vielfältige Kombinationen zur multilingualen Übertragung wählen. Durch die Vielfältigkeit der Kodierung und Kanäle werden auch neue Möglichkeiten zur Kompression der Audiosignale erschlossen (zusätzlich zu den von MPEG-1 bekannten Mechanismen). Es läßt sich z.B. durch eine variierende und wiederholt wechselnde Intensität zweier Kanäle ein dritter Kanal "mitkodieren" (Intensity Stereo Coding), ein Mittelkanal läßt sich auch auf den linken und den rechten Kanal verteilen (Phantom Coding of Center) oder die adaptive Vorhersage des Signalverlaufs (nützlich für die Anpassung der Komprimierungsparameter) kann separat für verschiedene Kanäle verlaufen, wenn man weiß, daß einzelne Kanäle für z.B. eine eigene Sprache reserviert wurden (Adaptive Multi-Channel Prediction). Die Audiokodierung wurde um die Funktionalität der Signalvorhersage (Motion Estimation) und die Erkennung von bereits kodierten Signalen (Motion Compensation) erweitert, die sonst nur aus der Videokodierung bekannt waren. Ausserdem läßt sich nun die Integrität aller Audiodaten und Audiokodierungsparameter durch zugefügte Prüfsummen schützen.


MPEG-2 ist auf die Verwendung von Hardware zugeschnitten. Die komplexe Kodierung erfordert selbst bei der Dekodierung Hardware-Einsatz. Software wird zumeist nur zur Verifizierung der verwendeten Algorithmen eingesetzt, eine Echtzeit-Dekodierung eines Fernsehbildes in Software ist illusorisch. Die Nutzung von MPEG-2 wird aber von der Fernsehindustrie mit Druck vorangetrieben. Viele Sendung werden bereits in HDTV produziert und auch über Satelllit in MPEG-2 kodiert ausgestrahlt, in Berlin kann man die ersten Testprogramme über Kabel emfangen. Im Bereich der HighDensity-CD-ROM haben sich zwei Firmenkonsortien auf ein einheitliches Format geeinigt, so daß auch MPEG-2-konforme Datenströme auf der CD-ROM gespeichert werden können (die Speicherformate der CD-ROMs definieren spezielle Anforderungen an Blockgrößen, die wiederum vom verwendeten Video-Datenstromformat unterstützt werden müssen). Die ersten SetTop-Boxen mit Modemanschluss werden bereits im Großversuch in Kalifornien eingesetzt, mehr als 200 digitale Kanäle lassen sich so empfangen, interaktives Fernsehen und TV-Shopping wird möglich. Die Preise der von IBM, C-CUBE und Phillips gebauten MPEG-2-Dekoder Chips fallen momentan in den Keller, ein Endpreis von unter DM 1000 für eine SetTop-Box ist heute bereits möglich.

Der offizielle Version des Standards kann direkt von der ISO erworben werben, er ist nicht in Dateiform verfügbar. Wer diese recht hohen Kosten scheut, sollte einen Blick in die Kataloge der Bibliotheken von Technischen Universitäten werfen. Weitere technische Informationen zu MPEG-2 und nicht echtzeitfähige Software für DOS und Windows findet man im MPEG-Archiv. Das MPEG-FAQ in HTML-Form von Chadd Fogg (Mitglied der MPEG-2 Workgroup 11) empfiehlt sich für technisch interessierte, eine Liste von Internet-Links wird von Tristan Savatier verwaltet. Die Testdatenströme (System, Video und Audio) der Workgroup 11 sind im Internet verfügbar, da diese zum Teil jedoch sehr groß sind, ist eine CD-ROM mit allem Material zu MPEG-2 von der Firma PHADE Software bereits in Vorbereitung (ISBN 3-??????-41-?, kommt noch !). Die ersten MPEG-2 Hardwareerweiterungen sind von C-Cube, ODZ und NB Electronics erhältlich, letzterer bietet auch einen Kodierungsservice im Netz.

Dennoch sind die ersten Implementierungen von Dekodern und Enkodern im Internet verfügbar. Zu nennen sind die Tools der MPEG Software Simulation Group namens MPEG2ENC und MPEG2DEC für DOS und MPEG2DEC und MPEG2PLY für Windows 3.x (zu finden im MPEG- Archiv), letzterer enthält auch C-Code zur Dekodierung. Weiterhin ist ein Multiplexer, das Video- Codec der Universität Berkeley und das Audio-Codec der ITU (früher CCETT) zu finden. Die letzten beiden enhalten auch C-Code.


Ähnlich der Entwicklung von MPEG-1 wird es noch ein weiteres Jahr dauern, bis die ersten computerbasierten und softwaregestützten Kodier- und Editiersysteme verfügbar sind, die MPEG-2 Revolution wird eher im TV-Endkonsumentenbereich kommen; die MPEG-2 Videoproduktion wird haupsächlich in schon etablierten Studios und somit hardwaregestützt stattfinden. Beim nächsten Kauf eines Fernsehgerätes sollte man nicht nur nach HDTV-Unterstützung und Stereoempfang, sondern nach eingebauten MPEG-2-Chips und Dolby-Surround fragen. Obwohl solche Geräte noch nicht zu erwerben sind, sind Dienste wie Video-On-Demand, Tele-Shopping und Home-Cinema und Fernseher mit Set-Top-Box, Satellit-Dekoder für mehr als 500 Programme, digitalem Pay-TV-Dekoder, fünf Dolby-Surround-Raumkanälen sowie digitalen Videorekordern und integriertem HighDensity-CD-Laufwerk durch MPEG-2 lange nicht mehr so weit weg, wie man denkt ... ob man dies alles nun braucht oder nicht.

Die Entwicklung der digitalen Komprimierungsformate der MPEG-Gruppe geht nun weiter zu MPEG-4 (die geplanten Funktionen für MPEG-3 wurden bereits in MPEG-2 integriert). MPEG-4 ist noch nicht konkretrisiert, soll aber ebenso wie MPEG-2 generische Methoden zur Kodierung von Audio-Visuellen Datenströmen für kleinste Datenraten bieten (bis maximal 100 kbit/s). Diese Datenraten werden heutzutage von digitalen Telefonleitungen erbracht und würden dann eine Video- und Audioübertragung bei ca. 176 * 144 Bildpunkten und einer Bildrate von 10 Hz, z.B. über ISDN gestatten. Um die benötigten Kompressionsraten erreichen zu können, sollen u.a. fraktale Kompression, Morphing und die relative neue Technik des Pyramid Image Coding eingesetzt werden, wobei einzelne Bilder in verschiedenen Schichten und einzelne Teile von Bildern mit unterschiedlicher Qualität kodiert werden können. Dies erfordert jedoch Techniken der Bildinhaltsanalyse, die sich noch in der Forschung befinden.


MPEG-2 Ressourcen im Internet

ISO http://www.iso.ch/welcome.html
MPEG-Archive http://www.mpeg1.de
MPEG-2-FAQ http://www-plateau.cs.berkeley.edu/mpegfaq/MPEG-2-FAQ.html
MPEG Resources http://www.creative.net/~tristan/MPEG.html
Audiostreams ftp://ftp.tnt.uni-hannover.de/pub/MPEG/audio/mpeg2/
Videostreams ftp://ftp.cstv.to.cnr.it/pub/MPEG2/conformance-bitstreams/
Systemstreams ftp://mpeg.cablelabs.com/pub/bitstreams/working/video/
PHADE Software http://www.powerweb.de/phade
Windows/DOS utils http://www.mpeg1.de/mpega.html
Demultiplexer ftp://wuarchive.wustl.edu/graphics/x3l3/pub/bitstreams/systems/munsi_v13.tar.gz
Video-Codec ftp://mm-ftp.cs.berkeley.edu/pub/multimedia/mpeg2/software/ (mpeg2codec)
Audio-Codec ftp://ftp.ccett.fr/pub/mpeg/mpeg2
C-Cube http://www.c-cube.com
NB Electronics http://www.nbeng.com


Entwicklungstufen des Standards ISO 13818 (MPEG-2):

Working Draft 1 November 1992
Comittee Draft November 1993
Draft International Standard März 1994
International Standard November 1994
Momentan Testphase und Entwicklung von Software- und Hardware


Vorsitzender: Leonardo Chiariglione Leonardo.Chiariglione@CSELT.STET.IT
Kontakt: Chad Fogg cfogg@chromatic.com, Autor des MPEG-2-FAQ
Tristan Savatier tristan@creative.net, Verwalter von MPEG-2 Internet-Resourcen
Organisationen: ISO, ITU (früher CCETT)
Firmen: Alcatel, Frauenhofer Gesellschaft, GCL, Institut für Rundfunktechnik, Nippon Steel,
Phillips, Samsung, Telekom, Texas Instruments
E-Mail-Liste: Zu erfragen bei Tristan Savatier.


© 1996 by Frank Gadegast/Juergen Schmidt/AWi Verlag
Published in UNIXopen 05/96.
All rights reserved.