Was versteht man unter Farbunterabtastung (Chroma Subsampling)?

Im Zusammenhang mit der JPEG-Kompression und den verschiedenen Video-Kompressionsverfahren tauchen unter den Schlagwörtern „Farbunterabtastung“ oder „Chroma Subsampling“ regelmäßig Angaben wie „4:2:2“ oder „4:2:0“ auf. Was ist damit gemeint, und was bedeutet es für die Qualität der Bilder?

Wenn man den zur Speicherung von Fotos oder Bewegtbildern benötigten Platz stark reduzieren will – auf ein Fünftel, ein Zehntel oder noch mehr –, ist das durchweg nur mit einer verlustbehafteten Kompression möglich. Man lässt also Daten weg, deren Fehlen am Ende unbemerkt bleibt. Ein Ansatz dazu beruht auf der Tatsache, dass wir Farbmuster viel gröber auflösen als Helligkeitsmuster. Das liegt nicht an der Netzhaut unserer Augen, die im zentralen, am höchsten auflösenden Bereich nur farbempfindliche Sinneszellen enthält, sondern an der weiteren Verarbeitung im Gehirn, bei der Helligkeitsunterschiede die größere Rolle spielen. Daher kann man Farbwerte mit geringerer Auflösung als Helligkeitswerte speichern, aber dazu müssen die RGB-Farbwerte zunächst in ein Farbmodell wie YCrCb umgerechnet werden, in dem Farb- und Helligkeitsinformationen getrennt sind.

Statt Kanälen für Rot, Grün und Blau gibt es in YCrCb einen Y-Kanal für die Helligkeit; das ist der Durchschnitt von Rot, Grün und Blau. Im Cr-Kanal speichert man die Abweichung des Rotkanals von der Durchschnittshelligkeit und im Cb-Kanal die Abweichung des Blaukanals. Der Wert für den Grünkanal lässt sich daraus berechnen und braucht nicht eigens gespeichert zu werden. Damit sind die Komponenten Helligkeit (Y) und Farbigkeit (Cr und Cb) voneinander getrennt und man kann daran gehen, die Farbdaten mit verringerter Auflösung zu speichern. Das bezeichnet man als Farbunterabtastung oder englisch als Chroma Subsampling.

Das Schema, nach dem die Farbinformationen vergröbert werden, lässt sich durch drei Zahlen beschreiben. Dazu betrachtet man exemplarisch zwei Zeilen von je vier Bildpixeln, also insgesamt acht Pixel. Die erste Zahl gibt nun an, wie viele Helligkeitsinformationen für die vier Pixel einer Zeile gespeichert werden. Diese Zahl kann nur 4 sein, denn andernfalls würden wir auch die Helligkeitsinformationen vergröbern und damit die Bildauflösung insgesamt verringern. Die zweite Zahl ist die Zahl der Farbinformationen, die für die Pixel der ersten Zeile gespeichert werden, und die dritte die Zahl der Farbinformationen für die zweite Zeile. Die gängigsten Schemata sind 4:4:4, 4:2:2 und 4:2:0.

4:4:4

4:4:4 ist tatsächlich gar keine Farbunterabstastung, denn nach diesem Schema werden die Farbinformationen vollständig gespeichert. Zu den je vier Helligkeitsinformationen pro Zeile kommen je vier Farbinformationen. Für zwei Zeilen mit acht Pixeln sind das 8 Helligkeitswerte (Y) und 16 Farbwerte, denn für die Farbinformation müssen ja jeweils zwei Werte, Cr und Cb, gespeichert werden, insgesamt also 24 Werte.

4:2:2

Bei einer Farbunterabtastung von 4:2:2 werden für je vier Pixel einer Zeile nur zwei Farbwerte gespeichert. Die Farbwerte zweier nebeneinander liegender Pixel müssen dazu gemittelt werden. Zu den 8 Helligkeitswerten kommen noch 8 (2 × 4) Farbwerte; insgesamt sind es folglich 16. Gegenüber 4:4:4 spart man ein Drittel ein.

4:2:0

4:2:0 geht noch einen Schritt weiter: Für die zweite Zeile werden gar keine Farbwerte gespeichert, so dass deren Pixel die Farbwerte der ersten Zeile übernehmen müssen. Dazu werden die Farben von vier Pixeln gemittelt und deren Mittelwert gespeichert. Neben den 8 Helligkeitswerten sind nur noch 4 (2 × 2) Farbwerte nötig, also insgesamt 12 Werte – eine Reduktion auf die Hälfte.

Andere Schemata als diese drei wären möglich, kommen aber seltener vor. 4:0:0 beispielsweise wäre ein reines Schwarzweißbild und 4:4:0 hätte ähnliche Eigenschaften wie 4:2:2, nur dass statt der Farbwerte zweier nebeneinander liegender Pixel die zweier untereinander liegender Pixel gemittelt würden.

Verglichen mit den Kompressionsfaktoren, die Verfahren wie JPEG, HEIF oder MP4 erzielen, spielt die Farbunterabtastung also nur eine untergeordnete Rolle. Selbst das relativ grobschlächtige 4:2:0-Schema reduziert den Platzbedarf lediglich um 50 Prozent. Die bei den üblichen Verfahren nachfolgenden Komprimierungsschritte wie eine Diskrete Kosinustransformation, gefolgt von einer Entropiekodierung, leisten einen deutlich größeren Teil der Arbeit. Und obwohl wir Farbmuster tatsächlich nicht so gut wie Helligkeitsmuster auflösen, bleibt die Vergröberung der Farbinformationen nicht immer unbemerkt. Wie oben beschrieben müssen dazu die Farbwerte mehrerer Pixel gemittelt werden, was den Farben feiner Strukturen ihre Sättigung nimmt. Im ungünstigsten Fall bleibt von einem Farbmuster nur noch eine undifferenzierte graue Fläche, und diesen Unterschied nehmen wir durchaus wahr.

Es ist daher eine Überlegung wert, auf eine allzu starke Farbunterabtastung zu verzichten. Gerade bei von vornherein niedrig aufgelösten Bildern für die Präsentation im Web ist es sinnvoll, die Farbauflösung mit 4:4:4 oder wenigstens 4:2:2 zu erhalten, sofern das Bild feine, vor allem farblich kontrastierte Strukturen enthält.