Apple veröffentlicht PICO-Forschungsprojekt: KI-Bildkompression soll Dateien deutlich kleiner machen

Apple hat ein neues Forschungsprojekt aus dem Bereich Machine Learning vorgestellt. Es hört auf den Namen PICO, ausgeschrieben „Perceptual Image Codec“, und beschäftigt sich mit dem Thema Bildkompression. Also damit, wie man Fotos möglichst klein bekommt, ohne dass sie für das menschliche Auge sichtbar schlechter aussehen. Interessant ist das Ganze, weil Apple hier nicht einfach nur an einem weiteren klassischen Codec schraubt. Die Kompression basiert nicht nur auf fest verdrahteten Regeln, sondern auf einem trainierten Modell, das stärker auf wahrgenommene Bildqualität optimiert wurde. Apple hat damit kein neues iPhone-Feature angekündigt und auch keinen HEIC-Nachfolger vorgestellt. PICO ist ein Forschungsprojekt.

Laut Apple erreicht PICO in eigenen Tests deutliche Einsparungen bei der Bitrate. Gegenüber AV1, AV2, VVC, ECM und JPEG-AI sprechen die Forscher von 2,3- bis 3-facher Einsparung bei gleicher wahrgenommener Qualität. Im Vergleich zu anderen modernen ML-Codecs sollen es immerhin noch 20 bis 40 Prozent weniger Daten sein. Das ist schon eine Ansage, auch wenn man bei solchen Werten natürlich im Kopf behalten sollte, dass es sich aktuell nur um ein Forschungspaper und ein paar Tests handelt. Im Paper ist von 74.925 paarweisen Bildvergleichen durch 610 Tester die Rede. Dabei wurden verschiedene Codecs blind gegeneinander und gegen Referenzbilder verglichen.

Ein zweiter Punkt ist die Geschwindigkeit. Viele KI-basierte Kompressionsverfahren sehen in Papers gut aus, sind aber für den Alltag zu langsam oder zu schwergewichtig. Apple betont deshalb die Laufzeit auf echter Hardware. Auf einem iPhone 17 Pro Max soll PICO ein 12-Megapixel-Bild in rund 230 Millisekunden kodieren und in rund 150 Millisekunden dekodieren können. Das wäre schnell genug, um auch im Produktiveinsatz bestehen zu können.

Technisch haben die Forscher an mehreren praktischen Problemen gearbeitet. PICO verarbeitet Bilder unter anderem in Kacheln, um schneller arbeiten und Aufgaben parallelisieren zu können. Genau das kann aber sichtbare Kachel-Artefakte erzeugen. Dafür nutzt Apple im Training zusätzliche Verlustfunktionen, die solche Übergänge reduzieren sollen. Auch Text in Bildern ist ein Thema. KI-basierte Verfahren können Details „schönrechnen“ oder halluzinieren. Bei normaler Fotografie fällt das vielleicht nicht sofort auf, bei Schrift wird es aber schnell hässlich. PICO gewichtet Textbereiche deshalb gesondert, damit kleine Schrift besser lesbar bleibt. Es gibt auch Einschränkungen. PICO ist auf natürliche Bilder optimiert. Bei sehr einfachen synthetischen Inhalten, etwa Cartoons oder sehr klaren Grafiken, kann ein klassischer Codec laut Paper effizienter sein.

Ob und wann daraus etwas für Nutzer wird, ist offen.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.