Pixelrekursive Superauflösung: Google macht aus verpixelten Bildern wieder echte

Die Google-Brain-Forschungsgruppe hat eine Methode entwickelt, um aus verpixelten Gesichtern auf echte Bilder schließen zu lassen. Die Ergebnisse dieser pixelrekursiven Superauflösung sind nicht gleich, aber nah dran am Original.

Ein interessanter Test, den Alphabets künstliche-Intelligenz-Abteilung Google Brain hier geschafft hat. Die Forscher Ryan Dahl, Mohammad Norouzi und Jonathon Shlens haben verpixelte Profile von Prominenten genommen und aus diesen wieder echte Bilder machen lassen. Die Ergebnisse (siehe Beitragsbild) können sich sehen lassen, auch wenn sie nicht haargenau übereinstimmen. Die Methode nennt sich pixelrekursive Superauflösung.

Zwei neuronale Netze fügen Ergebnisse zusammen

Genutzt haben die Tüftler dazu nach eigenen Angaben zwei neuronale Netze. Ausgangspunkt waren die verpixelten Bilder von nur noch 8×8 Pixel Größe. Das erste neuronale Netz glich diese mit einer Datenbank ähnlicher Fotos in höherer Auflösung ab und suchte nach Ähnlichkeiten. Das zweite neuronale Netz suchte in höher auflösenden Bildern nach Details und fügte diese in das Originalbild ein, sobald dieses vergrößert wurde. Das können Details wie Augen oder Nasen sein. Am Ende wurde aus den Ergebnissen beider Algorithmen das neue Gesamtbild erschaffen. Mit einem Foto, das dem Orignal am meisten ähnelt und den Ergänzungen des zweiten Algorithmus.

Pixelrekursive Superauflösung mit neuronalen Netzen
Pixelrekursive Superauflösung mit neuronalen Netzen

Die Ergebnisse erinnern nicht wirklich an die Originale, aber sie sind deutlich als Gesichter zu erkennen, die auch realen Menschen gehören könnten. Google Brain führte diesen Test auch an Bildern von Schlafzimmern durch. Hier bestätigten Tester sogar noch eher Gemeinsamkeiten.

Höhere Auflösungen erzeugen

Der Algorithmus, der das 8×8 Pixel große Bild mit ähnlichen Bildern vergleicht, heißt CNN, der andere, der Details hinzufügt, PixelCNN. CNN steht dabei jeweils für Convolutional Neural Network, zu deutsch etwa: faltendes neurales Netzwerk. Das ganze nennt Google pixelrekursive Superauflösung. Die Ergebnisse sind erstaunlich.

Bleibt die Frage: Wozu das Ganze? Immerhin werden Bilder doch meist aus einem bestimmten Grund verpixelt. Man möchte die jenige Person absichtlich unkenntlich machen. Ganz genau geben die Forscher keine Antwort darauf, aber man könnte das Beispiel der „entpixelten“ Bilder als Härtetest für reale Anwendungsfälle verstehen. Denn oft kommt es ja vor, dass man ein Bild zur Hand hat, hier aber nur eine geringe Auflösung vorliegt. Dieses würde man dann gerne vergrößern, die normal dafür verwendete Interpolation schafft allerdings meist keine schönen Ergebnisse.

Da wäre eine künstliche Intelligenz doch besser, und was sie mit verpixelten Bildern schafft, das kann mit Bildern doch nur besser werden, auf denen man mehr erkennen kann.

2 0