Ein bemerkenswerter Fortschritt in der Verwendung künstlicher Intelligenz zur Bildrekonstruktion.Google hat einen Weg gefunden in verpixelte Bilder zu zoomen, diese zu vergrößern – und dabei zu entpixeln. Der dafür entwickelte Algorithmus liefert heute schon bemerkenswerte Ergebnisse, fast wie in Kino und Science Fiction!
Ein weit verbreiteter Mythos in Krimis und Thrillern ist, dass FBI, CIA und andere Behörden die Möglichkeit haben aus verpixelten und verwaschenen Bildern von Überwachungskameras sinnvolle und erkennbare Szenen zu machen – einfach indem sie eine beliebige Anzahl an virtuellen Filter über die verpixelte Aufnahme jagen.
Das wäre zwar oft gut und hilfreich – war aber bislang im Reich der Mythen, Märchen und Legenden angesiedelt, weil ein derartiges Verfahren technisch auch bei teurer Software nicht so ohne weiteres implementiert werden kann. Und dessen Umsetzung von Kritikern sogar als unmöglich bezeichnet wurde. Bislang galt derartiges weitgehend als nicht realisierbar – es scheint aber, dass eine handvoll Ingenieure und Wissenschaftler bei Google einen Weg gefunden hat ein derartiges Feature Wirklichkeit werden zu lassen.
Google Brains Bildaufbereitung im Überblick
In den Beispielbildern oben wird die Effizienz und Leistungsfähigkeit von Googles neuer Technik ersichtlich: aus verpixelten und unkenntlich gemachten Aufnahmen (links außen) macht Google Brain innerhalb von Sekunden weitgehend den Originalen (rechts außen) entsprechende Bilder (Google Brain Ausgabe in der Mitte).
Die Ähnlichkeiten zwischen den Originalen und den von Google errechneten Varianten sind bemerkenswert! Wo ein menschlicher Betrachter aus einer hochgradig verpixelten Aufnahme kein sinnvoll erkennbares Muster konstruieren – geschweige denn das Gesicht einer realen Person erkennen – könnte, liefert Google Brain durchaus weitgehend korrekte Rekonstruktionen der Wirklichkeit!
Google Brains Bildaufbereitung im Detail
Die Google Entwickler Jonathon Shlens , Ryan Dahl und Mohammad Norouzi haben ein pixelrekursives Auflösungsmodell entwickelt, das durch die Kombination zweier neuronaler Netze Details in Bildern geringer Auflösung errechnen kann. Sie verwenden dabei Verfahren aus der „künstlichen Intelligenz“-Forschung, die die Funktion menschlicher neuronaler Netze virtuell nachbildet. Und dabei erstaunliche Ergebnisse erzielt!
In einem ersten Schritt wendet ein konditionierends neuronales Netz ein Verfahren an, das die Ausgabe eines verpixelten 8×8 Quader großen Bildes mit ähnlichen Bildern weit höherer Auflösung vergleicht und ermittelt wie diese verpixelt aussehen würden. Es werden also aus Bildern mit relativ höherer Auflösung verpixelte Versionen gemacht, die dann mit dem verpixelten Ursprungsbild abgeglichen werden.
Daraufhin ergänzt das priorisierende Netzwerk das verpixelte 8×8 Quader große Bild mit realistischen Details, indem es ermittelt welche Funktion die 8×8 Bilder in den höher aufgelösten Detailbildern übernehmen würden. Der Rest ist schiere Mathematik und eine Meisterleistung mathematischer Modellierung.
Durch neuronale Netze rekonstruierte Bilder: bemerkenswerte Ergebnisse!
Denn – so das schier Unglaubliche:die laut Algorithmus plausibel rekonstruierte Realität, ähnelt der Wirklichkeit auf atemberaubende Weise.
Wie Ars Technica in einem Artikel erwähnt, liegt die Wiedererkennungsrate durch menschliche Probanden, die Googles rekonstruierte Bilder von bekannten Persönlichkeiten mit Originalbildern vergleichen sollten, bei über 90% – eine Statistik bei der alleine schon ein 50%iger Wiedererkennungswert als ‚guter Wert‘ betrachtet werden würde. Bei verpixelten Schlafzimmerbildern lag die Wiedererkennungsrate immer noch bei 75% – wobei dazugesagt werden muss, dass Menschen Gesichter einfacher erkennen als abstraktere Formen.
Dies geht auf einen evolutionären Mechanismus zurück, der unter anderem als sog. Pareidolie bekannt ist – der Fähigkeit des Menschen überall blitzschnell Gesichter zu erkennen. Woher genau dieser Effekt rührt ist noch unbekannt – seine Auswirkungen und seine Existenz sind aber seit den 1950ger Jahren eindeutig dokumentiert.
Fazit – ein Ausblick auf die Zukunft und ein bemerkenswerter Meilenstein
Was bisher Zukunftsmusik war, wird dank Google heute schon Realität – zumindest weitgehend. Denn über die Wirklichkeitstreue der Ausgabe lässt sich noch streiten – jedoch liefert der Algorithmus den Google hier entwickelt hat heute schon bemerkenswert detaillierte Bilder, die Originalaufnahmen in geringer Auflösung weitgehend entsprechen. Und wer weiß, wie weit die zu Grunde liegende Technologie in naher Zukunft noch ausgebaut werden wird.
Wichtig anzumerken ist, dass es sich bei Googles aufbereiteten Bildern eben um „plausible Varianten“ und nicht um ‚echte Bilder‘ handelt. Die neuronalen Netze von Google Brain konstruieren aus verpixelten 8×8 Quader Bildern mögliche Varianten, die auf Basis verschiedener mathematischer Modelle als mögliche Bildvarianten erkannt und ermittelt werden.
Neben der Verwendung dieser Technologie etwa in der Verbrechensaufklärung, wo tatsächlich erkennbare Bilder aus verpixelten Aufnahmen von Überwachungskameras gewonnen werden müssen, könnte diese Technologie auch in der Wissenschaft und der Weltraumforschung ihre Verwendung finden.
Google ist damit ein technischer Meilenstein in der Forschung im Bereich der künstlichen Intelligenz gelungen, der als wesentlicher Durchbruch im Bereich der Bild-Rekonstruktion betrachtet werden muss. Grund genug auf die weitere Entwicklung dieser Technologie mit Spannung zu warten.
Quelle: thenextweb
https://thenextweb.com/insider/2017/02/08/google-figured-out-a-way-to-zoom-and-enhance-photos-just-like-in-the-movies/#.tnw_FgGaWqNy