Search

Künstliche Intelligenz: So funktionieren KI-Bildgeneratoren - Golem.de - Golem.de

Im Netz wimmelt es mittlerweile von künstlich erzeugten Bildern reitender Astronauten, skateboardfahrender Teddys oder stylish gekleideter Päpste. Aber wie machen Dall-E, Stable Diffusion & Co. das eigentlich?

von Helmut Linde
Ein Papst, ein Astronaut und ein Teddybär treffen sich auf dem Mond... könnte auch der Anfang eines Witzes sein.
Ein Papst, ein Astronaut und ein Teddybär treffen sich auf dem Mond... könnte auch der Anfang eines Witzes sein. (Bild: KI-generiert mit Midjourney / Montage: Golem.de)

Donald Trump kämpft im Handgemenge mit Polizisten und der Papst flaniert lässig im weißen Daunenparka? Von künstlicher Intelligenz (KI) erzeugte Bilder lassen sich von echten Fotos auf Anhieb kaum mehr unterscheiden.

Die zugrunde liegenden Algorithmen der generativen – also Inhalte erzeugenden – KI haben in den vergangenen Jahren beeindruckende Fortschritte gemacht. Insbesondere die Veröffentlichung des Text-zu-Bild-Modells Dall-E 2 erregte vor rund einem Jahr große Aufmerksamkeit in den sozialen Medien und darüber hinaus.

Derartige Modelle erzeugen gleichermaßen realistische wie kreative Grafiken aus Textbeschreibungen oder aus bildlichen Vorlagen und eröffnen damit völlig neue Möglichkeiten in Bereichen wie Kunst, Design oder Werbung sowie in Onlinemagazinen, Computerspielen und anderen Medien.

Dieser Artikel konzentriert sich auf die technischen Aspekte und die Algorithmen hinter Bildgeneratoren wie Dall-E oder Stable Diffusion. Das Ziel ist ein intuitives Grundverständnis dieser faszinierenden Technologien, ohne dabei nur an der Oberfläche zu kratzen, aber auch ohne die Darstellung mit sämtlichen technischen Einzelheiten zu überfrachten.

Viele Algorithmen führen zum Ziel

Für die künstliche Erzeugung von Bildern gibt es mittlerweile eine große Vielfalt unterschiedlicher Algorithmen. Im Folgenden werden einige der bekanntesten und am häufigsten eingesetzten Verfahren kurz angesprochen:

Generative Adversarial Networks (GANs) sind eine Art von Algorithmen, bei denen zwei neuronale Netze, der Generator und der Diskriminator, miteinander konkurrieren. Der Generator erstellt Bilder aus Zufallsrauschen und der Diskriminator bewertet, ob diese Bilder echt oder künstlich sind.

Durch einen solchen iterativen Prozess lernt der Generator schrittweise, realistischere Bilder zu erzeugen, während der Diskriminator seine Fähigkeiten im Erkennen von Fälschungen verfeinert. GANs wurden erstmals 2014 von Ian Goodfellow vorgestellt und haben seitdem viele Verbesserungen erfahren.

Autoencoder sind eine weitere Technik für generative Modelle. Sie bestehen aus zwei Hauptkomponenten: Ein Encoder verschlüsselt die Eingabe – zum Beispiel ein Bild – in einem Vektor. Ein Decoder verwendet diesen Vektor, um das Bild zu rekonstruieren oder ein völlig neues zu erzeugen.

Die Dimension des besagten Vektors ist dabei deutlich kleiner als die Zahl der Pixel pro Bild, so dass er weniger Information speichern kann und damit zu einer Art Flaschenhals zwischen Eingabe und Ausgabe wird. Durch einen Trainingsprozess werden Autoencoder gezwungen, wichtige Merkmale und Muster aus den Eingangsbildern zu extrahieren und diese Informationen effizient durch den einen Vektor darzustellen. Autoencoder können sowohl für das Komprimieren von Bildern als auch für die Erzeugung neuer Bilder eingesetzt werden.

Diffusionsmodelle sind eine jüngere Klasse von generativen Modellen, die auf Zufallsprozessen basieren. Diese Modelle nutzen die Idee der Diffusion, bei der Bilder im Training schrittweise zufällig verändert werden, bis sie in ein ungeordnetes Rauschen übergehen. Das Modell lernt, den Vorgang umzukehren und ein neues Bild zu erzeugen, indem es das Rauschen Schritt für Schritt wieder entfernt.

Dieser Ansatz ermöglicht es, realistische und vielfältige Bilder zu erzeugen, und bietet in einigen Fällen eine bessere Qualität als GANs oder Autoencoder. Er wird in Dall-E 2 und Stable Diffusion eingesetzt, wir werden weiter unten darauf zurückkommen.

Adblock test (Why?)

Artikel von & Weiterlesen ( Künstliche Intelligenz: So funktionieren KI-Bildgeneratoren - Golem.de - Golem.de )
https://ift.tt/jVkDlZz
Wissenschaft & Technik

Bagikan Berita Ini

0 Response to "Künstliche Intelligenz: So funktionieren KI-Bildgeneratoren - Golem.de - Golem.de"

Post a Comment

Powered by Blogger.