Entdecke die Bachelorarbeit des Interaktionsdesigners Samuel von Tucher, welche die Möglichkeiten von aktuellen generativen KI-Technologien und deren Anwendung auf den Design Bereich erforscht.
Die Bachelorarbeit "PosterGAN" des Interaktionsdesigners Samuel von Tucher erforscht die Möglichkeiten von kreativer Künstlicher Intelligenz. Kann eine KI Plakate gestalten? Und welche Rolle nehmen Designer*innen bei dem Prozess ein?
Diesen spannenden Themen widmet sich Samuel und zeigt den Prozess, der hinter den Plakaten steckt. 12.000 Plakate ermöglichen es der KI neue und einzigartige Plakate zu kreieren, welche zeigen, was heute mit Neuronalen Netzwerken möglich ist.
"Als Künstliche Intelligenz (KI), auch Artificial Intellgence (AI) bezeichnet man Anwendungen, die menschenähnliches Verhalten, wie Lernen, Urteilen und Problemlösen aufzeigen."
Einfach gesagt, ist KI ein Überbegriff für Programme und
Algorithmen,
die
mithilfe von Daten lernen können.
Eine Künstliche Intelligenz lernt, indem sie Vorhersagen trifft, diese mit dem
Datensatz
vergleicht und dann interne Parameter anpasst, um bessere Vorhersagen treffen zu
können.
Die Plakate wurden mithilfe eines bestimmten Neuronalen Netzwerks, einem GAN, kreiert. Ein GAN (Generative Adversarial Network; deutsch: Generatives Gegenseitiges Netzwerk) ist ein Machine-Learning-System, welches basieren auf realen Daten neue Kreationen erschafft.
Dabei besteht es zwei konkurrierenden Netzwerken: Einem Generator, der Fälschungen erzeugt, und einem Diskriminator, der lernt echte und gefälschte Bilder zu unterscheiden.
Ein GAN funktioniert folgendermaßen: Zuerst kreiert der Generator eine Fälschung. Diese ist am Anfang des Trainings noch ein Rauschen aus zufälligen Farben. Die Fälschung und ein Echtes Bild werden zum Diskriminator geschickt, der nun eine Vorhersage darüber treffen muss, welches der Bilder echt oder gefälscht ist. Danach wird die Vorhersage überprüft und die beiden Netzwerke (Generator und Diskriminator) werden optimiert. Danach beginnt ein neuer Zyklus, in dem der Generator schon leicht bessere Fälschungen erzeugt und der Diskriminator schon etwas besser erkennen kann, welches der Bilder echt ist.
Ziel ist es, dass der Generator Fälschungen erzeugt, die der Diskriminator nicht mehr als diese erkennen kann.
Um möglichst gute Ergebnisse zu erzielen, ist es bei maschinellem Lernen wichtig einen hochwertigen Datensatz zusammenzustellen. Dabei sollte der Datensatz eine große Bandbreite abdecken und keine Duplikate enthalten. Der PosterGAN-Datensatz besteht aus über 12000 Plakaten von verschiedenen Designern und Künstlern. Bevor der die Bilder zum Datensatz hinzugefügt werden konnten, mussten sie erst zugeschnitten und neu formatiert werden.
Und so entstand ein Datensatz mit über 12.000 verschiedenen Plakaten, womit die KI lernt neue Plakate zu erstellen.
Beim Training lernt das GAN immer bessere Fälschungen zu erzeugen. Dieser Trainingsprozess ist sehr rechenintensiv und kann Tage dauern. Um die Dauer und den Aufwand zu reduzieren, wird das Neuronale Netzwerk nicht von null auf trainiert. Stattdessen verwendet man oft ein vortrainiertes Modell, welches beispielsweise mit Bildern von Gesichtern trainiert wurde. So hat das Netzwerk schon "verstanden", was ein Bild ausmacht, was Kanten sind und wie Flächen aufgebaut sind.
Über viele Trainingsschritte lernt die Künstliche Intelligenz immer bessere Plakate zu kreieren.
Generative Neuronale Netzwerke können Designs erzeugen, die sich von menschengemachten Designs unterscheiden, jedoch einen eigenen ästhetischen Wert besitzen. Doch es stellt sich die Frage, ob man bei den Plakaten von Gestaltung sprechen kann.
Wenn man die Plakate untersucht, stellt man fest, dass die Künstliche Intelligenz Gestaltungsentscheidungen getroffen hat. So sind die Farben beispielsweise nicht zufällig gewählt, sondern lassen sich immer auf eine begrenzte Farbpalette einordnen.
Außerdem richtet sich die Platzierung der Elemente auf dem Plakat manchmal nach dem Goldenen Schnitt. Das ist zwar nicht immer der Fall, doch bei manchen Postern ist es dafür umso auffälliger.
Eine weitere Beobachtung sind typografische Artefakte, die das Neuronale Netzwerk erzeugt hat. Diese erinnern sehr an Schrift, sind aber meistens nicht als klare Buchstaben zu erkennen. Die KI hat gelernt schriftartige Zeichen zu erstellen, doch sie hat kein Verständnis dafür, was Typografie bedeutet, oder dass damit Informationen kommuniziert werden.
Die Künstliche Intelligenz kann eine unbegrenzte Anzahl an Plakaten erzeugen. Jedes Plakat ist einzigartig. Oft findet man auf den Plakaten Artefakte, die an Typografie oder Schrift erinnern. Wiederum Andere bestehen aus abstrakten Formen und leuchtenden Farben. Ingesamt ist es erstaunliche welche Vielfalt eine Künstliche Intelligenz erzeugen kann.
Eine limitierte Anzahl an Plakaten stehen auch zum Kauf zur Verfügung.