Danke, dass du meinen allerersten Blogbeitrag auf meiner Webseite liest :). Dafür habe ich mir ein spannendes und auch aktuelles Thema ausgesucht. Die künstliche Intelligenz hat sich in den letzten Monaten enorm weiterentwickelt und vor allem beim Generieren von Bildern hat sie außergewöhliche Fortschritte erreicht. Ich persönlich bin fasziniert davon, welche beeindruckenden Fähigkeiten diese KI-Modelle mittlerweile besitzen. In diesem Beitrag werde ich dir einen Einblick in einige der bekanntesten KI-Bildgeneratoren geben und am Ende werde ich meinen Favoriten enthüllen.
Was ist ein KI-Bildgenerator?
KI-Bildgeneratoren sind Werkzeuge, mit denen man Bilder aus Text erstellen kann. Diese funktionieren mit einem tiefen Lernalgorithmus, der auf einem riesigen Datensatz von Bildern und passenden Beschreibungen trainiert wurde. Man kann so ziemlich alles generieren lassen, was einem in den Sinn kommt. So kann man zum Beispiel Bilder von Landschaften, Tieren, Objekten oder sogar Personen erstellen. Die Tools sind einfach extrem praktisch, ob man es zur Inspiration für kreative Projekte nutzen möchte, um Ideen zu visualisieren oder einfach nur zum Spaß. Kleiner Fun Fact: Die Banner auf meiner Webseite wurden alle mit KI generiert.
Vergleich mit einem einfachen Prompt
Um die KI-Modelle besser vergleichen zu können, habe ich mir einen einfachen Prompt bzw. eine Anweisung überlegt, die ich dann bei jedem Generator eingeben werde. Die Anweisung lautet: „A photo of a pig riding a skateboard in new york times square.“ Es hat übrigens keinen tiefgreifenden Grund, warum ich die Anweisung in englisch geschrieben habe. Falls du selber einen Ki-Bildgenerator ausprobieren möchtest, kannst du deinen Prompt auch in deutsch eingeben.
DALL·E 2
DALL·E 2 gilt als einer der Vorreiter für die Generierung von künstlichen Bildern mithilfe von KI. Entwicklet wurde es von OpenAI, das sind übrigens dieselben Entwickler, die für ChatGPT verantwortlich sind. DALL·E 2 ist eine aktualisierte Version des DALL·E Bildgenerators, der auf Deep Learning und Natural Language Processing basiert und auf dem fortschrittlicheren Generative Pre-Trained Transformer 3 (GPT-3) Large Language Model aufbaut. Seit September 2022 kann das Modell von der Öffentlichkeit genutzt werden, um Bilder basierend auf Textbefehlen oder beschreibenden Texteingaben zu generieren, die für private und kommerzielle Zwecke ohne Lizenzierung verwendet werden können. Das Potenzial und die Anwendungsmöglichkeiten von DALL-E 2 wurden seit der Veröffentlichung von Testern, Nutzern und anderen Anbietern von KI-basierten Diensten ausführlich erkundet und auch für die Entwicklung neuer generativer KI-Anwendungen genutzt.
Ab dem 28. September 2022 wurde DALL·E 2 für die Öffentlichkeit zugänglich gemacht. Allerdings gibt es Einschränkungen: Wenn du dich das erste Mal anmeldest, erhältst du 15 kostenlose Credits, um Bilder zu generieren. Danach kannst du nur noch 15 kostenlose Credits pro Monat erhalten, und nicht genutzte Credits verfallen am Ende des Monats. Wenn du mehr Credits benötigst, kannst du zusätzliche Credits für 15 US-Dollar kaufen, wofür du 115 Credits erhältst.
VORTEILE | NACHTEILE |
+ einfache Bedienung + Die Urheberrechte an den generierten Bildern liegen beim Ersteller | – Schwierigkeiten beim Erzeugen von fotorealistischen Bildern – Nur 15 kostenlose Bildgenerierungen pro Monat möglich |
DreamStudio
Wenn du nach einem AI-Bildgenerator suchst, der den StableDiffusion-Prozess nutzt, kannst du stablediffusionweb.com ausprobieren – die Plattform bietet eine beeindruckende Open-Source-Version kostenlos an.
Du kannst sowohl visuelle als auch Texteingaben verwenden und zwischen verschiedenen Stable-Diffusion-Modellen wählen. Außerdem kannst du die Größe, die Anzahl der AI-Schritte und die Cfg-Skala der generierten Bilder bearbeiten. Während DreamStudio ein gutes Bild generiert hat, fande ich es etwas weniger zuverlässig als Midjourney und DALL·E 2.
Durch die Erstellung eines DreamStudio-Kontos erhältst du 100 Tokens kostenlos, was ausreicht, um bis zu 500 Bilder zu generieren. Weitere 1.000 Tokens (5.000 Bilder) können für nur 10 US-Dollar erworben werden.
VORTEILE | NACHTEILE |
+ Gutes Preis-Leistungs-Verhältnis + Großzügige Token-Zuweisung + Bietet zusätzliche Bearbeitungswerkzeuge + Pro Textanweisung werden vier Bilder generiert + Möglichkeit Variationen aus Bildern zu generieren | – Leistung ist durchschnittlich |
Midjourney
Midjourney ist eine innovative AI-Kunstplattform, die nahtlos in Discord integriert ist. Auch wenn sie auf den ersten Blick vielleicht etwas komplex wirkt, bietet sie die faszinierendste Tool auf dem Markt.
Um anzufangen, kannst du einem Einsteiger-Server beitreten und deine eigenen Bilder erstellen, indem du einfach „/imagine“ eingibst und deine Anfrage sendest. In diesem Einsteiger-Chat rasseln auch die generierten Bilder von anderen Nutzern durch. Das kann oft sehr nervig sein, kann aber auch inspirierend sein, um zu sehen, was andere kreatives erschaffen haben.
Der Fokus auf die Community ist bei Midjourney sehr ausgeprägt, da es in Discord eingebettet ist. Es gibt regelmäßige Ausstellungen, tägliche Themen und sogar Q&A-Sessions mit bekannten digitalen Künstlern, um die Community zu fördern und zu stärken.
Leider bietet Midjourney seit 28. März 2023 keine kostenlose Testversion mehr an. Midjorneys CEO äußerte sich folgendermaßen hierzu:
Due to a combination of extraordinary demand and trial abuse we are are temporarily disabling free trials until we have our next improvements to the systems deployed.
David Holz, Midjourney’s CEO
Die kostenpflichtigen Pläne beginnen bei 10 US-Dollar pro Monat (96 US-Dollar pro Jahr) und reichen bis zur Pro-Option für 60 US-Dollar pro Monat (576 US-Dollar pro Jahr). Die Zahlung ist nur mit Kreditkarte möglich, ähnlich wie bei Dall-E und DreamStudio.
VORTEILE | NACHTEILE |
+ Community + Erstellt beeindruckende Bilder + Pro Textanweisung werden vier Bilder generiert + Möglichkeit Variationen aus Bildern zu generieren | – Keine Testversion verfügbar – Vergleichsweise teuer – Kann am Anfang etwas überwältigend sein |
Fazit
Insgesamt lassen sich bei der Betrachtung der drei vorgestellten Bildgeneratoren deutliche Unterschiede in der Qualität der Ergebnisse feststellen. Alle drei Bildgeneratoren waren zumindest in der Lage, ein Schwein zu generieren. Jedoch hatte das von DALL·E 2 generierte Schwein zwar eine ähnliche Form wie ein echtes Schwein, wirkte jedoch nicht realistisch und wies einige Artefakte im Gesicht auf. Auch der Detailgrad des Skateboards ließ zu wünschen übrig und der Hintergrund wurde stark verzerrt bzw. grob dargestellt.
Das Ergebnis von DreamStudio fällt im Vergleich besser aus. Der Detailgrad der Gebäude im Hintergrund ist um ein Vielfaches höher als bei DALL·E 2, und das Schwein ist viel detaillierter dargestellt, obwohl es mit einem Fuß in der Luft schwebt. Zudem macht die Anordnung der Räder des Skateboards keinen Sinn.
Midjourney hat meiner Meinung nach das beste Bild erstellt. Das Bild hat keinerlei Mängel und sieht wirklich so aus, als hätte das Schwein ein professionelles Fotoshooting gehabt. Wer also ernsthaft daran interessiert ist, professionelle KI-Bilder zu generieren, sollte unbedingt Midjourney in Betracht ziehen. Obwohl Midjourney im Gegensatz zu anderen KI-Anbietern keine kostenlose Testversion anbietet, ist die Plattform eine hervorragende Wahl für ernsthafte Nutzer, die sich mit KI-Bildgeneratoren intensiv beschäftigen möchten und bereit sind, dafür zu zahlen.