Der Nachfolger von DALL-E 2 ist da: DALL-E 3. Und diese neue Text-zu-Bild-KI bringt deutliche Verbesserungen mit sich!
In diesem Beitrag zeige ich dir ein paar Bilder die ich mit DALL-E 3 erstellt habe. Außerdem erfährst du, wie du DALL-E 3 nutzen kannst und welche Vor- und Nachteile es gibt.
Was ist DALL-E 3?
DALL-E 3 ist ein KI-Bildgenerator. Du kannst damit also KI-Bilder mithilfe einer Texteingabe (genannt: Prompt) erzeugen. Es handelt sich dabei um ein Produkt von OpenAI und um die dritte Version in der DALL-E-Serie. DALL-E 3 ist seit Oktober 2023 verfügbar.
Hier ein Video von meinem YouTube Kanal zu DALL-E 3:
DALL-E 3 nutzen
Es gibt drei Möglichkeiten, wie du DALL-E 3 nutzen kannst:
1. DALL-E 3 kostenlos nutzen in Bing
DALL-E 3 kannst du kostenlos im Bing Image Creator nutzen. Du bekommst 100 Credits pro Monat – damit kannst du 100 x 4 Bilder erzeugen. Unterstützt werden die Browser Chrome, Brave, Microsoft Edge und Firefox.
Voraussetzung für die kostenlose Nutzung ist, dass du einen Microsoft-Account besitzt. Falls du keinen Microsoft-Account hast, kannst du dir hier einen erstellen.
2. DALL-E 3 kostenlos nutzen in Bing Chat
Außerdem ist es möglich KI-Bilder mit DALL-E 3 direkt im Bing Chat zu erzeugen (du benötigst ebenfalls einen Microsoft-Account):
DALL-E 3 direkt in ChatGPT Plus nutzen
Ein weitere Möglichkeit um DALL-E-3 zu nutzen ist die direkte Integration in ChatGPT. Du kannst damit also die Bilder direkt im Chat erzeugen.
Laut diesem YouTube-Video von OpenAI soll es auch möglich sein, damit fortlaufend konsistente Charaktere zu erzeugen.
Allerdings gibt es einen Haken: Diese Funktion wird zunächst nur für ChatGPT Plus und ChatGPT Enterprise Nutzer verfügbar sein. Wenn du also die erweiterten Funktionen von DALL-E-3 nutzen möchtest, musst du für eines dieser Abonnements bezahlen. Bislang ist unklar, ob und wann DALL-E-3 auch in der kostenlosen Version von ChatGPT verfügbar sein wird.
Um DALL-E 3 in ChatGPT Plus zu nutzen, klicke einfach auf GPT-4 und wähle DALL-E 3 (Beta):
Verbesserungen – Vergleich zu DALL-E 2
DALL-E-3 bietet einige Verbesserungen im Vergleich zur vorherigen Version. Es kann Texte besser interpretieren und generiert Bilder, die dem eingegebenen Text näher kommen. Das ist besonders nützlich, wenn man spezifische und detaillierte Bilder erzeugen möchte. Die Genauigkeit und Detailtreue der Bilder wurden also signifikant verbessert.
Selbst bei Verwendung desselben Textprompts liefert DALL-E-3 deutlich bessere Ergebnisse als DALL-E-2:
Das kann DALL-E 3 besser als DALL-E 2:
- Genauigkeit: Es versteht Texte besser und generiert genauere Bilder als seine Vorgänger.
- Detailreichtum: Die erzeugten Bilder sind detailreicher und nuancierter.
- Flexibilität: Es kann mit verschiedenen Arten von Texteingaben umgehen, von einfachen Sätzen bis hin zu detaillierten Absätzen.
Im Vergleich zu DALL-E 2 hat sich also einiges getan. Während die vorherige Version manchmal Wörter oder Beschreibungen ignorierte, ist DALL-E 3 in der Lage, den Text besser zu interpretieren und entsprechende Bilder zu erzeugen.
Beispiele: DALL-E 3 Bilder (+ Prompts)
Hier ein paar Bilder, die ich mit DALL-E 3 erstellt habe. Für die 100%-Ansicht (1024 x 1024 Pixel) klicke einfach auf das jeweilige Bild.
Sicherheitsaspekte – DALL-E 3 zensiert streng
Sicherheit ist ein wichtiger Faktor, wenn es um KI-gesteuerte Tools geht. OpenAI hat bei DALL-E 3 Maßnahmen ergriffen, um die Erstellung von problematischen Inhalten zu verhindern. Das umfasst zum Beispiel gewalttätige, hasserfüllte oder diskriminierende Bilder.
DALL-E 3 hat Mechanismen, die bestimmte Anfragen ablehnen, etwa die Erstellung von Bildern öffentlicher Personen. Das soll Missbrauch vorbeugen (Stichwort: Deep Fake Bilder) und die ethischen Richtlinien von OpenAI einhalten.
Im Vergleich zu anderen KI-Bildgeneratoren sind die Einschränkungen in DALL-E 3 sehr streng. Verwendest du Wörter wie sexy, Bikini, etc., wird die Bildgenerierung sofort abgebrochen.
Tipp: KI-Bilder ohne Zensur kannst du übrigens mit dem Tool Supermachine erzeugen.
Passend dazu habe ich auch ein kleines Experiment gestartet: Wie sexy ist künstliche Intelligenz?
Digitales Wasserzeichen
Alle Bilder die du mit dem Bing Image Creator generierst bekommen außerdem ein unsichtbares digitales Wasserzeichen in Übereinstimmung mit der C2PA-Spezifikation. Dieses Wasserzeichen liefert Informationen über die Erstellungszeit und das Datum des Bildes und bestätigt, dass es mit künstlicher Intelligenz generiert wurde.
Vorteile und Nachteile
Hier noch eine schnelle Zusammenfassung der Vor- und Nachteile von DALL-E 3:
Vorteile:
- Kostenlos nutzbar
- Sehr gute Bildqualität (kann mit Stable Diffusion XL & Midjourney mithalten)
- Kann bald auch direkt in ChatGPT Plus und Enterprise genutzt werden
Nachteile:
- Kann Bilder nur im quadratischen Format erzeugen
- Strenge Zensur
- Bilderstellung beschränkt auf 100 Credits pro Monat
Alternativen zu DALL-E 3
Sehr gute Alternativen zu DALL-E 3 findest du in meinem Beitrag über die besten KI-Bildgeneratoren.
Viele Alternativen basieren auf Stable Diffusion sowie Stable Diffusion XL.