Stable Diffusion Tutorial: Prototyping mit der Web-Oberfläche

Was ist Stable Diffusion?

Stable Diffusion ist ein bahnbrechendes Deep-Learning-Modell zur Text-zu-Bild-Diffusion, das 2022 eingeführt wurde. Diese innovative Technologie ist hauptsächlich dafür konzipiert, Bilder basierend auf Textbeschreibungen zu generieren, sodass Benutzer ihre geschriebenen Ideen in lebendige visuelle Darstellungen verwandeln können. Neben der Bilderzeugung unterstützt Stable Diffusion auch verschiedene Aufgaben, einschließlich Inpainting, Outpainting und Bild-zu-Bild-Übersetzung, die durch Texteingaben geleitet werden, was es zu einem vielseitigen Werkzeug in der Welt der künstlichen Intelligenz macht.

Wie man die Stable Diffusion Web-Oberfläche lokal nutzt

Für diejenigen, die das Modell lokal testen möchten, hat der GitHub-Nutzer AUTOMATIC1111 eine Stable Diffusion Web-Oberfläche entwickelt, die es Benutzern ermöglicht, in einer benutzerfreundlichen Umgebung Experimente durchzuführen. Diese Web-Oberfläche wurde mit Gradio erstellt, einer Python-Bibliothek, die die Erstellung von UI-Komponenten erleichtert.

Funktionen der Web-Oberfläche

Original txt2img- und img2img-Modi
Ein-Klick-Installations- und Ausführungsskript (erfordert die Installation von Python und Git)
Outpainting
Inpainting
Farbskizze
Prompt-Matrix
Stable Diffusion Upscale
Fähigkeit, Teile des Textes anzugeben, auf die sich das Modell konzentrieren soll
Extras-Tab einschließlich:
- GFPGAN: Neuralnetzwerk zur Wiederherstellung von Gesichtern
- CodeFormer: Ein alternatives Werkzeug zur Gesichtswiederherstellung
- RealESRGAN: Neuralnetzwerk-Scaler
- ESRGAN: Erweiterte Upscaling-Optionen
- SwinIR und Swin2SR: Erweiterte Scaler
- LDSR: Latente Diffusionssuperauflösung
Verschiedene Optionen für das Seitenverhältnis der Größe
Zufälliger Künstler-Button: Generiert Bilder im Stil zufälliger Künstler
Stile: Teile von Eingaben leicht speichern und anwenden
Variationen: Ähnliche Bilder mit leichten Unterschieden generieren

Wie man die Web-Oberfläche benutzt

Für Windows-Benutzer

Laden Sie Python 3.10.6 herunter und installieren Sie es, und vergewissern Sie sich, dass Sie während der Installation "Python zu PATH hinzufügen" aktivieren.
Installieren Sie Git.
Klonen Sie das Repository, indem Sie den Befehl ausführen: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
Platzieren Sie model.ckpt im models-Verzeichnis (siehe Abhängigkeiten für die Modellquelle).
(Optional) Platzieren Sie GFPGANv1.4.pth im Basisverzeichnis neben webui.py.
Führen Sie webui-user.bat aus dem Windows-Explorer als normaler Benutzer (nicht als Administrator) aus.

Für Linux-Benutzer

Um in /home/$(whoami)/stable-diffusion-webui/ zu installieren, verwenden Sie die entsprechenden Befehle für Ihre Distribution, um die Abhängigkeiten zu verwalten.

Für Apple-Silicon-Benutzer

Anweisungen und Kompatibilitätsdetails finden Sie in den offiziellen Dokumentationslinks, die im GitHub-Repository bereitgestellt werden.

Zusätzliche Ressourcen

Für optimierte Eingaben und zur Maximierung der Ergebnisse mit Stable Diffusion wird dringend empfohlen, unseren Stable Diffusion Prompt Guide zu lesen. Wenn Sie daran interessiert sind, Ihre eigenen Stable Diffusion-basierten Werkzeuge zu entwickeln, ziehen Sie in Betracht, an unserem Stable Diffusion AI Hackathon teilzunehmen!

Bleiben Sie auf dem Laufenden mit den neuesten Trends in der KI-Bilderzeugung, indem Sie verwandte Diskussionen und Veröffentlichungen auf diesem Gebiet verfolgen.