AI tools

Stable Diffusion Tutorial: Prototyping mit der Web-Oberfläche

A detailed view of the Stable Diffusion Web UI showcasing its features.

Was ist Stable Diffusion?

Stable Diffusion ist ein bahnbrechendes Deep-Learning-Modell zur Text-zu-Bild-Diffusion, das 2022 eingeführt wurde. Diese innovative Technologie ist hauptsächlich dafür konzipiert, Bilder basierend auf Textbeschreibungen zu generieren, sodass Benutzer ihre geschriebenen Ideen in lebendige visuelle Darstellungen verwandeln können. Neben der Bilderzeugung unterstützt Stable Diffusion auch verschiedene Aufgaben, einschließlich Inpainting, Outpainting und Bild-zu-Bild-Übersetzung, die durch Texteingaben geleitet werden, was es zu einem vielseitigen Werkzeug in der Welt der künstlichen Intelligenz macht.

Wie man die Stable Diffusion Web-Oberfläche lokal nutzt

Für diejenigen, die das Modell lokal testen möchten, hat der GitHub-Nutzer AUTOMATIC1111 eine Stable Diffusion Web-Oberfläche entwickelt, die es Benutzern ermöglicht, in einer benutzerfreundlichen Umgebung Experimente durchzuführen. Diese Web-Oberfläche wurde mit Gradio erstellt, einer Python-Bibliothek, die die Erstellung von UI-Komponenten erleichtert.

Funktionen der Web-Oberfläche

  • Original txt2img- und img2img-Modi
  • Ein-Klick-Installations- und Ausführungsskript (erfordert die Installation von Python und Git)
  • Outpainting
  • Inpainting
  • Farbskizze
  • Prompt-Matrix
  • Stable Diffusion Upscale
  • Fähigkeit, Teile des Textes anzugeben, auf die sich das Modell konzentrieren soll
  • Extras-Tab einschließlich:
    • GFPGAN: Neuralnetzwerk zur Wiederherstellung von Gesichtern
    • CodeFormer: Ein alternatives Werkzeug zur Gesichtswiederherstellung
    • RealESRGAN: Neuralnetzwerk-Scaler
    • ESRGAN: Erweiterte Upscaling-Optionen
    • SwinIR und Swin2SR: Erweiterte Scaler
    • LDSR: Latente Diffusionssuperauflösung
  • Verschiedene Optionen für das Seitenverhältnis der Größe
  • Zufälliger Künstler-Button: Generiert Bilder im Stil zufälliger Künstler
  • Stile: Teile von Eingaben leicht speichern und anwenden
  • Variationen: Ähnliche Bilder mit leichten Unterschieden generieren

Wie man die Web-Oberfläche benutzt

Für Windows-Benutzer

  1. Laden Sie Python 3.10.6 herunter und installieren Sie es, und vergewissern Sie sich, dass Sie während der Installation "Python zu PATH hinzufügen" aktivieren.
  2. Installieren Sie Git.
  3. Klonen Sie das Repository, indem Sie den Befehl ausführen: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
  4. Platzieren Sie model.ckpt im models-Verzeichnis (siehe Abhängigkeiten für die Modellquelle).
  5. (Optional) Platzieren Sie GFPGANv1.4.pth im Basisverzeichnis neben webui.py.
  6. Führen Sie webui-user.bat aus dem Windows-Explorer als normaler Benutzer (nicht als Administrator) aus.

Für Linux-Benutzer

Um in /home/$(whoami)/stable-diffusion-webui/ zu installieren, verwenden Sie die entsprechenden Befehle für Ihre Distribution, um die Abhängigkeiten zu verwalten.

Für Apple-Silicon-Benutzer

Anweisungen und Kompatibilitätsdetails finden Sie in den offiziellen Dokumentationslinks, die im GitHub-Repository bereitgestellt werden.

Zusätzliche Ressourcen

Für optimierte Eingaben und zur Maximierung der Ergebnisse mit Stable Diffusion wird dringend empfohlen, unseren Stable Diffusion Prompt Guide zu lesen. Wenn Sie daran interessiert sind, Ihre eigenen Stable Diffusion-basierten Werkzeuge zu entwickeln, ziehen Sie in Betracht, an unserem Stable Diffusion AI Hackathon teilzunehmen!

Bleiben Sie auf dem Laufenden mit den neuesten Trends in der KI-Bilderzeugung, indem Sie verwandte Diskussionen und Veröffentlichungen auf diesem Gebiet verfolgen.

Weiterlesen

A visual guide to using Lexica, the Stable Diffusion AI image search engine for art.
Creating a Disney Pixar style avatar using Stable Diffusion tutorial

Hinterlasse einen Kommentar

Alle Kommentare werden vor der Veröffentlichung geprüft.

Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.