AI Image Generation

Stabile Diffusion Tutorial: Prototyping mit der Web-Oberfläche

An illustrative guide to using Stable Diffusion Web UI for image generation.

Was ist Stable Diffusion?

Stable Diffusion ist ein bahnbrechendes Deep-Learning-Text-zu-Bild-Diffusionsmodell, das 2022 veröffentlicht wurde. Dieses innovative Werkzeug hat die Art und Weise revolutioniert, wie wir Bilder basierend auf Textbeschreibungen erzeugen. Während seine Hauptfunktion darin besteht, visuell eindrucksvolle Bilder aus textlichen Eingaben zu erstellen, bietet es eine Vielzahl anderer Anwendungen, einschließlich Inpainting, Outpainting und Bild-zu-Bild-Übersetzung, die alle durch spezifische Texteingaben gesteuert werden.

So verwenden Sie die Stable Diffusion Web-Oberfläche lokal

Wenn Sie das Modell in Ihrer lokalen Umgebung testen möchten, können Sie die Stable Diffusion Web-Oberfläche nutzen, die von dem Benutzer AUTOMATIC1111 auf GitHub entwickelt wurde. Diese Oberfläche ermöglicht es Ihnen, Ihre Ideen effizient zu validieren und basiert auf Gradio, einer beliebten Python-Bibliothek zur Erstellung von UI-Komponenten.

Funktionen der Stable Diffusion Web-Oberfläche

  • Originale txt2img- und img2img-Modi: Konvertieren Sie textliche Eingaben einfach in Bilder und umgekehrt.
  • Ein-Klick-Installations- und Ausführungs-Skript: Vereinfacht den Prozess, obwohl zuvor Python und Git installiert werden müssen.
  • Outpainting: Erweitern Sie Bilder über ihre ursprünglichen Grenzen hinaus.
  • Inpainting: Reparieren oder modifizieren Sie spezifische Bereiche innerhalb eines Bildes.
  • Far Skizze: Generiert Farbschilderungen basierend auf Eingaben.
  • Prompt-Matrix: Verwalten Sie mehrere Eingaben effizient.
  • Stable Diffusion Upscale: Verbessern Sie die Bildqualität mit fortschrittlichen Techniken.
  • Aufmerksamkeit: Leiten Sie den Fokus des Modells auf spezifische Textelemente für bessere Ergebnisse.
  • Extras-Registerkarte mit verschiedenen Werkzeugen:
    • GFPGAN: Ein neuronales Netzwerk, das darauf abzielt, Gesichtsbilder zu reparieren.
    • CodeFormer: Ein Gesichtswiederherstellungstool, das als Alternative zu GFPGAN dient.
    • RealESRGAN: Ein neuronales Netzwerk zur Verbesserung von Bildern.
    • ESRGAN: Ein weiteres Upscaling-neuronales Netzwerk, das Drittanbieter-Modelle unterstützt.
    • SwinIR und Swin2SR: Fortschrittliche neuronale Netzwerk-Upscaler, weitere Details finden Sie hier.
    • LDSR: Latente Diffusions-Super-Auflösungs-Technologie.
  • Optionen zur Größenänderung des Seitenverhältnisses: Passen Sie die Abmessungen einfach an Ihre Bedürfnisse an.
  • Zufällige Künstler-Schaltfläche: Generieren Sie Bilder in verschiedenen künstlerischen Stilen zufällig.
  • Stile: Speichern Sie Segmente von Eingaben zur schnellen Anwendung über Dropdown-Auswahlen.
  • Variationen: Erzeugen Sie leicht unterschiedliche Versionen desselben Bildes.
  • Und vieles mehr...

So verwenden Sie die Web-Oberfläche

Hier sind Schritt-für-Schritt-Anleitungen zur Einrichtung der Stable Diffusion Web-Oberfläche auf Ihrem lokalen Rechner:

Windows

  1. Installieren Sie Python 3.10.6 und stellen Sie sicher, dass Sie "Add Python to PATH" während der Installation aktivieren.
  2. Installieren Sie git.
  3. Klonen Sie das stable-diffusion-webui-Repository, indem Sie git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git ausführen.
  4. Platzieren Sie model.ckpt im Models-Verzeichnis (siehe Abhängigkeiten für Details, wo Sie es finden können).
  5. (Optional) Platzieren Sie GFPGANv1.4.pth im Basisverzeichnis, neben webui.py (Details in Abhängigkeiten).
  6. Führen Sie webui-user.bat aus dem Windows-Explorer als normaler, nicht-administrator Benutzer aus.

Linux

  1. Installieren Sie die benötigten Abhängigkeiten, indem Sie Folgendes eingeben: sudo apt install python3 python3-pip git
  2. Um die Web-Oberfläche in Ihrem Home-Verzeichnis zu klonen, führen Sie aus: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Apple Silicon

Speziell für Apple Silicon finden Sie Anweisungen hier.

Tipps für effektive Stable Diffusion-Eingaben

Um das Beste aus Ihren Eingaben in Stable Diffusion herauszuholen, konsultieren Sie unseren detaillierten Leitfaden für Stable Diffusion-Eingaben.

Darüber hinaus, wenn Sie daran interessiert sind, Ihr eigenes auf Stable Diffusion basierendes Tool zu entwickeln, ziehen Sie in Betracht, an unserem Stable Diffusion AI Hackathon zur Zusammenarbeit und Innovation teilzunehmen!

Weiterlesen

A developer creating engaging stories using ElevenLabs Voice AI technology in a React app.
AI cooking assistant interface with ingredient analysis and recipe suggestions

Hinterlasse einen Kommentar

Alle Kommentare werden vor der Veröffentlichung geprüft.

Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.