Was ist Stable Diffusion?
Stable Diffusion ist ein hochmodernes Deep-Learning-Modell zur Bildgenerierung aus Text, das 2022 veröffentlicht wurde. Dieses innovative Modell ist hauptsächlich darauf ausgelegt, detaillierte und hochwertige Bilder basierend auf textuellen Beschreibungen zu generieren. Seine Vielseitigkeit ermöglicht jedoch verschiedene Anwendungen, einschließlich Aufgaben wie Inpainting (Ausfüllen fehlender Teile eines Bildes), Outpainting (Erweitern von Bildern über ihre ursprünglichen Grenzen hinaus) und bild-zu-bild-Übersetzungen, die durch spezifische Texteingaben geleitet werden. Für weitere Informationen über seine Möglichkeiten besuchen Sie Stability.ai.
Erstellen eines Google Cloud Platform (GCP) Kontos
Um die Leistung von Stable Diffusion nutzen zu können, müssen Sie zunächst ein GCP-Konto erstellen. Besuchen Sie Google Cloud Platform, um sich anzumelden. Es ist wichtig, ein Abrechnungskonto einzurichten, da GPU-Ressourcen im kostenlosen Tarif nicht genutzt werden können. Außerdem ist es ratsam, ein Budget mit Benachrichtigungen festzulegen, da GPU-Nutzung recht kostspielig werden kann.
Anforderung des GPU-Zugriffs
Sobald Ihr GCP-Konto eingerichtet ist, navigieren Sie zur Seite APIs & Dienste, um die Compute Engine API zu aktivieren. Suchen Sie nach der Compute Engine API und klicken Sie auf Aktivieren. Danach müssen Sie die Möglichkeit anfordern, virtuelle Maschinen zu erstellen, die GPU-Fähigkeiten benötigen. Dies kann erfolgen, indem Sie zum Abschnitt Kontingente gehen und nach GPUs in allen Regionen filtern. Fordern Sie eine Erhöhung von 0 auf 1 an und geben Sie einen Grund an, wie "Verwendung eines ML-Modells, das eine GPU erfordert". Bitte haben Sie Geduld, da die Genehmigung ein oder zwei Tage dauern kann. Weitere Einzelheiten finden Sie unter Google Cloud Compute Kontingente.
Erstellen einer VM-Instanz
Als Nächstes müssen Sie eine virtuelle Maschine (VM) instanziieren. Gehen Sie zu Google Cloud Console und klicken Sie auf Instanz erstellen. Geben Sie Ihrer Instanz einen Namen; wir verwenden stable-diffusion-instance für dieses Beispiel. Wählen Sie eine Region aus, die GPUs unterstützt – Sie müssen möglicherweise einige Optionen ausprobieren. Unter Maschinenkonfiguration wählen Sie die Option für GPUs. Wenn Sie hohe Leistung suchen und die Kosten tragen können, ist die A100-GPU die beste Wahl, während die T4 eine budgetfreundlichere Auswahl ist, die bei kontinuierlichem Betrieb etwa 300 USD/Monat kostet.
Wählen Sie als Maschinentyp n1-standard-4, der 15 GB RAM bereitstellt – ausreichend für die meisten Aufgaben, obwohl mehr je nach Ihren spezifischen Anforderungen vorteilhaft sein kann. Stellen Sie sicher, dass Sie die Bootlaufwerkseinstellungen anpassen; wählen Sie Ändern unter Bootlaufwerk und entscheiden Sie sich für die Option Deep Learning VM basierend auf Debian 10. Möglicherweise möchten Sie die Größe des Bootlaufwerks anpassen (50 GB sind minimal). Unter Firewall aktivieren Sie sowohl HTTP-Verkehr zulassen als auch HTTPS-Verkehr zulassen.
In den Erweiterte Optionen unter Netzwerk fügen Sie ein Netzwerk-Tag wie stable-diffusion-tag hinzu, um diese Instanz später zu identifizieren.
Erstellen einer Firewall-Regel
Um schnell auf Ihre Instanz zuzugreifen, besuchen Sie die Seite der Firewall-Regeln und klicken Sie auf Firewall-Regel erstellen. Nennen Sie diese Regel stable-diffusion-rule, und wählen Sie für Ziele Tags (geben Sie das Tag stable-diffusion-tag ein). Für Quell-IP-Bereiche geben Sie 0.0.0.0/0 ein, und unter Protokolle und Ports fügen Sie tcp:5000 hinzu, bevor Sie auf Erstellen klicken.
Zugriff auf die Compute-Instanz
Die einfachste Methode, um auf Ihre Instanz zuzugreifen, ist über SSH direkt von der Konsole. Navigieren Sie zur Liste der Compute-Instanzen und klicken Sie auf die, die Sie gerade erstellt haben, um eine Verbindung herzustellen.
Einrichten von Stable Diffusion auf der Instanz
Nach dem ersten Login in Ihre Instanz werden Sie aufgefordert, den Nvidia-Treiber zu installieren – antworten Sie einfach mit 'Y'. Beachten Sie, dass Sie jedes Mal, wenn Sie die VM stoppen und neu starten, diese Treiber erneut installieren müssen.
Der nächste Schritt besteht darin, die erforderlichen Repositories zu klonen und Cog zu installieren, das eine effiziente Möglichkeit bietet, Machine-Learning-Modelle auf dieser VM ohne zusätzliche Installationen zu verwalten und bereitzustellen, da Docker vorinstalliert ist. Führen Sie die erforderlichen Befehle aus, um Ihre Umgebung einzurichten.
Erstellen des Docker-Images
Um das Modell auszuführen, laden Sie die Gewichte von Hugging Face herunter. Sie müssen ein Konto einrichten und ein Authentifizierungstoken generieren, falls Sie dies noch nicht getan haben. Sobald Sie Ihr Token haben, nutzen Sie es, um die Gewichte mit Ihrem Skript herunterzuladen. Nachdem die Installation abgeschlossen ist, können Sie testen, ob das Modell funktionsfähig ist.
Wenn alles reibungslos läuft, sollten Sie ein generiertes Bild, output-1.png, finden, das Sie über das Terminal herunterladen können. Verwenden Sie den Befehl pwd, um Ihr Arbeitsverzeichnis festzustellen, das in der Regel einen Pfad wie /home//cog-stable-diffusion zurückliefert. Dieser Pfad wird wichtig sein, um ihn als Volume festzulegen, wenn Sie das Stable-Diffusion-Docker-Image starten, um den Zugriff auf Ihre Hugging Face-Gewichte zu ermöglichen.
Wie teste ich die API?
Beim Testen der API sollten Sie sich bewusst sein, dass die Antwortnutzlast base64-kodiert ist. Um diese zu dekodieren, können Sie ein Online-Tool wie Code Beautify Base64 Decoder verwenden.
Zusätzliche Funktionen erkunden
Für Benutzer, die daran interessiert sind, kurze Videos zu erstellen, sehen Sie sich Deforum an, das ein robustes Modell zur Videoerstellung unter Verwendung ähnlicher Methoden bietet. Prüf es aus unter Deforum auf Replicate. Um es zu verwenden, stoppen Sie einfach den aktuellen Container und befolgen Sie die erforderlichen Schritte.
Fazit
Danke, dass Sie dieses umfassende Tutorial zur Einrichtung von Stable Diffusion gelesen haben. Wenn Sie diesen Leitfaden hilfreich fanden, können Sie weitere Tutorials und Ressourcen auf unserer speziellen Tutorial-Seite entdecken. Bleiben Sie dran für weitere Einblicke und Innovationen im Bereich KI!
Hinterlasse einen Kommentar
Alle Kommentare werden vor der Veröffentlichung geprüft.
Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.