Tutoriel sur la diffusion stable : créez des variations d'images épous

Introduction à la diffusion stable

La diffusion stable est un modèle de diffusion latente innovant de texte à image développé par des chercheurs et des ingénieurs de CompVis, Stability AI et LAION. Principalement entraîné sur des images de 512x512 pixels tirées d'un sous-ensemble de la base de données LAION-5B, il représente un bond significatif dans la technologie de l'IA générative.

Qu'est-ce que les diffuseurs Lambda ?

Cette version de la diffusion stable a été affinée à partir de l'original CompVis/stable-diffusion-v1-3 pour accepter les embeddings d'image CLIP au lieu des embeddings de texte traditionnels. Cette modification permet la création de "variations d'image", de la même manière que ce que réalise DALLE-2, offrant une approche plus polyvalente de la synthèse d'image.

Les capacités améliorées, y compris ce poids, ont été portées avec succès à la bibliothèque Diffusers de Hugging Face. Pour utiliser cette fonctionnalité, les utilisateurs doivent accéder au référentiel des diffuseurs Lambda.

Comment utiliser les variations d'image de la diffusion stable avec les diffuseurs Lambda

Dans ce tutoriel, nous allons explorer comment utiliser les variations d'image de la diffusion stable en mettant en œuvre les diffuseurs Lambda. Nous tirerons parti des puissants outils de Google Colab et Google Drive pour rationaliser le processus.

Préparer les dépendances

Pour commencer, nous devons télécharger les fichiers nécessaires et installer les bibliothèques requises. Décomposons cela en étapes simples :

Étape 1 : téléchargez les fichiers nécessaires

Commencez par télécharger les modèles et les fichiers associés qui sont essentiels pour exécuter le modèle de diffusion.

Étape 2 : installez les bibliothèques requises

Ouvrez Google Colab.
Utilisez les commandes suivantes pour installer les paquets nécessaires :

!pip install torch torchvision  # Exemple de bibliothèques requises

Étape 3 : Importez les bibliothèques requises

Une fois les bibliothèques installées, il est temps de les importer dans votre environnement Colab.

import torch
from diffusers import StableDiffusionPipeline

Processus image à image

Ensuite, décrivons les étapes clés nécessaires pour créer des variations d'image :

Étape 4 : chargez le pipeline

C'est ici que nous allons charger le modèle de génération d'images de diffusion stable.

pipe = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-3")

Étape 5 : téléchargez l'image initiale

Choisissez une image de votre environnement ou d'une source en ligne que vous souhaitez modifier à l'aide du modèle.

Étape 6 : générez les images

Maintenant, passons à la génération de variations de l'image initiale :

image = pipe(image)[0]

Étape 7 : exécutez le modèle

Une fois de plus, exécutez le modèle sur votre image pour créer des variations.

Étape 8 : enregistrez les images de sortie

Assurez-vous d'enregistrer vos images générées pour une utilisation future.

image.save("generated_image.jpeg")

Étape 9 : affichez les images générées

Après que les variations aient été créées, vous pouvez les afficher à l'aide du code suivant :

from PIL import Image
import matplotlib.pyplot as plt
img_opened = Image.open("generated_image.jpeg")
plt.imshow(img_opened)

Conclusion

Comme démontré dans ce guide, les capacités de variation d'image de la diffusion stable utilisant les diffuseurs Lambda ouvrent des opportunités passionnantes pour la créativité et l'innovation. Un grand merci à Hassen Shair pour son aide avec ce tutoriel ! Commencez à expérimenter avec les variations d'image aujourd'hui et explorez le potentiel créatif de la diffusion stable.

Ouvrir dans Colab

Cliquez sur le lien ci-dessous pour ouvrir ce tutoriel directement dans Google Colab :

Ouvrir dans Google Colab

Tutoriel sur la diffusion stable : créez des variations d'images époustouflantes avec les diffuseurs Lambda