Allegro API

Créer une application avec Aria et Allegro : Créez des vidéos de faits amusants à partir de photos de voyage

An example of a travel photo transformed into a fun fact video.

Créer une application avec Aria et Allegro : Transformer des photos de voyage en vidéos de faits amusants

Bonjour ! C'est Tommy ici, et aujourd'hui, je suis ravi de vous guider à travers un projet où nous allons transformer des photos de voyage en vidéos de faits amusants. En utilisant l'API Aria de Rhymes AI pour analyser les images, nous allons générer des descriptions de scènes riches et les animer avec le modèle texte-en-vidéo d'Allegro. Ce tutoriel vous permet d'explorer le potentiel créatif de ces outils de manière ludique et pratique.

Que vous cherchiez à expérimenter avec des API multimodales ou curieux des intégrations d'applications uniques, ce guide vous aidera à adapter ces outils à vos projets. Restez jusqu'à la fin pour un lien vers le carnet Colab afin que vous puissiez suivre directement.

Commencer avec la configuration

Pour commencer, configurons notre environnement et installons les bibliothèques nécessaires. Voici ce dont vous aurez besoin :

  • Python 3.x
  • Bibliothèques requises : Rhymes AI, Requests, et toute autre dépendance.

Une fois que nous avons installé les exigences, nous pouvons passer aux sections de préparation d'image et d'intégration API.

Préparer votre image au format Base64

La première étape consiste à convertir votre image au format base64, ce qui nous permettra de l'envoyer via l'API Aria. Voici une fonction pour gérer la conversion :

def image_to_base64(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

Utilisation : Fournissez votre chemin d'image à image_to_base64() pour obtenir la chaîne encodée en base64.

Analyser l'image avec l'API d'Aria

Maintenant que nous avons préparé l'image, utilisons l'API multimodale d'Aria pour l'analyser. Cette API renverra un ensemble de descriptions de scènes qui donneront vie à l'emplacement de la photo. Assurez-vous de remplacer userdata.get('ARIA_API_KEY') par votre propre clé API, ou mettez à jour le secret dans Colab avec le même paramètre.

Créer une tâche vidéo avec Allegro

Utilisons maintenant l'API texte-en-vidéo d'Allegro pour créer une vidéo basée sur les descriptions de scènes. Cette fonction initie une tâche de génération vidéo, que nous allons interroger dans la section suivante en utilisant le request_id retourné ici.

N'oubliez pas de remplacer userdata.get('ALLEGRO_API_KEY') par votre véritable clé API Allegro ou de la définir comme un secret Colab avec le même paramètre.

Utilisation : Remplacez userdata.get('ALLEGRO_API_KEY') par votre jeton API Allegro. Exécutez la fonction et capturez le request_id, que nous utiliserons pour interroger le statut de la vidéo.

Remarque : Lorsque vous appelez le point de terminaison de création de tâche vidéo, sachez que si vous atteignez à nouveau le point de terminaison dans un intervalle de 2 minutes, vous pourriez rencontrer un message d'erreur : "Le taux de demande pour le modèle Allegro a dépassé la limite autorisée. Veuillez patienter et réessayer plus tard". Cette réponse est accompagnée d'un code de statut 500, indiquant qu'il est nécessaire d'attendre brièvement entre les demandes pour éviter la limitation de taux.

Vérification du statut de génération de vidéo

Parce qu'Allegro peut prendre environ 2 minutes pour traiter la vidéo, nous ajouterons un délai time.sleep() avant l'interrogation.

Lorsque vous exécuterez cela, Allegro renverra un lien vers la vidéo stockée dans un bucket S3 :

Afficher l'image de la vidéo générée

Voici à quoi pourrait ressembler la vidéo générée :

Capture d'écran de la vidéo générée

Une fois le lien de la vidéo récupéré, j'ai capturé une capture d'écran de la vidéo pour montrer le résultat. Cette image vous donne une idée de ce à quoi pourrait ressembler la sortie finale lorsque vous suivez ces étapes pour transformer une photo de voyage en une vidéo dynamique.

Trouvez le lien vers le carnet Google Colab de ce tutoriel ici.

Conclusion

Félicitations ! Vous avez réussi à créer une application qui transforme une photo de voyage en une vidéo de faits amusants. En utilisant Aria pour générer des descriptions de scènes convaincantes et Allegro pour les donner vie en format vidéo, vous avez exploité le potentiel des applications d'IA multimodales.

Pour une personnalisation plus poussée et une configuration plus avancée, consultez la documentation détaillée ici. Ce tutoriel ouvre la porte à d'innombrables possibilités avec Aria et Allegro, que vous créiez du contenu inspiré des voyages, des matériaux éducatifs ou tout autre média créatif.

Profitez de vos explorations, et laissez votre imagination vous guider vers de nouvelles idées et projets !

Prochaines étapes

Voici quelques étapes pratiques pour étendre votre application :

  • Intégrer plus d'API pour des fonctionnalités améliorées.
  • Ajouter une authentification utilisateur pour personnaliser le contenu.
  • Expérimenter avec différents formats et styles vidéo.

En lire plus

A visual guide to creating an intelligent assistant with IBM watsonx Assistant.
OpenAI Swarm visual representation of agent orchestration concepts.

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés.

Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.