AI tools

Tutoriel Audiocraft : Créez de la musique facilement avec l'outil IA de Meta

Audiocraft tutorial on creating music with artificial intelligence.

Qu'est-ce qu'Audiocraft ?

Le 9 juin 2023, Meta a annoncé le lancement de Audiocraft, un outil innovant d'IA spécialisé dans la génération musicale et le traitement audio, propulsé par une technologie avancée d'apprentissage profond. Contrairement à MusicLM de Google, Audiocraft se distingue en tant que plateforme open-source, offrant aux utilisateurs la flexibilité d'explorer et de créer sans contraintes.

Prérequis pour l'installation

  • Python 3.9 ou version ultérieure
  • Gestionnaire de paquets pip
  • PyTorch 2.0
  • ffmpeg

Avant d'installer PyTorch, vous pouvez utiliser la commande suivante dans votre terminal :

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

Pour installer ffmpeg, exécutez la commande :

brew install ffmpeg

Installation d'Audiocraft

Pour commencer avec Audiocraft, clonez le dépôt GitHub et naviguez jusqu'au dossier téléchargé :

git clone https://github.com/facebookresearch/audiocraft.git

Ensuite, installez les bibliothèques requises en exécutant :

pip install -r requirements.txt

Une fois l'installation terminée, vous êtes prêt à commencer à créer de la musique !

Créer de la musique avec Audiocraft

Pour utiliser MusicGen, le module spécifique pour la création de musique, Meta propose une interface utilisateur Gradio conviviale. Lancez-la en saisissant la commande suivante :

python app.py

Cela démarrera l'interface à http://127.0.0.1:7860/, où vous pourrez interagir avec l'application et même générer une URL publique pour la collaboration.

Choisir votre modèle

Audiocraft vous permet de choisir parmi quatre modèles différents, ce qui influence fortement la sortie musicale :

  • facebook/musicgen-melody : Génère de la musique avec des mélodies basées sur un fichier musical téléchargé.
  • Autres : Produisent de la musique plus ambiante en utilisant uniquement des entrées textuelles.

Lorsque vous commencez à expérimenter, attendez-vous à ce que la configuration initiale prenne plus de temps, surtout si votre machine ne dispose pas d'un GPU puissant.

Comprendre les limites de durée

La durée maximale par défaut d'une chanson est limitée à 120 secondes. Cependant, vous pouvez modifier cette valeur pour créer des morceaux plus longs. Ouvrez le fichier musicgen_app.py dans le dossier demos et localisez la variable duration (généralement autour de la ligne 240). Modifiez-la à la longueur souhaitée, enregistrez et redémarrez le programme pour appliquer la modification.

Générer une chanson de pleine longueur (par exemple, 3:20 minutes) sur une machine avec 16 Go de RAM peut prendre du temps, donc la patience est essentielle.

Intégrer Audiocraft dans votre projet

Maintenant, explorons comment intégrer Audiocraft dans un code existant. Voici une approche simple pour créer une application qui génère de la musique basée sur une description de chanson dérivée d'une URL.

Guide étape par étape

  1. Créez un nouveau dossier nommé audiocraft_app.
  2. Dans ce dossier, créez un fichier appelé audiocraft_app.py et un fichier requirements.txt.
  3. Remplissez le fichier requirements.txt avec les bibliothèques nécessaires.
  4. Installez les bibliothèques requises en exécutant :
  5. pip install -r requirements.txt
  6. Écrivez le code nécessaire dans le fichier audiocraft_app.py.

Exécutez l'application avec :

streamlit run audiocraft_app.py

Votre application devrait être accessible à http://localhost:8501/. Insérez votre clé API OpenAI, sélectionnez le modèle ChatGPT approprié en fonction de la longueur du contenu et fournissez l'URL.

Conclusion

Audiocraft représente une frontière passionnante dans la génération musicale propulsée par l'IA. Sa flexibilité et sa nature open-source offrent d'innombrables possibilités pour les musiciens et les développeurs. En vous plongeant dans la création avec Audiocraft, n'oubliez pas de partager vos chefs-d'œuvre musicaux !

En lire plus

Learn to create an animated Pixar-style avatar using Stable Diffusion.
A graphic representation of integrating DALLE 2 API with TruLens for enhanced image analysis.

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés.

Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.