Qu'est-ce qu'Audiocraft ?
Le 9 juin 2023, Meta a annoncé le lancement de Audiocraft, un outil innovant d'IA spécialisé dans la génération musicale et le traitement audio, propulsé par une technologie avancée d'apprentissage profond. Contrairement à MusicLM de Google, Audiocraft se distingue en tant que plateforme open-source, offrant aux utilisateurs la flexibilité d'explorer et de créer sans contraintes.
Prérequis pour l'installation
- Python 3.9 ou version ultérieure
- Gestionnaire de paquets pip
- PyTorch 2.0
- ffmpeg
Avant d'installer PyTorch, vous pouvez utiliser la commande suivante dans votre terminal :
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
Pour installer ffmpeg, exécutez la commande :
brew install ffmpeg
Installation d'Audiocraft
Pour commencer avec Audiocraft, clonez le dépôt GitHub et naviguez jusqu'au dossier téléchargé :
git clone https://github.com/facebookresearch/audiocraft.git
Ensuite, installez les bibliothèques requises en exécutant :
pip install -r requirements.txt
Une fois l'installation terminée, vous êtes prêt à commencer à créer de la musique !
Créer de la musique avec Audiocraft
Pour utiliser MusicGen, le module spécifique pour la création de musique, Meta propose une interface utilisateur Gradio conviviale. Lancez-la en saisissant la commande suivante :
python app.py
Cela démarrera l'interface à http://127.0.0.1:7860/, où vous pourrez interagir avec l'application et même générer une URL publique pour la collaboration.
Choisir votre modèle
Audiocraft vous permet de choisir parmi quatre modèles différents, ce qui influence fortement la sortie musicale :
- facebook/musicgen-melody : Génère de la musique avec des mélodies basées sur un fichier musical téléchargé.
- Autres : Produisent de la musique plus ambiante en utilisant uniquement des entrées textuelles.
Lorsque vous commencez à expérimenter, attendez-vous à ce que la configuration initiale prenne plus de temps, surtout si votre machine ne dispose pas d'un GPU puissant.
Comprendre les limites de durée
La durée maximale par défaut d'une chanson est limitée à 120 secondes. Cependant, vous pouvez modifier cette valeur pour créer des morceaux plus longs. Ouvrez le fichier musicgen_app.py
dans le dossier demos
et localisez la variable duration
(généralement autour de la ligne 240). Modifiez-la à la longueur souhaitée, enregistrez et redémarrez le programme pour appliquer la modification.
Générer une chanson de pleine longueur (par exemple, 3:20 minutes) sur une machine avec 16 Go de RAM peut prendre du temps, donc la patience est essentielle.
Intégrer Audiocraft dans votre projet
Maintenant, explorons comment intégrer Audiocraft dans un code existant. Voici une approche simple pour créer une application qui génère de la musique basée sur une description de chanson dérivée d'une URL.
Guide étape par étape
- Créez un nouveau dossier nommé
audiocraft_app
. - Dans ce dossier, créez un fichier appelé
audiocraft_app.py
et un fichierrequirements.txt
. - Remplissez le fichier requirements.txt avec les bibliothèques nécessaires.
- Installez les bibliothèques requises en exécutant :
- Écrivez le code nécessaire dans le fichier
audiocraft_app.py
.
pip install -r requirements.txt
Exécutez l'application avec :
streamlit run audiocraft_app.py
Votre application devrait être accessible à http://localhost:8501/. Insérez votre clé API OpenAI, sélectionnez le modèle ChatGPT approprié en fonction de la longueur du contenu et fournissez l'URL.
Conclusion
Audiocraft représente une frontière passionnante dans la génération musicale propulsée par l'IA. Sa flexibilité et sa nature open-source offrent d'innombrables possibilités pour les musiciens et les développeurs. En vous plongeant dans la création avec Audiocraft, n'oubliez pas de partager vos chefs-d'œuvre musicaux !
Laisser un commentaire
Tous les commentaires sont modérés avant d'être publiés.
Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.