AI tutorial

Tutoriel Chirp : Comment utiliser le modèle IA de reconnaissance vocale de Google

Image depicting the step-by-step process of setting up Google's Chirp speech-to-text model.

Introduction

Chirp est le modèle de discours avancé à 2B paramètres de Google Cloud, développé grâce à un entraînement auto-supervisé utilisant des millions d'heures d'audio et 28 milliards de phrases de texte dans plus de 100 langues. Avec une précision impressionnante de 98 % dans la reconnaissance de la parole anglaise et des améliorations significatives dans diverses langues moins parlées, Chirp présente une opportunité passionnante pour les développeurs et les entreprises d'améliorer l'accessibilité et l'expérience utilisateur.

Que couvrirons-nous ?

Ce tutoriel vous fournira un processus détaillé, étape par étape, pour configurer la console Google Cloud afin d'exploiter les capacités du modèle AI de Chirp speech-to-text. Voici ce à quoi vous pouvez vous attendre :

  • Comment naviguer dans la console Google Cloud.
  • Comment configurer le modèle de reconnaissance vocale Chirp dans l'environnement Google Cloud.
  • Réalisation d'une transcription sur un fichier audio et obtention des résultats.

Prérequis

Pour commencer, tout ce dont vous avez besoin est un compte Google Cloud et un appareil avec accès à Internet. N'oubliez pas votre tasse de café !

Commencer

Étape 1 : Créer un compte Google Cloud

Si vous n'avez pas encore de compte Google Cloud, vous pouvez en créer un facilement. Suivez ce lien pour créer un compte gratuit.

Étape 2 : Créer un nouveau projet

  1. Dans le coin supérieur gauche, cliquez sur le menu déroulant des projets.
  2. Choisissez Nouveau projet.
  3. Entrez un nom pour votre projet et cliquez sur Créer.

Étape 3 : Activer l'API Speech

Accédez à la section Speech dans la console Google Cloud et cliquez sur ACTIVER L'API.

Étape 4 : Créer un reconnaisseur STT

  1. Dans la navigation du panneau latéral gauche, cliquez sur Reconnaisseurs, puis sélectionnez CRÉER DES RECONNAISSEURS.
  2. Nommer votre reconnaisseur chirp-recognizer.
  3. Sélectionnez Chirp comme modèle et en-US pour la langue.
  4. Laissez le reste des paramètres par défaut et cliquez sur Enregistrer.

Étape 5 : Créer un nouvel espace de travail

  1. Ouvrez le menu déroulant Espace de travail et cliquez sur Nouveau Workspace.
  2. Une barre latérale apparaîtra ; sélectionnez Parcourir puis Créer un nouveau bucket.
  3. Nommez votre bucket chirp-bucket et cliquez sur Continuer.
  4. Tous les autres paramètres peuvent rester par défaut ; cliquez sur Créer.
  5. Terminez en cliquant sur Sélectionner, puis sur Continuer, et enfin sur Créer.

Étape 6 : Créer une nouvelle transcription

Pour effectuer une transcription de votre fichier audio :

  1. Accédez à la navigation du panneau latéral gauche et sélectionnez Transcription > Nouvelle transcription.
  2. Ici, vous aurez la possibilité de télécharger des fichiers audio soit de votre machine locale, soit d'un fichier existant dans Google Cloud Storage.
  3. Utilisez l'option Téléchargement local et sélectionnez votre fichier audio.
  4. L'interface utilisateur évaluera automatiquement les paramètres de votre fichier audio, que vous pouvez ajuster si nécessaire.
  5. Cliquez sur Continuer.
  6. Assurez-vous que la version de l'API est définie sur V2, et spécifiez la langue comme anglais (États-Unis) - en-US.
  7. Sélectionnez Chirp comme modèle de transcription et votre chirp-recognizer.
  8. Ensuite, cliquez sur Soumettre et attendez quelques instants.

Étape 7 : Afficher les résultats de la transcription et télécharger

Pour voir vos résultats de transcription :

  1. Cliquez sur le nom de votre transcription pour accéder aux résultats.
  2. Téléchargez la transcription dans des formats tels que JSON, TXT, SRT ou CSV. Par exemple, pour télécharger au format TXT, cliquez sur Télécharger > TXT.

Conclusion

Ce guide vous a permis de parcourir l'ensemble du processus de mise en œuvre du modèle AI speech-to-text de Google Chirp sur la console Google Cloud. Avec ces instructions étape par étape, vous pouvez tirer pleinement parti des capacités de Chirp pour une reconnaissance vocale de haute précision.

Équipé des connaissances de ce tutoriel, n'hésitez pas à explorer et à appliquer les fonctionnalités de Google Chirp dans vos projets. Rejoignez-nous lors de notre prochain hackathon AI pour tester vos compétences et expérimenter !

Si vous avez des questions ou besoin d'aide supplémentaire, n'hésitez pas à me contacter sur LinkedIn ou Twitter.

En lire plus

Build your first autonomous agent with SuperAGI framework in this tutorial.
Tutorial on using Stable Diffusion to generate images from book characters.

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés.

Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.