AI tutorial

Chirp-Tutorial: So verwenden Sie Googles Sprach-zu-Text-KI-Modell

Image depicting the step-by-step process of setting up Google's Chirp speech-to-text model.

Einführung

Chirp ist das fortschrittliche 2B-Parameter-Sprachmodell von Google Cloud, das durch selbstüberwachtes Training mit Millionen von Stunden Audio und 28 Milliarden Sätzen Text in mehr als 100 Sprachen entwickelt wurde. Mit einer beeindruckenden Genauigkeit von 98 % bei der Spracherkennung in Englisch und erheblichen Verbesserungen in verschiedenen weniger gesprochenen Sprachen bietet Chirp eine aufregende Möglichkeit für Entwickler und Unternehmen, die Zugänglichkeit und Benutzererfahrung zu verbessern.

Was werden wir behandeln?

Dieses Tutorial bietet Ihnen einen detaillierten, schrittweisen Prozess zum Einrichten der Google Cloud-Konsole, um die Fähigkeiten des Chirp-Sprach-zu-Text-KI-Modells zu nutzen. Hier ist, was Sie erwarten können:

  • Wie man sich in der Google Cloud-Konsole zurechtfindet.
  • Wie man das Chirp-Sprach-zu-Text-Modell in der Google Cloud-Umgebung einrichtet.
  • Durchführung einer Transkription auf einer Audiodatei und Erhalt von Ergebnissen.

Voraussetzungen

Um zu starten, benötigen Sie nur ein Google Cloud-Konto und ein Gerät mit Internetzugang. Vergessen Sie nicht Ihre Tasse Kaffee!

Loslegen

Schritt 1: Erstellen Sie ein Google Cloud-Konto

Wenn Sie noch kein Google Cloud-Konto haben, können Sie eines ganz einfach erstellen. Folgen Sie diesem Link, um ein kostenloses Konto zu erstellen.

Schritt 2: Erstellen Sie ein neues Projekt

  1. Klicken Sie in der oberen linken Ecke auf das Dropdown-Menü für Projekte.
  2. Wählen Sie Neues Projekt.
  3. Geben Sie einen Namen für Ihr Projekt ein und klicken Sie auf Erstellen.

Schritt 3: Aktivieren Sie die Sprach-API

Navigieren Sie zum Abschnitt Sprache in der Google Cloud-Konsole und klicken Sie auf API aktivieren.

Schritt 4: Erstellen Sie einen STT-Erkenner

  1. Klicken Sie im linken Navigationsbereich auf Erkenner und wählen Sie ERKENNER ERSTELLEN.
  2. Nennen Sie Ihren Erkenner chirp-recognizer.
  3. Wählen Sie Chirp als Modell und en-US für die Sprache.
  4. Die restlichen Einstellungen können auf Standard bleiben; klicken Sie auf Speichern.

Schritt 5: Erstellen Sie einen neuen Arbeitsbereich

  1. Öffnen Sie das Dropdown-Menü für Arbeitsbereiche und klicken Sie auf Neuer Arbeitsbereich.
  2. Ein Seitenbereich wird eingeblendet; wählen Sie Durchsuchen und dann Neuen Bucket erstellen.
  3. Nennen Sie Ihren Bucket chirp-bucket und klicken Sie auf Weiter.
  4. Alle anderen Einstellungen können auf Standard bleiben; klicken Sie auf Erstellen.
  5. Beenden Sie mit einem Klick auf Auswählen, dann Weiter und schließlich Erstellen.

Schritt 6: Erstellen Sie eine neue Transkription

Um eine Transkription auf Ihrer Audiodatei durchzuführen:

  1. Zugriff auf die linke Navigationsleiste und wählen Sie Transkription > Neue Transkription.
  2. Hier haben Sie die Möglichkeit, Audiodateien entweder von Ihrem lokalen Computer oder einer bestehenden Cloud Storage-Datei hochzuladen.
  3. Verwenden Sie die Option Lokaler Upload und wählen Sie Ihre Audiodatei aus.
  4. Die Benutzeroberfläche wird automatisch die Parameter Ihrer Audiodatei bewerten, die Sie bei Bedarf anpassen können.
  5. Klicken Sie auf Weiter.
  6. Stellen Sie sicher, dass die API-Version auf V2 eingestellt ist, und geben Sie die Sprache als Englisch (Vereinigte Staaten) - en-US an.
  7. Wählen Sie Chirp als Transkriptionsmodell und Ihren chirp-recognizer aus.
  8. Klicken Sie dann auf Einreichen und warten Sie einen Moment.

Schritt 7: Transkriptionsergebnisse anzeigen und herunterladen

Um Ihre Transkriptionsergebnisse anzuzeigen:

  1. Klicken Sie auf den Namen Ihrer Transkription, um auf die Ergebnisse zuzugreifen.
  2. Laden Sie die Transkription in Formaten wie JSON, TXT, SRT oder CSV herunter. Zum Beispiel, um als TXT herunterzuladen, klicken Sie auf Herunterladen > TXT.

Zusammenfassung

Dieser Leitfaden hat Sie durch den gesamten Prozess der Implementierung des Sprach-zu-Text-KI-Modells von Google Chirp in der Google Cloud-Konsole geführt. Mit diesen Schritt-für-Schritt-Anleitungen können Sie die vollständigen Möglichkeiten von Chirp für eine hochpräzise Spracherkennung nutzen.

Ausgerüstet mit dem Wissen aus diesem Tutorial, können Sie gerne die Funktionen von Google Chirp in Ihren Projekten erkunden und anwenden. Schließen Sie sich uns bei unserem bevorstehenden AI Hackathon an, um Ihre Fähigkeiten zu testen und zu experimentieren!

Wenn Sie Fragen haben oder weitere Hilfe benötigen, zögern Sie nicht, auf LinkedIn oder Twitter mit mir in Kontakt zu treten.

Weiterlesen

Build your first autonomous agent with SuperAGI framework in this tutorial.
Tutorial on using Stable Diffusion to generate images from book characters.

Hinterlasse einen Kommentar

Alle Kommentare werden vor der Veröffentlichung geprüft.

Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.