AI tutorial

Tutorial de Chirp: Cómo usar el modelo de IA de conversión de voz a texto de Google

Image depicting the step-by-step process of setting up Google's Chirp speech-to-text model.

Introducción

Chirp es el avanzado modelo de habla de 2B parámetros de Google Cloud, desarrollado a través de un entrenamiento autoguiado utilizando millones de horas de audio y 28 mil millones de oraciones de texto en más de 100 idiomas. Con una precisión impresionante del 98% en el reconocimiento de voz en inglés y mejoras significativas en varios idiomas menos hablados, Chirp representa una oportunidad emocionante para que los desarrolladores y las empresas mejoren la accesibilidad y la experiencia del usuario.

¿Qué Vamos a Cubrir?

Este tutorial te proporcionará un proceso detallado, paso a paso, para configurar la consola de Google Cloud y aprovechar las capacidades del modelo de IA de Chirp de texto a voz. Esto es lo que puedes esperar:

  • Cómo navegar por la consola de Google Cloud.
  • Cómo configurar el modelo de Chirp de texto a voz en el entorno de Google Cloud.
  • Realizar una transcripción de un archivo de audio y obtener resultados.

Requisitos Previos

Para comenzar, lo único que necesitas es una cuenta de Google Cloud y un dispositivo con acceso a Internet. ¡No olvides tu taza de café!

Comenzando

Paso 1: Crear una Cuenta de Google Cloud

Si aún no tienes una cuenta de Google Cloud, puedes crear una fácilmente. Sigue este enlace para crear una cuenta gratuita.

Paso 2: Crear un Nuevo Proyecto

  1. En la esquina superior izquierda, haz clic en el menú desplegable de proyectos.
  2. Elige Nuevo Proyecto.
  3. Ingresa un nombre para tu proyecto y haz clic en Crear.

Paso 3: Habilitar la API de Voz

Navega a la sección de Voz en la consola de Google Cloud y haz clic en HABILITAR API.

Paso 4: Crear un Reconocedor STT

  1. En la navegación de la barra lateral izquierda, haz clic en Reconocedores y luego selecciona CREAR RECONOCEDORES.
  2. Nombra tu reconocedor chirp-recognizer.
  3. Selecciona Chirp como el modelo y en-US para el idioma.
  4. Deja el resto de la configuración como predeterminado y haz clic en Guardar.

Paso 5: Crear un Nuevo Espacio de Trabajo

  1. Abre el menú desplegable de Espacio de Trabajo y haz clic en Nuevo Espacio de Trabajo.
  2. Aparecerá una barra lateral; selecciona Navegar y luego Crear un nuevo bucket.
  3. Nombra tu bucket chirp-bucket y haz clic en Continuar.
  4. Todas las demás configuraciones pueden permanecer predeterminadas; haz clic en Crear.
  5. Termina haciendo clic en Seleccionar, luego en Continuar y finalmente en Crear.

Paso 6: Crear una Nueva Transcripción

Para realizar una transcripción de tu archivo de audio:

  1. Accede a la navegación de la barra lateral izquierda y selecciona Transcripción > Nueva Transcripción.
  2. Aquí tendrás la opción de subir archivos de audio desde tu máquina local o desde un archivo existente de Cloud Storage.
  3. Usa la opción de Subida local y selecciona tu archivo de audio.
  4. La interfaz de usuario evaluará automáticamente los parámetros de tu archivo de audio, los cuales puedes ajustar si es necesario.
  5. Haz clic en Continuar.
  6. Asegúrate de que la versión de API esté configurada en V2 y especifica el idioma como inglés (Estados Unidos) - en-US.
  7. Selecciona Chirp como el modelo de transcripción y tu chirp-recognizer.
  8. Luego, haz clic en Enviar y espera unos momentos.

Paso 7: Ver Resultados de Transcripción y Descargar

Para ver los resultados de tu transcripción:

  1. Haz clic en el nombre de tu transcripción para acceder a los resultados.
  2. Descarga la transcripción en formatos como JSON, TXT, SRT o CSV. Por ejemplo, para descargar como TXT, haz clic en Descargar > TXT.

Cerrando

Esta guía te ha guiado a través de todo el proceso de implementación del modelo de IA de Chirp de texto a voz en la consola de Google Cloud. Con estas instrucciones paso a paso, puedes aprovechar al máximo las capacidades de Chirp para un reconocimiento de voz de alta precisión.

Equipado con el conocimiento de este tutorial, siéntete libre de explorar y aplicar las características de Google Chirp en tus proyectos. ¡Únete a nosotros en nuestro próximo Hackathon de IA para probar tus habilidades y experimentar!

Si tienes alguna pregunta o necesitas más ayuda, no dudes en conectarte conmigo en LinkedIn o Twitter.

Puede que te interese

Build your first autonomous agent with SuperAGI framework in this tutorial.
Tutorial on using Stable Diffusion to generate images from book characters.

Dejar un comentario

Todos los comentarios se revisan antes de su publicación.

Este sitio está protegido por hCaptcha y se aplican la Política de privacidad de hCaptcha y los Términos del servicio.