Introducción
Chirp es el avanzado modelo de habla de 2B parámetros de Google Cloud, desarrollado a través de un entrenamiento autoguiado utilizando millones de horas de audio y 28 mil millones de oraciones de texto en más de 100 idiomas. Con una precisión impresionante del 98% en el reconocimiento de voz en inglés y mejoras significativas en varios idiomas menos hablados, Chirp representa una oportunidad emocionante para que los desarrolladores y las empresas mejoren la accesibilidad y la experiencia del usuario.
¿Qué Vamos a Cubrir?
Este tutorial te proporcionará un proceso detallado, paso a paso, para configurar la consola de Google Cloud y aprovechar las capacidades del modelo de IA de Chirp de texto a voz. Esto es lo que puedes esperar:
- Cómo navegar por la consola de Google Cloud.
- Cómo configurar el modelo de Chirp de texto a voz en el entorno de Google Cloud.
- Realizar una transcripción de un archivo de audio y obtener resultados.
Requisitos Previos
Para comenzar, lo único que necesitas es una cuenta de Google Cloud y un dispositivo con acceso a Internet. ¡No olvides tu taza de café!
Comenzando
Paso 1: Crear una Cuenta de Google Cloud
Si aún no tienes una cuenta de Google Cloud, puedes crear una fácilmente. Sigue este enlace para crear una cuenta gratuita.
Paso 2: Crear un Nuevo Proyecto
- En la esquina superior izquierda, haz clic en el menú desplegable de proyectos.
- Elige Nuevo Proyecto.
- Ingresa un nombre para tu proyecto y haz clic en Crear.
Paso 3: Habilitar la API de Voz
Navega a la sección de Voz en la consola de Google Cloud y haz clic en HABILITAR API.
Paso 4: Crear un Reconocedor STT
- En la navegación de la barra lateral izquierda, haz clic en Reconocedores y luego selecciona CREAR RECONOCEDORES.
- Nombra tu reconocedor chirp-recognizer.
- Selecciona Chirp como el modelo y en-US para el idioma.
- Deja el resto de la configuración como predeterminado y haz clic en Guardar.
Paso 5: Crear un Nuevo Espacio de Trabajo
- Abre el menú desplegable de Espacio de Trabajo y haz clic en Nuevo Espacio de Trabajo.
- Aparecerá una barra lateral; selecciona Navegar y luego Crear un nuevo bucket.
- Nombra tu bucket chirp-bucket y haz clic en Continuar.
- Todas las demás configuraciones pueden permanecer predeterminadas; haz clic en Crear.
- Termina haciendo clic en Seleccionar, luego en Continuar y finalmente en Crear.
Paso 6: Crear una Nueva Transcripción
Para realizar una transcripción de tu archivo de audio:
- Accede a la navegación de la barra lateral izquierda y selecciona Transcripción > Nueva Transcripción.
- Aquí tendrás la opción de subir archivos de audio desde tu máquina local o desde un archivo existente de Cloud Storage.
- Usa la opción de Subida local y selecciona tu archivo de audio.
- La interfaz de usuario evaluará automáticamente los parámetros de tu archivo de audio, los cuales puedes ajustar si es necesario.
- Haz clic en Continuar.
- Asegúrate de que la versión de API esté configurada en V2 y especifica el idioma como inglés (Estados Unidos) - en-US.
- Selecciona Chirp como el modelo de transcripción y tu chirp-recognizer.
- Luego, haz clic en Enviar y espera unos momentos.
Paso 7: Ver Resultados de Transcripción y Descargar
Para ver los resultados de tu transcripción:
- Haz clic en el nombre de tu transcripción para acceder a los resultados.
- Descarga la transcripción en formatos como JSON, TXT, SRT o CSV. Por ejemplo, para descargar como TXT, haz clic en Descargar > TXT.
Cerrando
Esta guía te ha guiado a través de todo el proceso de implementación del modelo de IA de Chirp de texto a voz en la consola de Google Cloud. Con estas instrucciones paso a paso, puedes aprovechar al máximo las capacidades de Chirp para un reconocimiento de voz de alta precisión.
Equipado con el conocimiento de este tutorial, siéntete libre de explorar y aplicar las características de Google Chirp en tus proyectos. ¡Únete a nosotros en nuestro próximo Hackathon de IA para probar tus habilidades y experimentar!
Si tienes alguna pregunta o necesitas más ayuda, no dudes en conectarte conmigo en LinkedIn o Twitter.
Dejar un comentario
Todos los comentarios se revisan antes de su publicación.
Este sitio está protegido por hCaptcha y se aplican la Política de privacidad de hCaptcha y los Términos del servicio.