AI Model

Tutorial de Chirp: Domina el modelo de IA de reconocimiento de voz de Google paso a paso

Screenshot of Google Chirp speech-to-text setup process.

Introducción al modelo de IA de reconocimiento de voz de Google Chirp

Chirp es el innovador modelo de voz de Google Cloud, equipado con 2 mil millones de parámetros, habiendo pasado por un extenso entrenamiento autogestionado durante millones de horas de audio y más de 28 mil millones de oraciones de varios idiomas. Con una notable precisión del 98% en inglés y mejoras significativas en los idiomas con menos hablantes, Chirp está listo para redefinir los horizontes de la tecnología de reconocimiento de voz.

¿Qué aprenderás?

Este tutorial proporciona una guía detallada, paso a paso, sobre cómo configurar la consola de Google Cloud para utilizar las potentes capacidades de reconocimiento de voz a texto de Chirp. Los resultados clave de este tutorial incluyen:

  • Crear tu cuenta de Google Cloud
  • Configurar el modelo de IA de reconocimiento de voz Chirp
  • Realizar transcripciones de archivos de audio

Requisitos previos

¡Todo lo que necesitas para comenzar es una taza de café y una computadora portátil!

Comenzando con Google Cloud

Paso 1: Crear una cuenta de Google Cloud

Si ya tienes una cuenta de Google Cloud, puedes proceder al siguiente paso. Si no, crea una cuenta gratuita aquí.

Paso 2: Crear un nuevo proyecto

Una vez que hayas iniciado sesión, haz clic en el menú desplegable del proyecto en la esquina superior izquierda y selecciona Nuevo Proyecto. Ingresa un nombre adecuado para tu proyecto y haz clic en Crear.

Paso 3: Habilitar la API de voz

Navega a la sección de Voz en la consola de Google Cloud y haz clic en HABILITAR API.

Paso 4: Crear un Reconocedor STT

En el menú lateral izquierdo, selecciona Reconocedores > CREAR RECONOCEDORES. Nombra tu reconocedor chirp-recognizer, selecciona Chirp como el modelo, elige en-US como el idioma, y deja otras configuraciones como predeterminadas. Haz clic en Guardar.

Paso 5: Crear un nuevo espacio de trabajo

A continuación, ve al menú desplegable de Espacio de trabajo y haz clic en Nuevo Espacio de Trabajo. Esto abrirá una barra lateral a la derecha. Haz clic en Navegar > Crear un nuevo bucket, nómbralo chirp-bucket, y haz clic en Continuar. Deja otras configuraciones predeterminadas y haz clic en Crear.

Paso 6: Crear una nueva transcripción

En la barra lateral, selecciona Transcripción > Nueva Transcripción. Elige tu archivo de audio a través de una carga local o almacenamiento en la nube. Aquí, utilizaremos la opción de carga local. La interfaz evaluará automáticamente los parámetros de tu archivo de audio. Haz clic en Continuar. Cambia la versión de la API a V2, establece el idioma en inglés (EE. UU.) - en-US, selecciona Chirp como el modelo de transcripción, y elige tu chirp-recognizer. Haz clic en Enviar y espera un momento.

Paso 7: Ver y descargar los resultados de la transcripción

Haz clic en el nombre de tu transcripción para ver los resultados. Puedes descargarlos en formatos TXT, JSON, SRT o CSV. Por ejemplo, para descargar en TXT, haz clic en Descargar > TXT > Descargar.

Conclusión

Esta guía ha proporcionado una visión completa sobre cómo configurar el modelo de IA de reconocimiento de voz Chirp de Google en la consola de Google Cloud. Con un roadmap fácil de seguir y muchas instrucciones útiles, está diseñada para brindar asistencia sin interrupciones tanto a principiantes como a usuarios experimentados.

Al finalizar este tutorial, deberías sentirte seguro usando el modelo Chirp para un reconocimiento de voz preciso en diversas aplicaciones. Mejora tus proyectos con esta potente herramienta y explora sus capacidades en diferentes idiomas y archivos de audio.

¿Listo para poner a prueba tus habilidades? ¡Únete a nosotros en nuestro próximo Hackathon de IA!

Para cualquier pregunta o comentario, no dudes en comunicarte a través de LinkedIn o Twitter. ¡Espero tener noticias tuyas!

Puede que te interese

Creating your first autonomous agent with SuperAGI tutorial
Generative image of book characters using Stable Diffusion tutorial.

Dejar un comentario

Todos los comentarios se revisan antes de su publicación.

Este sitio está protegido por hCaptcha y se aplican la Política de privacidad de hCaptcha y los Términos del servicio.