Créer des flux de travail dans la communauté Clarifai : un tutoriel complet
Bienvenue dans un tutoriel approfondi axé sur la façon d'utiliser les puissantes fonctionnalités disponibles sur la plateforme Clarifai Community. Cette plateforme vous permet d'intégrer efficacement divers modèles d'IA dans vos projets. L'une de ses caractéristiques remarquables est la capacité de créer des flux de travail complexes en utilisant des modèles comme blocs de construction fondamentaux. À la fin de ce guide, vous serez équipé des connaissances nécessaires pour combiner des modèles et construire un système multimodal.
Qu'est-ce qu'un système multimodal ?
Un système multimodal est une intégration avancée de différents types de médias, tels que des images, du texte et de l'audio. Cette combinaison de formats ouvre la voie à une pléthore d'applications et de solutions polyvalentes. Dans ce tutoriel, vous apprendrez à créer des flux de travail sur la plateforme Clarifai Community qui exploitent la puissance de la fonctionnalité multimodale.
Étape 1 : Mise en place de l'application
- Créer l'application : L'application sert de conteneur pour tous vos modèles et flux de travail associés. Commencez par :
- Lui donner un nom unique.
- Écrire une courte description.
- Sélectionner la langue souhaitée.
- Assigner un flux de travail par défaut.
- Une fois cette configuration terminée, vous verrez une interface d'application vide ; c'est votre toile pour construire des flux de travail.
Étape 2 : Concevoir le flux de travail de reconnaissance optique de caractères
Allez dans la section Flux de travail et cliquez sur Créer un flux de travail. Vous serez accueilli par une interface de glisser-déposer sans code pour connecter des modèles.
- Rechercher un modèle de reconnaissance optique de caractères : Ce modèle permet aux ordinateurs d'extraire du texte de divers types d'images.
- Rechercher un modèle de texte-à-texte : Ce modèle transforme une forme de texte en une autre.
- Connecter les modèles : Dessinez des connexions entre les modèles, définissant le flux d'informations :
- Pour la reconnaissance optique de caractères, nous utiliserons le modèle Paddle OCR.
- Pour la transformation texte-à-texte, recherchez \
Laisser un commentaire
Tous les commentaires sont modérés avant d'être publiés.
Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.