AI

Guide du débutant aux LLM : Adoptez l'IA sans coder

An illustration of a friendly robot helping a person with AI queries.

Embrasser le Monde de l'IA : Une Introduction pour Débutants aux LLM (Presque) Sans Codage

Le domaine de l'IA est vaste et rempli de nombreux outils qui peuvent sembler écrasants pour les nouveaux venus. Avec les nouvelles quotidiennes de percées, de risques potentiels et d'applications innovantes, les opinions sur l'IA sont divisées. Pour former une opinion éclairée, il est essentiel de plonger dans ce monde fascinant et d'apprendre les concepts intrigants qu'il offre.

Commencer un Voyage Éducatif

De longues heures d'auto-apprentissage peuvent être difficiles, surtout lorsque les distractions sont nombreuses. Pour accélérer mon apprentissage, j'ai participé à un hackathon IA - un événement où ceux qui cherchent des connaissances, des experts et des passionnés se rassemblent pour apprendre, collaborer et s'amuser.

Les hackathons sont des expériences uniques, combinant souvent compétition et atmosphère de soutien où les participants s'aident mutuellement avec enthousiasme. Passer 48 heures entouré d'esprits brillants m'a permis de saisir les bases et de comprendre ce dont j'avais besoin pour créer ma première solution IA.

Cependant, tout le monde n'a pas l'opportunité d'assister à un hackathon. C'est pourquoi j'ai décidé de partager mes apprentissages dans ce tutoriel, espérant donner un coup d'envoi à votre voyage dans le monde de LangChain et des LLM.

LLM Expliqué pour un Enfant de 5 Ans

Imagine que tu as un ami magique qui connaît beaucoup de mots et peut comprendre ce que les gens disent. Cet ami peut t'aider avec tes devoirs, répondre à tes questions et même te raconter des histoires. Un LLM (Modèle de Langage de Grande Taille) est comme cet ami magique, mais il vit à l'intérieur d'un ordinateur. Il connaît de nombreux mots et peut comprendre ce que les gens tapent. Il aide les gens à trouver des informations, à répondre à des questions, et à faire beaucoup d'autres choses sur l'ordinateur.

Qu'est-ce que LangChain ?

Pour ceux qui ont une expérience technique, LangChain peut être considéré comme une colle qui améliore vos applications existantes avec des capacités IA. Il vous permet de diffuser de grandes quantités de données de vos applications vers des outils comme des interfaces de chat, facilitant l'interaction avec les données ou l'automatisation de certaines tâches basées sur les informations trouvées dans les données. Imaginez parler à votre base de données et recevoir des réponses - LangChain rend cela possible, vous faisant gagner du temps dans l'écriture de requêtes de base de données.

Pour les personnes non techniques, imaginez les données comme une rivière qui coule. Tout comme une centrale électrique exploite l'énergie de la rivière, LangChain vous aide à libérer le potentiel de vos données en utilisant divers LLM et outils tiers. Ces outils sont comme différents types de centrales électriques pour divers terrains et cas d'utilisation, mais sans le temps et les efforts nécessaires pour les construire. LangChain facilite le travail de ces outils, comme s'ils étaient livrés dans une boîte à chaussures.

Scénario Exemple : Requêtes Commerciaux Assistées par IA

Imaginez que vous êtes un propriétaire de commerce électronique avec un magasin prospère et un large groupe de clients fidèles. Vous voulez mieux comprendre vos clients et utiliser l'IA pour vous aider. Actuellement, vous pourriez vous reposer sur l'espace admin de votre magasin pour des données analytiques, en recherchant, en triant et en filtrant manuellement d'énormes montants deregistrement. Si vous n'avez pas de chance, vous devez demander à vos programmeurs ou scientifiques de données de le faire pour vous, ce qui peut parfois prendre des jours.

Idéalement, vous aimeriez simplement demander à votre base de données et obtenir la réponse instantanément. Voici un flux utilisateur démontrant comment cela pourrait fonctionner en utilisant LangChain et LLM :

Dans ce flux, vous avez interagi avec vos données, et les données ont répondu. En construisant un flux comme celui-ci en utilisant des outils comme LangChain, vous permettez à quiconque, même sans connaissances techniques, d'accéder à des informations précieuses en quelques secondes en tapant quelques mots dans une invite.

Plan de Mise en Œuvre du Scénario

Nous voulons créer un bot capable de recevoir des requêtes, de les exécuter contre nos données stockées dans une base de données SQL et de retourner des insights sous une forme courte et concise. Discutons de l'idée et des leçons apprises lors du hackathon.

Leçons Apprises Pendant le Hackathon

Le plan de notre équipe pendant l'événement était de construire un bot conversationnel qui poserait à l'utilisateur un nombre fixe de questions prédéfinies, calculerait un score basé sur les réponses, puis servirait à l'utilisateur quelques conseils sur la façon dont il/elle peut s'améliorer.

Nous avons initialement abordé le problème avec un état d'esprit de développeur Web, voulant créer une liste de questions avec des réponses attendues, attribuer des poids aux réponses, et fournir à l'LLM la liste de questions à l'avance. Nous avions prévu d'alimenter les questions à l'LLM, de lui faire obtenir les réponses de l'utilisateur, puis d'exécuter un algorithme pour calculer un score final basé sur les poids des réponses de l'utilisateur. Cela fournirait à l'utilisateur des insights stockés dans un guide prédéfini, initialement stocké en tant que page Notion. À un certain moment, nous voulions également déplacer la page Notion vers une base de données.

Cependant, cette approche s'est révélée être trop complexe et déroutante. La solution était beaucoup plus simple :

Dans notre tentative de résoudre le problème, nous avons essayé de contrôler le processus de haut en bas, ce qui était notre plus grande erreur. Après avoir parlé à des experts, nous avons découvert deux choses importantes :

  • L'ingénierie des requêtes peut faire des merveilles.
  • Les agents peuvent prendre en charge beaucoup de travail pénible pour nous.

En laissant l'IA conduire et en se concentrant sur l'ingénierie des requêtes, nous pouvons créer une solution plus efficace et performante pour notre bot conversationnel.

Pour mettre en pratique ces découvertes, nous avons complètement abandonné l'idée de créer un tableau avec des questions et des réponses prédéfinies et nous avons simplement orienté l'LLM tout au long du modèle de prompt, sur ce que nous voulons réaliser.

Maintenant, Vous Vous Demandez Probablement : Qu'est-ce que l'Ingénierie des Prompts ?

Ingénierie des prompts expliquée pour un enfant de 5 ans : Imagine que tu as un jouet magique qui peut répondre à tes questions et t'aider avec plein de choses. Mais pour faire fonctionner le jouet, tu dois lui poser des questions d'une manière spéciale. L'ingénierie des prompts, c'est comme découvrir la meilleure façon de poser des questions à ton jouet magique pour qu'il puisse te comprendre et te donner les meilleures réponses. C'est comme apprendre à parler à ton jouet pour que vous puissiez tous les deux avoir une conversation amusante et utile.

Agent Expliqué pour un Enfant de 5 Ans

Imagine que tu as un ami robot utile qui peut faire beaucoup de choses pour toi, comme trouver tes jouets, répondre à tes questions ou même t'aider avec tes devoirs. Cet ami robot s'appelle un "agent". Un agent est comme un aide qui vit à l'intérieur d'un ordinateur ou d'un appareil et peut faire des tâches pour toi. Il écoute ce que tu dis ou tapes et essaie ensuite de faire de son mieux pour t'aider avec ce dont tu as besoin.

Solution Finale du Hackathon

Au lieu de configurer des bases de données, des API et d'écrire des algorithmes pour calculer le score, nous avons trouvé une solution plus simple en utilisant l'ingénierie des prompts :

Étonnamment, cette solution a été développée presque entièrement par la seule personne sans programmation de notre équipe. Un grand merci à Iwo Szapar, notre Ingénieur Principal des Prompts de l'équipe du hackathon !

Ça a fonctionné comme par magie :

Application des Découvertes du Hackathon à Notre Scénario Exemples

La solution du hackathon et le scénario exemple partagent certaines hypothèses. Premièrement, l'utilisateur produit une requête. Deuxièmement, nous renvoyons la requête à l'LLM, en veillant à ce que l'LLM connaisse notre guide et puisse comparer le score reçu avec des données fixes stockées dans la base de données vectorielle pour produire une réponse significative.

Nous l'avons résolu de cette façon :

Base de Données Vectorielle Expliquée pour un Enfant de 5 Ans

Imagine que tu as une grande boîte de jouets, et que tu veux trouver un jouet spécifique rapidement. Une base de données vectorielle est comme une carte magique qui t'aide à trouver le jouet que tu cherches dans la grande boîte. Elle sait où tous les jouets se trouvent et peut te montrer le bon jouet en fonction de ce que tu lui dis.

Dans la base de données vectorielle, chaque jouet obtient un "vecteur" - une liste de nombres qui décrivent le jouet et comment il est similaire ou différent des autres jouets. La base de données vectorielle utilise des mathématiques spéciales pour trouver des similitudes entre les vecteurs. Donc si tu lui dis que tu cherches une voiture jouet rouge, la base de données filtrera les jouets avec un score de similarité "voiture jouet rouge" élevé basé sur leurs vecteurs.

Pour construire la base de données vectorielle, tu dois d'abord "enseigner" à la base de données à propos de chaque jouet en lui donnant des détails comme la couleur, la forme, la taille, la fonction du jouet, et bien plus. La base de données transforme ces détails en nombres pour créer un vecteur pour le jouet. En comparant comment les vecteurs sont similaires et différents, la base de données construit une "carte" de la façon dont tous les jouets sont liés.

Lorsque tu cherches dans la base de données, elle examine les vecteurs pour trouver les jouets les plus similaires à ta description. Plus elle apprend sur les jouets et s'améliore pour trouver les relations entre eux, plus ses capacités semblent magiques. Mais en réalité, tout cela est basé sur les mathématiques !

Explication du Code

Ce code définit un agent AI conversationnel appelé PlaybookChat qui peut interagir avec les utilisateurs et fournir des informations basées sur un playbook. L'agent a un ensemble d'outils qu'il peut utiliser pour assister les utilisateurs. Dans ce cas, il y a un outil appelé query_playbook qui permet à l'agent de rechercher des informations dans un "guide pour les gestionnaires de personnes".

Lorsque la conversation commence, l'agent est initialisé avec les outils et d'autres paramètres. Il utilise un modèle de langage sous-jacent appelé "ChatOpenAI" pour générer des réponses. L'agent a également un composant de mémoire pour garder une trace de l'historique de la conversation.

Pour commencer une conversation, la méthode start_conversation est appelée avec un score utilisateur en entrée. L'agent s'exécute ensuite et répond aux requêtes de l'utilisateur en fonction des informations du playbook. La réponse inclut le score de l'utilisateur et l'encourage à poser des questions pertinentes.

Dans l'ensemble, ce code configure un agent AI conversationnel qui peut fournir des informations et s'engager dans une conversation avec les utilisateurs basées sur le contenu d'un playbook.

Solution Finale pour Notre Exemple

Nous avons déjà une solution fonctionnelle, alors remettons-la un peu en forme.

Modèle de prompt :

Avez-vous besoin d'un endroit pour expérimenter un peu plus avec l'ingénierie des prompts ? OpenAI vous fournit un terrain de jeu génial pour le faire ! N'hésitez pas à copier & coller le code, et commencez à expérimenter là-bas.

Devoirs

La tâche qui vous reste à accomplir est de configurer une base de données et de la remplir avec des données pertinentes. Bien que je ne fournirai pas d'instructions détaillées dans cet article, vous pouvez vous référer à notre guide complet sur la recherche de similarité et les bases de données vectorielles, qui fournit des étapes détaillées. Vous pouvez trouver les instructions détaillées dans l'un de nos autres tutoriels sur l'IA.

Résumé

Se lancer dans un voyage IA peut sembler difficile, mais le véritable pouvoir de l'IA réside dans sa capacité à vous soutenir à chaque étape du chemin. Il y a juste une exigence clé : "Laissez l'IA prendre le volant", tandis que vous la guidez dans la bonne direction.

Pour résumer tout ce que j'ai discuté, il est crucial de comprendre des concepts clés tels que l'ingénierie des prompts, les chaînes, les agents et les bases de données vectorielles avant de commencer. Avec une bonne compréhension de ces concepts, vous serez en mesure d'accomplir des réalisations remarquables !

Je vous souhaite bonne chance dans votre voyage de création d'applications IA et vous remercie pour votre temps précieux.

En lire plus

Cohere tutorial for building an API to generate product descriptions
Step-by-step guide to creating a text improver app using AI21 Labs and Next.js

Laisser un commentaire

Tous les commentaires sont modérés avant d'être publiés.

Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.