Die Welt der KI umarmen: Eine Einführung in LLM (fast) ohne Programmierung
Das Reich der KI ist weitläufig und voller unzähliger Werkzeuge, die für Neulinge überwältigend erscheinen können. Mit täglichen Nachrichten über Durchbrüche, potenzielle Risiken und innovative Anwendungen sind die Meinungen zur KI geteilt. Um eine fundierte Meinung zu bilden, ist es wichtig, in diese faszinierende Welt einzutauchen und die faszinierenden Konzepte zu lernen, die sie bietet.
Eine Bildungsreise beginnen
Langwierige Selbststudien können herausfordernd sein, insbesondere wenn Ablenkungen reichlich vorhanden sind. Um mein Lernen zu beschleunigen, nahm ich an einem KI-Hackathon teil - einem Event, bei dem Wissenssuchende, Experten und Enthusiasten zusammenkommen, um zu lernen, zu kollaborieren und Spaß zu haben.
Hackathons sind einzigartige Erlebnisse, die oft Wettbewerb mit einer unterstützenden Atmosphäre kombinieren, in der die Teilnehmer einander bereitwillig helfen. 48 Stunden im Kreis brillanter Köpfe zu verbringen, gab mir die Möglichkeit, die Grundlagen zu begreifen und zu verstehen, was ich benötigte, um meine erste KI-Lösung zu erstellen.
Allerdings hat nicht jeder die Möglichkeit, an einem Hackathon teilzunehmen. Aus diesem Grund habe ich mich entschieden, meine Erkenntnisse in diesem Tutorial zu teilen, in der Hoffnung, deine Reise in die Welt von LangChain und LLM zu beginnen.
LLM für einen 5-Jährigen erklärt
Stell dir vor, du hast einen magischen Freund, der viele Wörter kennt und versteht, was die Menschen sagen. Dieser Freund kann dir bei den Hausaufgaben helfen, deine Fragen beantworten und dir sogar Geschichten erzählen. Ein LLM (Large Language Model) ist wie dieser magische Freund, aber er lebt in einem Computer. Er kennt viele Wörter und kann verstehen, was Menschen eintippen. Er hilft Menschen, Informationen zu finden, Fragen zu beantworten und viele andere Dinge am Computer zu erledigen.
Was ist LangChain?
Für diejenigen mit technischer Erfahrung kann LangChain als Kleber betrachtet werden, der deine vorhandenen Apps mit KI-Funktionen verbessert. Es ermöglicht dir, große Mengen an Daten aus deinen Apps in Werkzeuge wie Chat-Schnittstellen zu streamen, die Interaktion mit den Daten ermöglichen oder bestimmte Aufgaben basierend auf den in den Daten gefundenen Informationen automatisieren. Stell dir vor, du redest mit deiner Datenbank und erhältst Antworten - LangChain macht dies möglich und spart dir Zeit beim Schreiben von Datenbankabfragen.
Für nicht-technische Personen ist Daten wie ein fließender Fluss. So wie ein Kraftwerk Energie aus dem Fluss schöpft, hilft dir LangChain, das Potenzial deiner Daten mit verschiedenen LLMs und Tools von Drittanbietern freizuschalten. Diese Werkzeuge sind wie verschiedene Arten von Kraftwerken für diverse Landschaften und Anwendungsfälle, jedoch ohne die Zeit und den Aufwand, die erforderlich wären, um sie zu bauen. LangChain macht es einfach, diese Tools zu nutzen, als wären sie in einem Schuhkarton geliefert worden.
Beispielszene: KI-unterstützte E-Commerce-Anfragen
Stell dir vor, du bist ein E-Commerce-Besitzer mit einem erfolgreichen Shop und einer großen Gruppe loyaler Kunden. Du möchtest deine Kunden besser verstehen und KI zu Hilfe nehmen. Derzeit verlässt du dich möglicherweise auf den Admin-Bereich deines Shops für Analysedaten, indem du manuell große Mengen an Tabellendaten suchst, sortierst und filterst. Wenn du nicht so viel Glück hast, musst du deine Programmierer oder Datenwissenschaftler bitten, dies für dich zu tun, was manchmal Tage dauern kann.
Idealerweise möchtest du einfach deine Datenbank fragen und die Antwort sofort erhalten. Hier ist ein Benutzerfluss, der zeigt, wie dies mit LangChain und LLM funktionieren könnte:
In diesem Flow interagierst du mit deinen Daten, und die Daten antworten. Durch den Aufbau eines Flows wie diesem mit Tools wie LangChain ermöglichst du es jedem, auch ohne technisches Wissen, wertvolle Informationen in Sekunden zu erhalten, indem er ein paar Worte in eine Eingabeaufforderung eingibt.
Szenario-Implementierungsplan
Wir wollen einen Bot erstellen, der Anfragen empfangen, diese gegen unsere in einer SQL-Datenbank gespeicherten Daten ausführen und Erkenntnisse in kurzer und prägnanter Form zurückgeben kann. Lass uns die Idee und die während des Hackathons gewonnenen Erkenntnisse besprechen.
Erkenntnisse während des Hackathons
Der Plan unseres Teams während der Veranstaltung war es, einen Konversationsbot zu entwickeln, der dem Benutzer eine festgelegte Anzahl vordefinierter Fragen stellt, basierend auf den Antworten eine Punktzahl berechnet und dann dem Benutzer einige Tipps gibt, wie er/sie sich verbessern kann.
Wir näherten uns dem Problem zu Beginn mit einer Web-Entwickler-Mentalität. Wir wollten eine Liste von Fragen mit erwarteten Antworten erstellen, den Antworten Gewichtungen zuweisen und der LLM die Liste der Fragen im Voraus bereitstellen. Wir planten, die Fragen der LLM zu übergeben, sie die Antworten vom Benutzer abholen zu lassen und dann einen Algorithmus zur Berechnung einer Endpunktzahl basierend auf den Gewichtungen der Nutzerantworten auszuführen. Dies würde dem Benutzer Einblicke geben, die in einem vordefinierten Handbuch gespeichert sind, das ursprünglich als Notion-Seite gespeichert war. Irgendwann wollten wir die Notion-Seite ebenfalls in eine Datenbank übertragen.
Allerdings stellte sich heraus, dass dieser Ansatz zu komplex und verwirrend war. Die Lösung war viel einfacher:
In unserem Versuch, das Problem zu lösen, versuchten wir, den Prozess von oben nach unten zu steuern, was unser größter Fehler war. Nach Gesprächen mit Experten entdeckten wir zwei wichtige Dinge:
- Prompt-Engineering kann Wunder wirken.
- Agenten können uns viel schwere Arbeit abnehmen.
Indem wir der KI das Fahren überlassen und uns auf das Prompt-Engineering konzentrieren, können wir eine effizientere und effektivere Lösung für unseren Konversationsbot erstellen.
Um diese Erkenntnisse anzuwenden, haben wir vollständig aufgegeben, zu versuchen, eine Tabelle mit vordefinierten Fragen und Antworten zu erstellen, und wir haben der LLM einfach über die Prompt-Vorlage mitgeteilt, was wir erreichen wollen.
Nun fragst du dich wahrscheinlich: Was ist Prompt-Engineering?
Prompt-Engineering für einen 5-Jährigen erklärt: Stell dir vor, du hast ein magisches Spielzeug, das deine Fragen beantworten und dir bei vielen Dingen helfen kann. Aber um das Spielzeug zum Arbeiten zu bringen, musst du ihm Fragen auf eine spezielle Weise stellen. Prompt-Engineering ist wie das Herausfinden der besten Art, deinem magischen Spielzeug Fragen zu stellen, damit es dich versteht und dir die besten Antworten geben kann. Es ist wie das Lernen, wie man mit dem Spielzeug spricht, damit ihr beide ein lustiges und hilfreiches Gespräch führen könnt.
Agent für einen 5-Jährigen erklärt
Stell dir vor, du hast einen hilfsbereiten Roboterfreund, der viele Dinge für dich tun kann, wie deine Spielzeuge finden, deine Fragen beantworten oder dir sogar bei den Hausaufgaben helfen. Dieser Roboterfreund nennt sich "Agent". Ein Agent ist wie ein Helfer, der in einem Computer oder einem Gerät lebt und Aufgaben für dich erledigen kann. Er hört zu, was du sagst oder eintippst, und versucht dann sein Bestes, um dir bei dem zu helfen, was du brauchst.
Endgültige Prompt-Lösung des Hackathons
Anstatt Datenbanken einzurichten, APIs zu erstellen und Algorithmen zur Berechnung der Punktzahl zu schreiben, haben wir eine einfachere Lösung mit Prompt-Engineering entwickelt:
Überraschenderweise wurde diese Lösung fast vollständig von der einzigen nicht-programmierenden Person in unserem Team entwickelt. Ein großes Dankeschön an Iwo Szapar, unseren Senior Prompt Engineer des Hackathon-Teams!
Es funktionierte wie Magie:
Anwendung der Erkenntnisse aus dem Hackathon auf unser Beispiel-Szenario
Sowohl die Hackathon-Lösung als auch das Beispiel-Szenario teilen einige Annahmen. Erstens erstellt der Benutzer eine Anfrage. Zweitens senden wir die Anfrage zurück an das LLM und stellen sicher, dass das LLM unser Handbuch kennt und die erhaltene Punktzahl mit festgelegten Daten, die in der Vektordatenbank gespeichert sind, vergleichen kann, um eine aussagekräftige Antwort zu geben.
Wir haben es so gelöst:
Vektordatenbank für einen 5-Jährigen erklärt
Stell dir vor, du hast eine große Kiste mit Spielzeugen, und du möchtest schnell ein bestimmtes Spielzeug finden. Eine Vektordatenbank ist wie eine magische Karte, die dir hilft, das Spielzeug zu finden, nach dem du in der großen Kiste suchst. Sie weiß, wo sich all die Spielzeuge befinden und kann dir das richtige Spielzeug basierend auf dem, was du ihr sagst, zeigen.
In der Vektordatenbank bekommt jedes Spielzeug einen "Vektor" - eine Liste von Zahlen, die das Spielzeug beschreiben und wie es ähnlich oder unterschiedlich zu anderen Spielzeugen ist. Die Vektordatenbank verwendet spezielle Mathematik, um Ähnlichkeiten zwischen Vektoren zu finden. Wenn du also sagst, dass du nach einem roten Spielzeugauto suchst, würde die Datenbank nach Spielzeugen filtern, die einen hohen "Ähnlichkeitswert für rotes Spielzeugauto" basierend auf ihren Vektoren haben.
Um die Vektordatenbank zu erstellen, "lehrst" du sie zunächst über jedes Spielzeug, indem du Details wie die Farbe, Form, Größe, Funktion und mehr des Spielzeugs angibst. Die Datenbank wandelt diese Details in Zahlen um, um einen Vektor für das Spielzeug zu erstellen. Durch den Vergleich der Ähnlichkeiten und Unterschiede zwischen den Vektoren erstellt die Datenbank eine "Karte", wie alle Spielzeuge zueinander in Beziehung stehen.
Wenn du die Datenbank durchsuchen möchtest, schaut sie sich die Vektoren an, um die Spielzeuge zu finden, die am ähnlichsten zu dem sind, was du beschrieben hast. Je mehr sie über die Spielzeuge lernt und besser wird, Beziehungen zwischen ihnen zu finden, desto magischer erscheinen ihre Fähigkeiten. Aber eigentlich basiert alles auf Mathematik!
Code-Erklärung
Dieser Code definiert einen konversationellen KI-Agenten namens PlaybookChat, der mit Benutzern interagieren und Informationen basierend auf einem Handbuch bereitstellen kann. Der Agent hat eine Reihe von Werkzeugen, die er nutzen kann, um den Benutzern zu helfen. In diesem Fall gibt es ein Werkzeug namens query_playbook, das dem Agenten erlaubt, Informationen in einem "Leitfaden für People Manager" zu suchen.
Wenn ein Gespräch beginnt, wird der Agent mit den Werkzeugen und anderen Einstellungen initialisiert. Er nutzt ein zugrunde liegendes Sprachmodell namens "ChatOpenAI", um Antworten zu generieren. Der Agent hat auch eine Gedächtnisfunktion, um den Verlauf des Gesprächs zu verfolgen.
Um ein Gespräch zu beginnen, wird die Methode start_conversation mit einer Benutzerwertung als Eingabe aufgerufen. Der Agent läuft dann und reagiert auf die Anfragen des Benutzers basierend auf den Informationen aus dem Handbuch. Die Antwort enthält die Punktzahl des Benutzers und ermutigt ihn, aufschlussreiche Fragen zu stellen.
Insgesamt richtet dieser Code einen konversationellen KI-Agenten ein, der Informationen bereitstellen und mit Benutzern basierend auf den Inhalten eines Handbuchs interagieren kann.
Endgültige Lösung für unser Beispiel
Wir haben bereits eine funktionierende Lösung, also lass sie uns ein wenig umgestalten.
Prompt-Vorlage:
Benötigst du einen Ort, um ein wenig mehr mit Prompt-Engineering zu experimentieren? OpenAI bietet dir einen großartigen Spielplatz, um genau das zu tun! Fühle dich frei, den Code zu kopieren und dort zu experimentieren.
Hausaufgabe
Die verbleibende Aufgabe für dich besteht darin, eine Datenbank einzurichten und sie mit relevanten Daten zu befüllen. Ich werde in diesem Artikel keine detaillierten Anweisungen geben, aber du kannst dich auf unseren umfassenden Leitfaden zur Ähnlichkeitssuche und Vektordatenbanken beziehen, der schrittweise Anleitungen bietet. Die detaillierten Anweisungen findest du in einem unserer anderen KI-Tutorials.
Zusammenfassung
Eine Reise in die KI zu beginnen, mag herausfordernd erscheinen, aber die wahre Stärke der KI liegt in ihrer Fähigkeit, dich auf Schritt und Tritt zu unterstützen. Es gibt nur eine wichtige Anforderung: "Lass die KI das Steuer übernehmen," während du sie in die richtige Richtung leitest.
Zusammenfassend ist es wichtig, die Schlüsselkonzepte wie Prompt-Engineering, Chains, Agenten und Vektordatenbanken zu verstehen, bevor du beginnst. Mit einem soliden Verständnis dieser Konzepte wirst du befähigt sein, bemerkenswerte Leistungen zu erzielen!
Ich wünsche dir viel Glück auf deiner Reise, KI-Apps zu erstellen, und danke dir für deine wertvolle Zeit.
Hinterlasse einen Kommentar
Alle Kommentare werden vor der Veröffentlichung geprüft.
Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.