Aufbau einer RAG-Architektur mit Fivetran | Blog

KI-Modelle basieren auf einer soliden Datengrundlage. Die größte Herausforderung bei der Entwicklung eines brauchbaren KI-Modells bilden der Zugriff auf die großen Datenmengen, die zum Trainieren der KI benötigt werden, deren Einspeisung in das Modell und das Halten des Modells auf dem neuesten Stand.

Fivetran ermöglicht die Integration der Daten einer Quelle in ein Daten-Repository über einen einfachen Workflow, der die Navigation durch eine Reihe von Menüs erfordert. Ein einfacher Einstieg in Fivetran erfordert nur wenige Schritte:

Registrieren Sie sich für Fivetran.
Richten Sie Ihren ersten Konnektor mit den Anmeldeinformationen für eine Datenquelle ein. Wählen Sie dafür eine der über 500 gängigen SaaS-, Datenbank-, Event-Streaming- und Dateispeicherplattformen aus.
Richten Sie eine Destination (Data Lake oder Data Warehouse) ein und weisen Sie sie zu.
Legen Sie einen Zeitplan fest und starten Sie die Erstsynchronisation.

Dieser Workflow macht Daten schnell in einem Data Lake oder Warehouse verfügbar, wo dann bei Bedarf Schemata aus unterschiedlichen Quellen für alle nachgelagerten Zwecke, einschließlich der generativen KI, kombiniert, analysiert und modelliert werden können.

Der Aufbau eines vollkommen neuen generativen KI-Modells kann viele Millionen Dollar an Kosten für Infrastruktur und Experten sowie Monate an Verarbeitungszeit verschlingen. Retrieval-Augmented Generation (RAG) stellt daher für viele Unternehmen eine praktikablere Option dar. Mit RAG wird ein vorhandenes generatives KI-Modell (das Basismodell) um Daten ergänzt, die zusätzliche Fakten und Kontext liefern. Dies sorgt für Ergebnisse, die sachgerechter und für die Bedürfnisse einer Organisation relevanter sind. Zu den bekanntesten Basismodellen gehören DALL-E und die GPT-Reihe von OpenAI, Midjourney von Midjourney, LLama von Meta und Claude von Anthropic.

Es gibt viele verschiedene Arten von Basismodellen, die für unterschiedliche Medien oder Anwendungsfälle ausgelegt sind. Unter den Basismodellen sind LLMs, die mittels riesiger Textkorpora trainiert werden, für den allgemeinen Gebrauch besonders vielversprechend, da sie die menschliche Sprache und das menschliche Sprachverständnis nachahmen können. Durch die Kopplung von RAG und LLM können Unternehmen die Leistungsfähigkeit handelsüblicher generativer KI für ihre proprietären Daten nutzen und so Geld und Zeit zu sparen.

Generative KI ist auf unstrukturierte Daten in Form von Medien aller Art angewiesen, wie Text, Bilder, Audio, Video und mehr. Fivetran unterstützt derzeit keine direkte Integration von Rohmediendateien. Einige Fivetran-Datenquellen enthalten jedoch große Textmengen in strukturierten Daten. Hierzu gehören:

Ada
Drift
Github
Intercom
Slack
Salesforce
Zendesk

Diese Quellen, auf die der Zugriff normalerweise nur über komplexe APIs und Schemata möglich ist, stellt Fivetran schnell in einer RAG-Architektur für generative KI bereit.

RAG-Architektur für generative KI

Die folgende Architektur zeigt, wie Daten für RAG bereitgestellt werden. Mit Fivetran extrahiert und lädt ein Team zunächst Daten aus Quellen in ein zentrales Daten-Repository.

Dieses zwischengeschaltete Repository bietet mehrere Vorteile.

Fivetran speichert all Ihre Daten an einem Ort, wo Sie sie verwalten, beobachten und modellieren können, bevor Sie sie in eine Vektordatenbank übertragen, in der sie nicht mehr transformiert werden können.
Diese Plattform kann als Basis für andere Analysezwecke genutzt werden, z. B. für die normale Berichterstellung, für Dashboards und für Business Intelligence.
Der wichtigste Aspekt ist jedoch, dass Ihre Architektur damit modular wird. Es kann viele Gründe geben, aus denen Sie Vektoreinbettungen und Chunking-Strategien ändern müssen. Ein Staging-Bereich macht dies möglich, ohne dass alle Daten aus den Quellen neu synchronisiert werden müssen.

Für KI-Anwendungen bilden verwaltete Data Lakes den besten Repository-Typ. Data Lakes eignen sich am besten für die Speicherung sehr großer Datenmengen und für die Handhabung unstrukturierter oder halbstrukturierter Daten.

Sobald sich die Daten in einem Data Lake oder Data Warehouse befinden, müssen sie einer zusätzlichen Verarbeitung unterzogen werden, um sie für generative KI nutzbar zu machen. Ein Ansatz besteht darin, Daten zu katalogisieren und ihnen eine semantische, reale Bedeutung zuzuweisen und so einen referenzierbaren Wissensgraph (Knowledge Graph) zu erstellen, der die Beziehungen zwischen Entitäten, Ereignissen und Konzepten veranschaulicht.

‍

Der andere, relevantere Ansatz besteht darin, Rohdaten – Texte, Bilder, Videos und andere Medien – als numerische Darstellungen, die als Vektoren bezeichnet werden, in eine Vektordatenbank einzubetten. Vektorisierte Daten können an eine von einem Nutzer erstellte Anfrage (Prompt) angehängt und als zusätzlicher Kontext an ein Basismodell (Foundation Model) gesendet werden, um genauere und relevantere Antworten zu erhalten.

Alles zusammenführen

Angenommen, Sie haben Text aus einer Anwendung, den Sie verwenden möchten, um einen automatisierten Helpdesk-Chatbot zu erweitern. Wenn wir der gerade beschriebenen RAG-Architektur folgen, sieht der erste Schritt dieses Workflows recht einfach aus: Richten Sie mit Fivetran einen Konnektor von Ihrer Quelle zu Ihrer Destination ein.

Der zweite Schritt erfordert einige technische Arbeiten. Sie müssen folgende Schritte ausführen:

Erstellen Sie eine Pipeline, um relevante Daten aus Ihrem Datenspeicher zu extrahieren, zu transformieren und in die Vektordatenbank zu laden. Sie können dies einmalig durchführen, die Ergebnisse speichern und dann erneut synchronisieren, sobald sich genügend der zugrunde liegenden Daten geändert haben.
Richten Sie eine Benutzeroberfläche ein, die Prompts entgegennehmen und mit dem relevanten Kontext aus der Vektordatenbank kombinieren kann. Einige namhafte Beispiele für Vektordatenbanken sind ChromaDB, Pinecone und Weaviate.
Lassen Sie das Abrufmodell die erweiterten Prompts an das Basismodell senden und eine Antwort generieren.

Mit gängigen Sprachen, Bibliotheken und APIs für Basismodelle ist es relativ einfach, eine einfache Anwendung wie einen Chatbot zu erstellen, der Ihre spezifischen, proprietären Daten nutzt. Bitten Sie Ihre Techniker, Analysten und Produktexperten um Ideen. Allein die Kombination Ihrer textlastigen Anwendungsdaten mit Basismodellen erzeugt vielversprechende Möglichkeiten, die Sie erkunden können.

[CTA_MODULE]

RAG-Architektur für generative KI

Die folgende Architektur zeigt, wie Daten für RAG bereitgestellt werden. Mit Fivetran extrahiert und lädt ein Team zunächst Daten aus Quellen in ein zentrales Daten-Repository.

Dieses zwischengeschaltete Repository bietet mehrere Vorteile.

Fivetran speichert all Ihre Daten an einem Ort, wo Sie sie verwalten, beobachten und modellieren können, bevor Sie sie in eine Vektordatenbank übertragen, in der sie nicht mehr transformiert werden können.

Diese Plattform kann als Basis für andere Analysezwecke genutzt werden, z. B. für die normale Berichterstellung, für Dashboards und für Business Intelligence.

Der wichtigste Aspekt ist jedoch, dass Ihre Architektur damit modular wird. Es kann viele Gründe geben, aus denen Sie Vektoreinbettungen und Chunking-Strategien ändern müssen. Ein Staging-Bereich macht dies möglich, ohne dass alle Daten aus den Quellen neu synchronisiert werden müssen.

‍

Alles zusammenführen

Der zweite Schritt erfordert einige technische Arbeiten. Sie müssen folgende Schritte ausführen:

Erstellen Sie eine Pipeline, um relevante Daten aus Ihrem Datenspeicher zu extrahieren, zu transformieren und in die Vektordatenbank zu laden. Sie können dies einmalig durchführen, die Ergebnisse speichern und dann erneut synchronisieren, sobald sich genügend der zugrunde liegenden Daten geändert haben.

Richten Sie eine Benutzeroberfläche ein, die Prompts entgegennehmen und mit dem relevanten Kontext aus der Vektordatenbank kombinieren kann. Einige namhafte Beispiele für Vektordatenbanken sind ChromaDB, Pinecone und Weaviate.

Lassen Sie das Abrufmodell die erweiterten Prompts an das Basismodell senden und eine Antwort generieren.

[CTA_MODULE]