Beschleunigung von GenAI-Apps mit Fivetran Google Cloud BQ und Vertex AI

Fivetran und Google Cloud harmonieren hervorragend und machen generative KI für Sie nutzbar.
April 2, 2024

Alle Unternehmen nutzen GenAI bereits oder werden sie in Bälde nutzen. Ihr GenAI-Erfolg wird davon abhängen, wie effektiv, effizient und sicher die einzigartigen Datensätze Ihres Unternehmens mit Basismodellen und in GenAI-Anwendungen genutzt werden können.

[CTA_MODULE]

In diesem Beitrag zeige ich Ihnen, wie Fivetran die Entwicklung von GenAI-Anwendungen für den Kundenservice beschleunigt. Ich werde den Prozess unter Verwendung von Google Cloud mit BigQuery, Google Cloud Storage und Vertex AI demonstrieren. Falls Sie mit Fivetran nicht vertraut sind: Es handelt sich um eine vollständig automatisierte und verwaltete Data-Movement-Plattform, die die Bereitstellung qualitativ hochwertiger, nutzbarer und vertrauenswürdiger Daten für alle Daten-Workloads in BigQuery unterstützt. Auch die Integration mit BigQuery und Vertex AI ist etwas speziell, weshalb ich erläutern werde, wie die Zusammenarbeit funktioniert.

Übersicht zu End-to-End-Architektur und Datenfluss: Fivetran und Google Cloud

Vertex AI bietet als Teil der Google Cloud ein Studio, GenAI-APIs, Basismodelle und verschiedene Möglichkeiten für die schnelle Anwendungserstellung. Ich werde mich darauf konzentrieren, mit Fivetran verschiedene Konnektoren zu Quellen einzurichten, die meine Kundenservicedaten enthalten. In allen Unternehmen sind diese Daten normalerweise über mehrere Plattformen verstreut, darunter operative Datenbanken, Dateisysteme und Anwendungen wie Jira, Zendesk und Slack.

Der GenAI-Anwendungsfluss mit Datenquellen, Fivetran, BigQuery und Vertex AI

Ich werde diese Daten mit Fivetran in Google BigQuery bewegen und dann in Vertex AI schnell einen Prototyp einer einfachen GenAI-Such-App und -Chat-App erstellen. Um diese GenAI-Apps zu erstellen, benötige ich jedoch kontextuelle, fokussierte Daten, die für mein Unternehmen spezifisch sind. Hier kommt die automatisierte Datenplattform von Fivetran ins Spiel.

Mit Fivetran können Sie Daten vollständig automatisiert und vollständig verwaltet zentralisieren und gleichzeitig Ihre Dateninfrastruktur modernisieren, einen besseren Self-Service für Daten einrichten und differenzierende Datenlösungen wie GenAI-Apps erstellen. Alles, was in diesem Beitrag beschrieben wird, wurde ohne Code und ohne Einrichtung realisiert.

Diesen GenAI-Ansatz mit Fivetran, BigQuery und Vertex AI können Sie sich im folgenden Video ansehen.

Lassen wir also unsere Datensätze mit Fivetran in BigQuery einfließen und beginnen wir mit GenAI zu experimentieren.

Hinzufügen eines neuen Quell-Konnektors mit Fivetran

Ich habe mehrere Datenquellen, die bereits in Google BigQuery einfließen. Sie sehen hier unter anderem SAP ERP, Workday, SQL Server, GA4 und S3.

Dies sind die aktuellen Quellen, die Fivetran in Google BigQuery bewegt.

Fivetran wird mit sofort einsatzbereiten Konnektoren für über 500 Quellen ausgeliefert, einschließlich Unterstützung für PostgreSQL, das in allen wichtigen Clouds gehostet wird. Einer meiner Kundensupport-Datensätze befindet sich in Google Cloud PostgreSQL.

Die Teams für Technik, Produkt und technische Dokumentation von Fivetran leisten fantastische Arbeit bei der Erläuterung der Schritte für einen schnellen Datenfluss in BigQuery. Wenn Sie Informationen suchen, die Sie nicht auf der Fivetran-Benutzeroberfläche finden, lesen Sie Folgendes: Einrichtungshandbuch für Google Cloud PostgreSQL.

Anleitung für das Einrichten von Google Cloud PostgreSQL in der Fivetran-Dokumentation

Darüber hinaus enthält die Dokumentation für jede Quelle und jede Destination Informationen zur Versionsunterstützung, Konfigurationsunterstützung und Funktionsunterstützung sowie zu etwaigen Einschränkungen, eine Synchronisierungsübersicht, Schemainformationen, Typtransformationen und vieles mehr. Hier finden Sie die Seite mit den Details zur PostgreSQL-Quelle.

Wichtig ist, dass auf der Fivetran-Benutzeroberfläche rechts neben den Einrichtungsseiten für Quellen in einem grau hinterlegten Rahmen das jeweilige Einrichtungshandbuch angezeigt wird. Darüber können Sie schnell sicherstellen, dass Sie die Optionen für eine Verbindung von Fivetran mit der jeweiligen Quelle verstehen.

Ich spreche viel von Vorhersehbarkeit, Standardisierung und Optionalität. Ich kann meinen Schema-Präfixnamen auswählen und muss in BigQuery vorab keine Schemata oder Tabellen erstellen.

Für diesen Konnektor werde ich folgendes Präfix verwenden:

pg_bg_cs3

Seite für das Einrichten von Google Cloud PostgreSQL in Fivetran

Jetzt benötigt Fivetran Anmeldeinformationen für die Authentifizierung bei der PostgreSQL-Datenbank, einschließlich Hostname, Benutzername, Kennwort und der Datenbank, auf die ich in dieser PostgreSQL-Instanz zugreifen möchte. Es handelt sich dabei um die Branchendatenbank.

Fivetran führt automatisch die Erstsynchronisation und das inkrementelle CDC (Change Data Capture) durch. Sobald die erste historische Synchronisierung abgeschlossen ist, führt Fivetran inkrementelle Aktualisierungen aller neuen oder geänderten Daten aus der PostgreSQL-Quelldatenbank durch. Für die Durchführung inkrementeller Aktualisierungen stehen WAL, XMIN oder Fivetran Teleport (protokollfreie Änderungserkennung) zur Auswahl.

Für diese PostgreSQL-Datenbank sind auch mehrere Verbindungsoptionen verfügbar. Hierzu gehören SSH, Reverse-SSH, VPN, Google Private Service Connect und ein Proxy-Agent.

Ich werde eine direkte Verbindung zu dieser Datenbankquelle herstellen. Auch für die Änderungserkennung in der Datenbank sind mehrere Optionen verfügbar. Für Postgres kann ich abhängig vom Anwendungsfall und den organisatorischen Anforderungen WAL, XMIN oder Fivetran Teleport Sync auswählen.

Für den Moment wähle ich Teleport Sync aus. Es handelt sich um einen protokollfreien Mechanismus zur Änderungserkennung. Ab da führt Fivetran Verbindungstests zur Datenbank durch. Fivetran verschlüsselt alle übertragenen Daten und nutzt TLS. Dies ermöglicht sowohl die Verschlüsselung als auch die Authentifizierung der Verbindungen, die Fivetran zur PostgreSQL-Datenbank herstellt. Alle Daten, die sich vorübergehend im Fivetran-Service befinden, werden außerdem mittels AES 256 verschlüsselt.

Auswahl des Datensatzes für Kundenserviceinteraktionen zur Verwendung mit Google BigQuery und Vertex AI

Fivetran stellt dann eine Verbindung her und ruft die Schemata, Tabellen und Spalten ab, auf die Sie in der Postgres SQL-Datenbank zugreifen können. Für diese Branchendatenbank sind 13 Schemata verfügbar. Ich kann für diesen Konnektor alles in der Datenbank synchronisieren oder selektiv einen Datensatz bestimmen, mit dem ich heute arbeiten möchte.

Ich benötige nur die Interaktionstabelle aus dem Kundenservice-Schema. Das Bewegen aller anderen Schemata und Tabellen in BigQuery blockiere ich.

Schema: customer_service

Tabelle: Interaktionen

Datensatzauswahl (Interaktionen) zusammen mit Schema-, Tabellen- und Spaltenblockierung (plus Spalten-Hashing)

Wenn ich mit der Maus über eine beliebige Spalte in der Tabelle fahre, wird eine Option für das Hashing auf Spaltenebene angezeigt. Dies ermöglicht zusätzlichen Datenschutz und die Anonymisierung aller personenbezogenen Daten, die ich nicht aus meiner Datenbankquelle in BigQuery bewegen möchte. Wichtig ist dabei, dass das Hashing durch Fivetran weiterhin die Verwendung dieser Spalte in meinem nachgelagerten GenAI-Anwendungs-Workflow ermöglicht.

Verwalten von Quelländerungen und Schema-Drift

Fivetran muss dann mitgeteilt werden, wie ich mit inkrementellen Änderungen umgehen möchte, da sich die Datenbank in Zukunft verändern wird.

Fivetran behandelt alle Schemaabweichungen als Teil der Automatisierung der Erkennung inkrementeller Änderungen.

Hier gibt es viele Optionen, ich klicke auf „Alles zulassen“. Sämtliche DML- und DDL-Änderungen werden von Fivetran automatisch erfasst und an BigQuery übermittelt – dazu ist keine Codierung erforderlich. Die Abfragehäufigkeit der PostgreSQL-Quelle für die Änderungserkennung und die anschließende Bewegung in BigQuery kann ich festlegen.

Starten der Erstsynchronisation von PostgreSQL mit Google BigQuery

Nachdem ich diese Einstellungen gespeichert und getestet habe, kann ich mit der Synchronisierung meines Datensatzes für Kundenserviceinteraktionen aus Postgres in BigQuery beginnen. Denken Sie daran, dass Fivetran nicht nur den Interaktionsdatensatz verschiebt, den wir gerade während der ersten historischen Synchronisierung ausgewählt haben, sondern dass CDC auch automatisch dafür eingerichtet ist, alle nachfolgenden Änderungen an dieser Tabelle oder diesen Spalten in BigQuery zu speichern. Dafür ist kein Code erforderlich und die inkrementellen Änderungen werden nach dem von Ihnen festgelegten Zeitplan erfasst

Das war’s. Jetzt kann ich meinen PostgreSQL-Interaktionsdatensatz mit BigQuery synchronisieren.

Dies war ein kleiner Datensatz mit nur einer Tabelle und die Erstsynchronisation war sehr schnell abgeschlossen.

Die Erstsynchronisation für diesen Datensatz verlief extrem schnell.

Nachdem Fivetran die Daten bewegt hat und die Fehlerprüfung abgeschlossen wurde, speichert Fivetran keine Daten mehr. Der Synchronisierungspunkt wird für die nächste inkrementelle Synchronisierung markiert, um weitere Änderungen zu erfassen.

Als Standardwert für inkrementelle Synchronisierungen ist in Fivetran „Alle sechs Stunden“ voreingestellt. Das Intervall kann aber auf einen Wert zwischen einer Minute und 24 Stunden geändert werden – abhängig vom Anwendungsfall und den Anforderungen an die Aktualität der Daten im nachgelagerten Datenprodukt.

Fivetran SaaS-Konnektoren unterstützen inkrementelle Synchronisierungen vom Minutentakt bis zum 24-Stunden-Takt.

Mein PostgreSQL-Konnektor (pg_bg_cs3) wird jetzt in der Liste der Konnektoren angezeigt und kann in BigQuery auf all diese Datenquellen zugreifen.

Alle Konnektoren sind aktiv und übertragen Änderungen an all diesen Datensätzen dauerhaft in BigQuery.

Überprüfen des neuen Datensatzes in BigQuery

Alle in BigQuery vorhandenen Datensätze, mit denen ich arbeiten kann, werden angezeigt. Dort befindet sich auch mein PostgreSQL-Schema mit der Tabelle, die Fivetran bewegt hat, die den Datensatz der Interaktionen mit dem Kundenservice enthält, der mich interessiert. Entscheidend ist, dass Fivetran für BigQuery eine originalgetreue Eins-zu-eins-Darstellung des Interaktionsdatensatzes der Quelle bereitstellt und dass die Daten für die Verwendung als BigQuery-Workload bereit sind.

Die automatisierte Data Movement-Plattform von Fivetran stellt einen GenAI-fähigen Datensatz in BigQuery bereit.

Hinzufügen eines Slack-Datensatzes für Messaging-Daten

Bevor ich eine GenAI-App in Vertex AI erstelle, möchte ich Ihnen zeigen, wie einfach es ist, einen vollständigen Satz fokussierter, kontextbezogener Kundenservicedaten für GenAI-Apps zu erstellen. Ich werde schnell einige andere Datensätze in BigQuery erstellen, indem ich eine Verbindung zu anderen Quellen herstelle.

Die Qualität Ihrer KI-Apps hängt von Ihren Daten ab. Für eine produktionstaugliche GenAI-Anwendung benötigen Sie zusätzlich einige kontextuelle Datenquellen.

Heute entscheide ich mich für Slack, Zendesk und Jira. Die Verbindung zu den Fivetran-Anwendungskonnektoren erfolgt über eine API. Um Slack mit Fivetran zu verbinden und Slack-Informationen in BigQuery zu konsolidieren, benötigen Sie lediglich Zugriff auf ein aktives Slack-Konto.

Ich möchte Angel Hernandez von Fivetran meinen aufrichtigen Dank aussprechen. Er hat mir ein Slack-Demokonto zur Verfügung gestellt und stellt regelmäßig großartige Quellen und Destinations für Demos bereit.

Ich gebe einfach den Schemanamen an und autorisiere die API für den Slack-Konnektor. Dann führt Fivetran den abschließenden Verbindungstest durch. Das war‘s schon. Ich starte die Erstsynchronisation.

Seite für das Einrichten von Slack in Fivetran

Hinzufügen eines Jira-Konnektors für Problemverfolgungsdaten

Fivetran unterstützt Jira sowohl on-premise als auch in der Cloud. Wie Fivetran die Verbindung zu Jira herstellt, hängt von Ihrer Jira-Installation ab. Für Jira Cloud benötigt Fivetran meinen Jira-Hostnamen, den Port und einen Verbindungsbenutzer mit entsprechenden Berechtigungen.

Ich kann entweder OAuth oder die Basisauthentifizierung nutzen. In Jira ist außerdem ein Anwendungslink konfiguriert, der die Apps miteinander verknüpft. Im Jira-Formular benötige ich außerdem einen Consumer-Schlüssel und einen öffentlichen Schlüssel. Dieser Schritt in Jira wurde hier bereits erledigt.

Schließlich kann ich den Synchronisierungsmodus auswählen. Ich kann aus allen Projekten oder ausgewählten Projekten synchronisieren. Ich wähle hier einige Beispielprojekte aus.

Seite für das Einrichten von Jira in Fivetran

Fivetran stellt für den Jira-Konnektor außerdem Quickstart-Datenmodelle zur Verfügung. Ich werde Fivetran daher anweisen, diese Modelle für mich automatisch mit dbt in Google BigQuery zu erstellen.

Fivetran Quickstart-Transformationen für den Jira-Konnektor

Hinzufügen eines weiteren Konnektors – Zendesk Support für Supportinteraktionen

Ein weiterer Datensatz, den ich gerne zu BigQuery hinzufügen möchte, sind meine Kundensupportdaten in Zendesk. Fivetran verfügt über mehrere Zendesk-Konnektoren, die sich sehr schnell und einfach einrichten lassen.

Ich benötige dafür nur den Namen meiner Zendesk-Supportdomäne sowie ein Zendesk-Konto mit Administratorrolle. Fivetran bietet viele vorgefertigte Datenmodelle. Genau wie für Jira sind auch für Zendesk Quickstart-Datenmodelle verfügbar, die mir analysefähige Daten in BigQuery bereitstellen.

Ich brauche nicht einmal ein eigenes dbt-Projekt oder irgendwelche Tools von Drittanbietern, um das in Gang zu setzen. Fivetran kümmert sich für mich im Hintergrund um alles.

Seite für das Einrichten von Zendesk in Fivetran

Ich bin mit meinem Kundendienst-Datensatz jetzt wirklich zufrieden. Ich kehre wieder zu BigQuery zurück und werfe einen kurzen Blick auf den Datensatz, der jetzt zentralisiert und einsatzbereit vorliegt.

Die Zusammenarbeit von Fivetran und BigQuery bietet mir einen modernen Self-Service-Ansatz für die Erstellung von GenAI-Anwendungen für diese kontextuellen Datensätze. Falls Sie für das Training denselben Bitext-Interaktionsdatensatz für Kundensupport benutzen möchten, den ich in Postgres besitze, finden Sie ihn hier auf GitHub. An diesem Punkt fließen über 20 Quellen in BigQuery ein. Sie haben gesehen, wie die vier Hauptquellen eingerichtet werden.

Die automatisierte Data-Movement-Plattform von Fivetran speichert eine breite Palette von Datenquellen in BigQuery

Einige Highlights von Vertex AI

Ich werde jetzt zur rechten Seite der Architektur wechseln und mit Vertex AI und BigQuery ein paar einfache GenAI-Apps erstellen. Ich beginne mit einer Such-App und richte dann auch noch eine Chat-App ein. Beide werden auf den Kundensupport ausgerichtet sein.

Erstellen von Chat- und Such-Apps mit Vertex AI

Mit Vertex AI können Sie schnell generative KI-Apps erstellen. Außerdem kann ich aus einer Reihe von Modellen auswählen. Vertex AI trainiert, testet und optimiert Vorhersagemodelle dann automatisch für mich innerhalb einer einzigen Plattform. Dies führt zu einer deutlichen Beschleunigung der Entwicklung und verringert letztendlich die Schulungszeit, die Time-to-Value und die Kosten.

Vertex AI bietet einige unglaubliche Funktionen, ich werde heute aber nur auf einige davon eingehen.

Haupt-Dashboard und Optionen von Vertex AI

Erstellen einer GenAI-Such-App mit BigQuery und Vertex AI

Ich werde mein Google GenAI-Projekt mit Vertex Search und Conversation fortsetzen. Ich habe einige Apps erstellt, möchte aber eine neue hinzufügen. Ich habe die Wahl zwischen vier Anwendungstypen: Suche, Chat, Empfehlungen und generatives Playbook. Lassen Sie uns ein paar davon ausprobieren.

App-Optionen von Vertex AI Search und Conversations

Der deklarative Ansatz mit Vertex AI Search und Conversation passt gut für jemanden wie mich, der kein ML- oder Dateningenieur ist. Beginnen möchte ich mit einer neuen Such-App. Der Konfigurationsschritt ist unkompliziert.

Ich gebe der App einfach einen Namen und gebe einen Firmennamen und einen Standort ein.

Konfigurieren und Einrichten der Vertex AI-Such-App

Dann teile ich Vertex AI mit, welchen Datenspeicher ich als Basis für meine App verwenden möchte.

Es sind einige Datenspeicher verfügbar. Eigentlich möchte ich aber auf den Datensatz für die Kundenserviceinteraktionen zugreifen, den ich zuvor mit Fivetran in BigQuery konsolidiert habe.

Auswahl eines Datenspeichers für die Vertex AI-Such-App

Daher werde ich mein Schema suchen und dann Vertex AI mitteilen, welchen Datentyp ich verwende. Das werden in diesem Fall strukturierte BigQuery-Tabellen sein.

Informieren Sie Vertex AI über den Datentyp, den Sie aus BigQuery verwenden möchten.

Ich benötige einen eindeutigen Namen für meinen Datenspeicher. Ich wähle ihn aus. Vertex AI wird diese Informationen verarbeiten. Danach kann ich loslegen.

Erstellen einer GenAI-Chat-App mit BigQuery und Vertex AI

Während meine Such-App realisiert wird, erstelle ich auch eine GenAI-Chat-App.

Das Erstellen einer Chat-App mit Vertex AI verläuft genauso, wie ich es Ihnen gerade anhand der Such-App gezeigt habe. Dieses Mal führt mich Vertex AI jedoch durch die Konfiguration eines auf Konversation ausgelegten Agenten.

Sobald ich mit der Konfiguration der auf Konversation ausgelegten Chat-App fertig bin, wähle ich meinen Datensatz aus. Ich erstelle einen neuen Datenspeicher aus einer anderen Version der Kundenservice-Interaktionsdaten, die im unstrukturierten PDF-Format im Google Cloud Storage vorliegen.

Hinweis: Fivetran kann alle Typen strukturierter oder halbstrukturierter Daten in BigQuery verschieben, einschließlich relationaler Tabellen, CSV, JSON, XML, Parquet, Avro und so weiter. Dieses PDF habe ich jedoch separat in GCS eingefügt, zusammen mit einigen der halbstrukturierten Dokumente, die ich mit Fivetran in GCS verschoben hatte.

Werfen Sie einen Blick auf die GenAI-Such-App in Vertex AI

Dies war die strukturierte Form des Interaktionsdatensatzes. Ich wechsele jetzt zur Vorschauseite der Suche und führe ein paar einfache Suchvorgänge aus. Ich habe einfach nur die standardmäßige Konfiguration verwendet.

Wenn ich meine Suchergebnisse formatieren möchte, ist das ganz einfach und Vertex AI bietet auf der Widget-Registerkarte einige schöne Steuerelemente.

Testen der GenAI-Chat-App in Vertex AI

Das Modell für meine Chat-App für den Kundenservice wird noch trainiert, daher werde ich die CS-Chat-App verwenden, die ich zuvor erstellt habe. Es handelt sich um denselben Datensatz für die Interaktionen im Kundenservice.

Für den Chat bringt Vertex mich in die Dialogflow-CX-Palette, wo ich meinen Agent testen kann. Es handelt sich um einen relativ kleinen Datensatz. Denken Sie aber daran, dass er zielgerichtet und kontextbezogen ist, was entscheidend ist.

Ich werde im Simulator einige Tests ausführen und den Agent dann zu einer simulierten Website in CodePen hinzufügen. Dazu werde ich einige typische Kundendienstfragen stellen. Ich werde Fragen zu Versandoptionen, Auftragsstornierungen und Auftragsänderungen stellen und mir ansehen, wie die Vertex AI-Chat-App die einzelnen Fragen beantwortet.

Das Modell wurde schnell trainiert und die App wurde unglaublich schnell erstellt. Mit den bisherigen Antworten bin ich bis jetzt zufrieden.

Das ist sehr, sehr cool. Ich musste nichts spezifisch konfigurieren oder einrichten und keine Beispielantworten, Testantworten, Fragen oder Ähnliches eingeben.

All dies passiert in Echtzeit. Und natürlich kann alles innerhalb von Vertex AI weiter optimiert werden. Ich bin mit dieser Anwendung zufrieden und möchte sie jetzt veröffentlichen. Vertex AI generiert automatisch den Code, den ich benötige, um den Agent zu meiner Website hinzuzufügen.

Hinzufügen der Vertex AI-Chat-App zu meinem CodePen-Website-Simulator

Da ich keine Website besitze, werde ich CodePen verwenden. Hier ist der Link zu CodePen; darüber können Sie die Umgebung ausprobieren, falls Sie sie noch nicht benutzt haben. Es handelt sich um eine Online-Community für das Testen und Präsentieren einfacher Apps und eigener Code-Snippets.

Ich nenne diesen Pen „Customer_Service_Chat“. Ich muss nur noch den Code einfügen, den Vertex für mich generiert hat. Jetzt sollte die blaue Sprechblase in der Ecke anzeigen, dass mein Agent einsatzbereit ist. Ich erwarte, dass das Verhalten dem sehr ähnlich ist, das ich im Vertex-Simulator gesehen habe.

My tests included a quick greeting to be friendly and then questions about shipping options and a couple of other things like we did previously directly in the Vertex simulator.

Insgesamt bin ich mit der Chat-App sehr zufrieden. Beeindruckt bin ich von der Einfachheit der Integration des Datensatzes, vom Aufbau, von der Integration, von der Leistung und von der Tatsache, dass ich kein Team von Daten- und ML-Technikern für 8, 10, 12 oder mehr Sprints gebraucht habe.

Bei der Gelegenheit: Ein paar weitere Funktionen der Vertex AI-Chat-App

Die Agent-Einstellungen von Vertex AI für diese Chat-App sind interessant.

Auf der Registerkarte „Generative KI“ können Sie sehen, dass ich Gemini Pro verwende, aber verschiedene Modelle zur Auswahl habe.

Wenn Ihre Chat-App auf Audio-Prompts reagieren soll, können Sie ganz schnell ein Telefon-Gateway einrichten, indem Sie eine verfügbare Telefonnummer auswählen. Bei meinem Test des Gateways waren die Antworten der Chat-App nahezu identisch mit den Antworten der Web-App.

Wenn Sie mehr Datenanreicherung und -transformation benötigen

Ich möchte noch einmal kurz auf Fivetran Transformations zurückkommen. Fivetran bietet eine nahtlose Integration mit dbt mit über 20 Quickstart-Datenmodellen für zwei der Konnektoren, die ich heute eingerichtet habe, Jira und Zendesk.

Mit Fivetran Quickstarts können Sie mithilfe vorgefertigter Datenmodelle automatisch analysefähige Tabellen erzeugen. Die Daten werden ohne Code transformiert und es sind keine zusätzlichen dbt-Projekte oder Tools von Drittanbietern erforderlich. Sie können auch mit Dutzenden zusätzlicher dbt-Pakete, die Fivetran entwickelt und bereitgestellt hat, eine Verbindung zu Ihrem eigenen dbt Core-Projekt herstellen.

Transformations umfasst eine integrierte Planung. Nach Abschluss der Fivetran-Konnektor-Synchronisierungen löst diese automatisch das Ausführen des Modells aus. Dann können Sie sich die große Auswahl an Konnektoren ansehen, die Quickstart-Datenmodelle, dbt Core und jetzt auch dbt Cloud unterstützen. Ihnen stehen also drei Optionen für unterschiedliche Transformations-Anforderungen zur Verfügung.

Jetzt loslegen

Das Erstellen von GenAI-Apps für Suche und Chat mit Google BigQuery und Vertex AI war einfach und schnell möglich. Fivetran stellt sicher, dass alle Datenbewegungen in die Google Cloud über alle Datenquellen hinweg standardisiert und automatisiert verlaufen. Dabei bieten alle vollständig automatisierten und verwaltete Pipelines Zuverlässigkeit, Skalierbarkeit, Vorhersehbarkeit, Sicherheit und Kontext für GenAI-Anwendungen.

Wenn Sie Fivetran für einen Google Cloud-GenAI-Anwendungsfall oder eine andere Daten-Workload ausprobieren möchten, können Sie Fivetran einfach 14 Tage lang kostenlos testen.

Ich würde mich freuen, von Ihnen zu hören, welche Konnektoren, Daten-Workloads oder Anwendungsfälle Sie gerne als Nächstes präsentiert sehen möchten. Passen Sie auf sich auf!

Über den Autor

Kelly Kohlleffel leitet den Bereich Global Partner Sales Engineering von Fivetran. Er arbeitet zusammen mit einem breiten Ökosystem aus Technologie- und Beratungspartnern an Ansätzen für moderne Datenprodukte und Lösungen. Er moderiert außerdem den Fivetran Data Drip-Podcast, in dem einige der klügsten Köpfe der Daten-Community über ihren Werdegang, ihre Visionen und ihre Herausforderungen sprechen. Vor Fivetran war Kelly Kohlleffel bei Hashmap und NTT DATA (Consulting für Datenlösungen und -services), Hortonworks (im Hadoop-Land) und Oracle tätig. Sie können sich mit Kelly Kohlleffel auf LinkedIn verbinden oder ihm auf Twitter folgen.

Kostenlos starten

Schließen auch Sie sich den Tausenden von Unternehmen an, die ihre Daten mithilfe von Fivetran zentralisieren und transformieren.

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Data insights
Data insights

Beschleunigung von GenAI-Apps mit Fivetran Google Cloud BQ und Vertex AI

Beschleunigung von GenAI-Apps mit Fivetran Google Cloud BQ und Vertex AI

April 2, 2024
April 2, 2024
Beschleunigung von GenAI-Apps mit Fivetran Google Cloud BQ und Vertex AI
Fivetran und Google Cloud harmonieren hervorragend und machen generative KI für Sie nutzbar.

Alle Unternehmen nutzen GenAI bereits oder werden sie in Bälde nutzen. Ihr GenAI-Erfolg wird davon abhängen, wie effektiv, effizient und sicher die einzigartigen Datensätze Ihres Unternehmens mit Basismodellen und in GenAI-Anwendungen genutzt werden können.

[CTA_MODULE]

In diesem Beitrag zeige ich Ihnen, wie Fivetran die Entwicklung von GenAI-Anwendungen für den Kundenservice beschleunigt. Ich werde den Prozess unter Verwendung von Google Cloud mit BigQuery, Google Cloud Storage und Vertex AI demonstrieren. Falls Sie mit Fivetran nicht vertraut sind: Es handelt sich um eine vollständig automatisierte und verwaltete Data-Movement-Plattform, die die Bereitstellung qualitativ hochwertiger, nutzbarer und vertrauenswürdiger Daten für alle Daten-Workloads in BigQuery unterstützt. Auch die Integration mit BigQuery und Vertex AI ist etwas speziell, weshalb ich erläutern werde, wie die Zusammenarbeit funktioniert.

Übersicht zu End-to-End-Architektur und Datenfluss: Fivetran und Google Cloud

Vertex AI bietet als Teil der Google Cloud ein Studio, GenAI-APIs, Basismodelle und verschiedene Möglichkeiten für die schnelle Anwendungserstellung. Ich werde mich darauf konzentrieren, mit Fivetran verschiedene Konnektoren zu Quellen einzurichten, die meine Kundenservicedaten enthalten. In allen Unternehmen sind diese Daten normalerweise über mehrere Plattformen verstreut, darunter operative Datenbanken, Dateisysteme und Anwendungen wie Jira, Zendesk und Slack.

Der GenAI-Anwendungsfluss mit Datenquellen, Fivetran, BigQuery und Vertex AI

Ich werde diese Daten mit Fivetran in Google BigQuery bewegen und dann in Vertex AI schnell einen Prototyp einer einfachen GenAI-Such-App und -Chat-App erstellen. Um diese GenAI-Apps zu erstellen, benötige ich jedoch kontextuelle, fokussierte Daten, die für mein Unternehmen spezifisch sind. Hier kommt die automatisierte Datenplattform von Fivetran ins Spiel.

Mit Fivetran können Sie Daten vollständig automatisiert und vollständig verwaltet zentralisieren und gleichzeitig Ihre Dateninfrastruktur modernisieren, einen besseren Self-Service für Daten einrichten und differenzierende Datenlösungen wie GenAI-Apps erstellen. Alles, was in diesem Beitrag beschrieben wird, wurde ohne Code und ohne Einrichtung realisiert.

Diesen GenAI-Ansatz mit Fivetran, BigQuery und Vertex AI können Sie sich im folgenden Video ansehen.

Lassen wir also unsere Datensätze mit Fivetran in BigQuery einfließen und beginnen wir mit GenAI zu experimentieren.

Hinzufügen eines neuen Quell-Konnektors mit Fivetran

Ich habe mehrere Datenquellen, die bereits in Google BigQuery einfließen. Sie sehen hier unter anderem SAP ERP, Workday, SQL Server, GA4 und S3.

Dies sind die aktuellen Quellen, die Fivetran in Google BigQuery bewegt.

Fivetran wird mit sofort einsatzbereiten Konnektoren für über 500 Quellen ausgeliefert, einschließlich Unterstützung für PostgreSQL, das in allen wichtigen Clouds gehostet wird. Einer meiner Kundensupport-Datensätze befindet sich in Google Cloud PostgreSQL.

Die Teams für Technik, Produkt und technische Dokumentation von Fivetran leisten fantastische Arbeit bei der Erläuterung der Schritte für einen schnellen Datenfluss in BigQuery. Wenn Sie Informationen suchen, die Sie nicht auf der Fivetran-Benutzeroberfläche finden, lesen Sie Folgendes: Einrichtungshandbuch für Google Cloud PostgreSQL.

Anleitung für das Einrichten von Google Cloud PostgreSQL in der Fivetran-Dokumentation

Darüber hinaus enthält die Dokumentation für jede Quelle und jede Destination Informationen zur Versionsunterstützung, Konfigurationsunterstützung und Funktionsunterstützung sowie zu etwaigen Einschränkungen, eine Synchronisierungsübersicht, Schemainformationen, Typtransformationen und vieles mehr. Hier finden Sie die Seite mit den Details zur PostgreSQL-Quelle.

Wichtig ist, dass auf der Fivetran-Benutzeroberfläche rechts neben den Einrichtungsseiten für Quellen in einem grau hinterlegten Rahmen das jeweilige Einrichtungshandbuch angezeigt wird. Darüber können Sie schnell sicherstellen, dass Sie die Optionen für eine Verbindung von Fivetran mit der jeweiligen Quelle verstehen.

Ich spreche viel von Vorhersehbarkeit, Standardisierung und Optionalität. Ich kann meinen Schema-Präfixnamen auswählen und muss in BigQuery vorab keine Schemata oder Tabellen erstellen.

Für diesen Konnektor werde ich folgendes Präfix verwenden:

pg_bg_cs3

Seite für das Einrichten von Google Cloud PostgreSQL in Fivetran

Jetzt benötigt Fivetran Anmeldeinformationen für die Authentifizierung bei der PostgreSQL-Datenbank, einschließlich Hostname, Benutzername, Kennwort und der Datenbank, auf die ich in dieser PostgreSQL-Instanz zugreifen möchte. Es handelt sich dabei um die Branchendatenbank.

Fivetran führt automatisch die Erstsynchronisation und das inkrementelle CDC (Change Data Capture) durch. Sobald die erste historische Synchronisierung abgeschlossen ist, führt Fivetran inkrementelle Aktualisierungen aller neuen oder geänderten Daten aus der PostgreSQL-Quelldatenbank durch. Für die Durchführung inkrementeller Aktualisierungen stehen WAL, XMIN oder Fivetran Teleport (protokollfreie Änderungserkennung) zur Auswahl.

Für diese PostgreSQL-Datenbank sind auch mehrere Verbindungsoptionen verfügbar. Hierzu gehören SSH, Reverse-SSH, VPN, Google Private Service Connect und ein Proxy-Agent.

Ich werde eine direkte Verbindung zu dieser Datenbankquelle herstellen. Auch für die Änderungserkennung in der Datenbank sind mehrere Optionen verfügbar. Für Postgres kann ich abhängig vom Anwendungsfall und den organisatorischen Anforderungen WAL, XMIN oder Fivetran Teleport Sync auswählen.

Für den Moment wähle ich Teleport Sync aus. Es handelt sich um einen protokollfreien Mechanismus zur Änderungserkennung. Ab da führt Fivetran Verbindungstests zur Datenbank durch. Fivetran verschlüsselt alle übertragenen Daten und nutzt TLS. Dies ermöglicht sowohl die Verschlüsselung als auch die Authentifizierung der Verbindungen, die Fivetran zur PostgreSQL-Datenbank herstellt. Alle Daten, die sich vorübergehend im Fivetran-Service befinden, werden außerdem mittels AES 256 verschlüsselt.

Auswahl des Datensatzes für Kundenserviceinteraktionen zur Verwendung mit Google BigQuery und Vertex AI

Fivetran stellt dann eine Verbindung her und ruft die Schemata, Tabellen und Spalten ab, auf die Sie in der Postgres SQL-Datenbank zugreifen können. Für diese Branchendatenbank sind 13 Schemata verfügbar. Ich kann für diesen Konnektor alles in der Datenbank synchronisieren oder selektiv einen Datensatz bestimmen, mit dem ich heute arbeiten möchte.

Ich benötige nur die Interaktionstabelle aus dem Kundenservice-Schema. Das Bewegen aller anderen Schemata und Tabellen in BigQuery blockiere ich.

Schema: customer_service

Tabelle: Interaktionen

Datensatzauswahl (Interaktionen) zusammen mit Schema-, Tabellen- und Spaltenblockierung (plus Spalten-Hashing)

Wenn ich mit der Maus über eine beliebige Spalte in der Tabelle fahre, wird eine Option für das Hashing auf Spaltenebene angezeigt. Dies ermöglicht zusätzlichen Datenschutz und die Anonymisierung aller personenbezogenen Daten, die ich nicht aus meiner Datenbankquelle in BigQuery bewegen möchte. Wichtig ist dabei, dass das Hashing durch Fivetran weiterhin die Verwendung dieser Spalte in meinem nachgelagerten GenAI-Anwendungs-Workflow ermöglicht.

Verwalten von Quelländerungen und Schema-Drift

Fivetran muss dann mitgeteilt werden, wie ich mit inkrementellen Änderungen umgehen möchte, da sich die Datenbank in Zukunft verändern wird.

Fivetran behandelt alle Schemaabweichungen als Teil der Automatisierung der Erkennung inkrementeller Änderungen.

Hier gibt es viele Optionen, ich klicke auf „Alles zulassen“. Sämtliche DML- und DDL-Änderungen werden von Fivetran automatisch erfasst und an BigQuery übermittelt – dazu ist keine Codierung erforderlich. Die Abfragehäufigkeit der PostgreSQL-Quelle für die Änderungserkennung und die anschließende Bewegung in BigQuery kann ich festlegen.

Starten der Erstsynchronisation von PostgreSQL mit Google BigQuery

Nachdem ich diese Einstellungen gespeichert und getestet habe, kann ich mit der Synchronisierung meines Datensatzes für Kundenserviceinteraktionen aus Postgres in BigQuery beginnen. Denken Sie daran, dass Fivetran nicht nur den Interaktionsdatensatz verschiebt, den wir gerade während der ersten historischen Synchronisierung ausgewählt haben, sondern dass CDC auch automatisch dafür eingerichtet ist, alle nachfolgenden Änderungen an dieser Tabelle oder diesen Spalten in BigQuery zu speichern. Dafür ist kein Code erforderlich und die inkrementellen Änderungen werden nach dem von Ihnen festgelegten Zeitplan erfasst

Das war’s. Jetzt kann ich meinen PostgreSQL-Interaktionsdatensatz mit BigQuery synchronisieren.

Dies war ein kleiner Datensatz mit nur einer Tabelle und die Erstsynchronisation war sehr schnell abgeschlossen.

Die Erstsynchronisation für diesen Datensatz verlief extrem schnell.

Nachdem Fivetran die Daten bewegt hat und die Fehlerprüfung abgeschlossen wurde, speichert Fivetran keine Daten mehr. Der Synchronisierungspunkt wird für die nächste inkrementelle Synchronisierung markiert, um weitere Änderungen zu erfassen.

Als Standardwert für inkrementelle Synchronisierungen ist in Fivetran „Alle sechs Stunden“ voreingestellt. Das Intervall kann aber auf einen Wert zwischen einer Minute und 24 Stunden geändert werden – abhängig vom Anwendungsfall und den Anforderungen an die Aktualität der Daten im nachgelagerten Datenprodukt.

Fivetran SaaS-Konnektoren unterstützen inkrementelle Synchronisierungen vom Minutentakt bis zum 24-Stunden-Takt.

Mein PostgreSQL-Konnektor (pg_bg_cs3) wird jetzt in der Liste der Konnektoren angezeigt und kann in BigQuery auf all diese Datenquellen zugreifen.

Alle Konnektoren sind aktiv und übertragen Änderungen an all diesen Datensätzen dauerhaft in BigQuery.

Überprüfen des neuen Datensatzes in BigQuery

Alle in BigQuery vorhandenen Datensätze, mit denen ich arbeiten kann, werden angezeigt. Dort befindet sich auch mein PostgreSQL-Schema mit der Tabelle, die Fivetran bewegt hat, die den Datensatz der Interaktionen mit dem Kundenservice enthält, der mich interessiert. Entscheidend ist, dass Fivetran für BigQuery eine originalgetreue Eins-zu-eins-Darstellung des Interaktionsdatensatzes der Quelle bereitstellt und dass die Daten für die Verwendung als BigQuery-Workload bereit sind.

Die automatisierte Data Movement-Plattform von Fivetran stellt einen GenAI-fähigen Datensatz in BigQuery bereit.

Hinzufügen eines Slack-Datensatzes für Messaging-Daten

Bevor ich eine GenAI-App in Vertex AI erstelle, möchte ich Ihnen zeigen, wie einfach es ist, einen vollständigen Satz fokussierter, kontextbezogener Kundenservicedaten für GenAI-Apps zu erstellen. Ich werde schnell einige andere Datensätze in BigQuery erstellen, indem ich eine Verbindung zu anderen Quellen herstelle.

Die Qualität Ihrer KI-Apps hängt von Ihren Daten ab. Für eine produktionstaugliche GenAI-Anwendung benötigen Sie zusätzlich einige kontextuelle Datenquellen.

Heute entscheide ich mich für Slack, Zendesk und Jira. Die Verbindung zu den Fivetran-Anwendungskonnektoren erfolgt über eine API. Um Slack mit Fivetran zu verbinden und Slack-Informationen in BigQuery zu konsolidieren, benötigen Sie lediglich Zugriff auf ein aktives Slack-Konto.

Ich möchte Angel Hernandez von Fivetran meinen aufrichtigen Dank aussprechen. Er hat mir ein Slack-Demokonto zur Verfügung gestellt und stellt regelmäßig großartige Quellen und Destinations für Demos bereit.

Ich gebe einfach den Schemanamen an und autorisiere die API für den Slack-Konnektor. Dann führt Fivetran den abschließenden Verbindungstest durch. Das war‘s schon. Ich starte die Erstsynchronisation.

Seite für das Einrichten von Slack in Fivetran

Hinzufügen eines Jira-Konnektors für Problemverfolgungsdaten

Fivetran unterstützt Jira sowohl on-premise als auch in der Cloud. Wie Fivetran die Verbindung zu Jira herstellt, hängt von Ihrer Jira-Installation ab. Für Jira Cloud benötigt Fivetran meinen Jira-Hostnamen, den Port und einen Verbindungsbenutzer mit entsprechenden Berechtigungen.

Ich kann entweder OAuth oder die Basisauthentifizierung nutzen. In Jira ist außerdem ein Anwendungslink konfiguriert, der die Apps miteinander verknüpft. Im Jira-Formular benötige ich außerdem einen Consumer-Schlüssel und einen öffentlichen Schlüssel. Dieser Schritt in Jira wurde hier bereits erledigt.

Schließlich kann ich den Synchronisierungsmodus auswählen. Ich kann aus allen Projekten oder ausgewählten Projekten synchronisieren. Ich wähle hier einige Beispielprojekte aus.

Seite für das Einrichten von Jira in Fivetran

Fivetran stellt für den Jira-Konnektor außerdem Quickstart-Datenmodelle zur Verfügung. Ich werde Fivetran daher anweisen, diese Modelle für mich automatisch mit dbt in Google BigQuery zu erstellen.

Fivetran Quickstart-Transformationen für den Jira-Konnektor

Hinzufügen eines weiteren Konnektors – Zendesk Support für Supportinteraktionen

Ein weiterer Datensatz, den ich gerne zu BigQuery hinzufügen möchte, sind meine Kundensupportdaten in Zendesk. Fivetran verfügt über mehrere Zendesk-Konnektoren, die sich sehr schnell und einfach einrichten lassen.

Ich benötige dafür nur den Namen meiner Zendesk-Supportdomäne sowie ein Zendesk-Konto mit Administratorrolle. Fivetran bietet viele vorgefertigte Datenmodelle. Genau wie für Jira sind auch für Zendesk Quickstart-Datenmodelle verfügbar, die mir analysefähige Daten in BigQuery bereitstellen.

Ich brauche nicht einmal ein eigenes dbt-Projekt oder irgendwelche Tools von Drittanbietern, um das in Gang zu setzen. Fivetran kümmert sich für mich im Hintergrund um alles.

Seite für das Einrichten von Zendesk in Fivetran

Ich bin mit meinem Kundendienst-Datensatz jetzt wirklich zufrieden. Ich kehre wieder zu BigQuery zurück und werfe einen kurzen Blick auf den Datensatz, der jetzt zentralisiert und einsatzbereit vorliegt.

Die Zusammenarbeit von Fivetran und BigQuery bietet mir einen modernen Self-Service-Ansatz für die Erstellung von GenAI-Anwendungen für diese kontextuellen Datensätze. Falls Sie für das Training denselben Bitext-Interaktionsdatensatz für Kundensupport benutzen möchten, den ich in Postgres besitze, finden Sie ihn hier auf GitHub. An diesem Punkt fließen über 20 Quellen in BigQuery ein. Sie haben gesehen, wie die vier Hauptquellen eingerichtet werden.

Die automatisierte Data-Movement-Plattform von Fivetran speichert eine breite Palette von Datenquellen in BigQuery

Einige Highlights von Vertex AI

Ich werde jetzt zur rechten Seite der Architektur wechseln und mit Vertex AI und BigQuery ein paar einfache GenAI-Apps erstellen. Ich beginne mit einer Such-App und richte dann auch noch eine Chat-App ein. Beide werden auf den Kundensupport ausgerichtet sein.

Erstellen von Chat- und Such-Apps mit Vertex AI

Mit Vertex AI können Sie schnell generative KI-Apps erstellen. Außerdem kann ich aus einer Reihe von Modellen auswählen. Vertex AI trainiert, testet und optimiert Vorhersagemodelle dann automatisch für mich innerhalb einer einzigen Plattform. Dies führt zu einer deutlichen Beschleunigung der Entwicklung und verringert letztendlich die Schulungszeit, die Time-to-Value und die Kosten.

Vertex AI bietet einige unglaubliche Funktionen, ich werde heute aber nur auf einige davon eingehen.

Haupt-Dashboard und Optionen von Vertex AI

Erstellen einer GenAI-Such-App mit BigQuery und Vertex AI

Ich werde mein Google GenAI-Projekt mit Vertex Search und Conversation fortsetzen. Ich habe einige Apps erstellt, möchte aber eine neue hinzufügen. Ich habe die Wahl zwischen vier Anwendungstypen: Suche, Chat, Empfehlungen und generatives Playbook. Lassen Sie uns ein paar davon ausprobieren.

App-Optionen von Vertex AI Search und Conversations

Der deklarative Ansatz mit Vertex AI Search und Conversation passt gut für jemanden wie mich, der kein ML- oder Dateningenieur ist. Beginnen möchte ich mit einer neuen Such-App. Der Konfigurationsschritt ist unkompliziert.

Ich gebe der App einfach einen Namen und gebe einen Firmennamen und einen Standort ein.

Konfigurieren und Einrichten der Vertex AI-Such-App

Dann teile ich Vertex AI mit, welchen Datenspeicher ich als Basis für meine App verwenden möchte.

Es sind einige Datenspeicher verfügbar. Eigentlich möchte ich aber auf den Datensatz für die Kundenserviceinteraktionen zugreifen, den ich zuvor mit Fivetran in BigQuery konsolidiert habe.

Auswahl eines Datenspeichers für die Vertex AI-Such-App

Daher werde ich mein Schema suchen und dann Vertex AI mitteilen, welchen Datentyp ich verwende. Das werden in diesem Fall strukturierte BigQuery-Tabellen sein.

Informieren Sie Vertex AI über den Datentyp, den Sie aus BigQuery verwenden möchten.

Ich benötige einen eindeutigen Namen für meinen Datenspeicher. Ich wähle ihn aus. Vertex AI wird diese Informationen verarbeiten. Danach kann ich loslegen.

Erstellen einer GenAI-Chat-App mit BigQuery und Vertex AI

Während meine Such-App realisiert wird, erstelle ich auch eine GenAI-Chat-App.

Das Erstellen einer Chat-App mit Vertex AI verläuft genauso, wie ich es Ihnen gerade anhand der Such-App gezeigt habe. Dieses Mal führt mich Vertex AI jedoch durch die Konfiguration eines auf Konversation ausgelegten Agenten.

Sobald ich mit der Konfiguration der auf Konversation ausgelegten Chat-App fertig bin, wähle ich meinen Datensatz aus. Ich erstelle einen neuen Datenspeicher aus einer anderen Version der Kundenservice-Interaktionsdaten, die im unstrukturierten PDF-Format im Google Cloud Storage vorliegen.

Hinweis: Fivetran kann alle Typen strukturierter oder halbstrukturierter Daten in BigQuery verschieben, einschließlich relationaler Tabellen, CSV, JSON, XML, Parquet, Avro und so weiter. Dieses PDF habe ich jedoch separat in GCS eingefügt, zusammen mit einigen der halbstrukturierten Dokumente, die ich mit Fivetran in GCS verschoben hatte.

Werfen Sie einen Blick auf die GenAI-Such-App in Vertex AI

Dies war die strukturierte Form des Interaktionsdatensatzes. Ich wechsele jetzt zur Vorschauseite der Suche und führe ein paar einfache Suchvorgänge aus. Ich habe einfach nur die standardmäßige Konfiguration verwendet.

Wenn ich meine Suchergebnisse formatieren möchte, ist das ganz einfach und Vertex AI bietet auf der Widget-Registerkarte einige schöne Steuerelemente.

Testen der GenAI-Chat-App in Vertex AI

Das Modell für meine Chat-App für den Kundenservice wird noch trainiert, daher werde ich die CS-Chat-App verwenden, die ich zuvor erstellt habe. Es handelt sich um denselben Datensatz für die Interaktionen im Kundenservice.

Für den Chat bringt Vertex mich in die Dialogflow-CX-Palette, wo ich meinen Agent testen kann. Es handelt sich um einen relativ kleinen Datensatz. Denken Sie aber daran, dass er zielgerichtet und kontextbezogen ist, was entscheidend ist.

Ich werde im Simulator einige Tests ausführen und den Agent dann zu einer simulierten Website in CodePen hinzufügen. Dazu werde ich einige typische Kundendienstfragen stellen. Ich werde Fragen zu Versandoptionen, Auftragsstornierungen und Auftragsänderungen stellen und mir ansehen, wie die Vertex AI-Chat-App die einzelnen Fragen beantwortet.

Das Modell wurde schnell trainiert und die App wurde unglaublich schnell erstellt. Mit den bisherigen Antworten bin ich bis jetzt zufrieden.

Das ist sehr, sehr cool. Ich musste nichts spezifisch konfigurieren oder einrichten und keine Beispielantworten, Testantworten, Fragen oder Ähnliches eingeben.

All dies passiert in Echtzeit. Und natürlich kann alles innerhalb von Vertex AI weiter optimiert werden. Ich bin mit dieser Anwendung zufrieden und möchte sie jetzt veröffentlichen. Vertex AI generiert automatisch den Code, den ich benötige, um den Agent zu meiner Website hinzuzufügen.

Hinzufügen der Vertex AI-Chat-App zu meinem CodePen-Website-Simulator

Da ich keine Website besitze, werde ich CodePen verwenden. Hier ist der Link zu CodePen; darüber können Sie die Umgebung ausprobieren, falls Sie sie noch nicht benutzt haben. Es handelt sich um eine Online-Community für das Testen und Präsentieren einfacher Apps und eigener Code-Snippets.

Ich nenne diesen Pen „Customer_Service_Chat“. Ich muss nur noch den Code einfügen, den Vertex für mich generiert hat. Jetzt sollte die blaue Sprechblase in der Ecke anzeigen, dass mein Agent einsatzbereit ist. Ich erwarte, dass das Verhalten dem sehr ähnlich ist, das ich im Vertex-Simulator gesehen habe.

My tests included a quick greeting to be friendly and then questions about shipping options and a couple of other things like we did previously directly in the Vertex simulator.

Insgesamt bin ich mit der Chat-App sehr zufrieden. Beeindruckt bin ich von der Einfachheit der Integration des Datensatzes, vom Aufbau, von der Integration, von der Leistung und von der Tatsache, dass ich kein Team von Daten- und ML-Technikern für 8, 10, 12 oder mehr Sprints gebraucht habe.

Bei der Gelegenheit: Ein paar weitere Funktionen der Vertex AI-Chat-App

Die Agent-Einstellungen von Vertex AI für diese Chat-App sind interessant.

Auf der Registerkarte „Generative KI“ können Sie sehen, dass ich Gemini Pro verwende, aber verschiedene Modelle zur Auswahl habe.

Wenn Ihre Chat-App auf Audio-Prompts reagieren soll, können Sie ganz schnell ein Telefon-Gateway einrichten, indem Sie eine verfügbare Telefonnummer auswählen. Bei meinem Test des Gateways waren die Antworten der Chat-App nahezu identisch mit den Antworten der Web-App.

Wenn Sie mehr Datenanreicherung und -transformation benötigen

Ich möchte noch einmal kurz auf Fivetran Transformations zurückkommen. Fivetran bietet eine nahtlose Integration mit dbt mit über 20 Quickstart-Datenmodellen für zwei der Konnektoren, die ich heute eingerichtet habe, Jira und Zendesk.

Mit Fivetran Quickstarts können Sie mithilfe vorgefertigter Datenmodelle automatisch analysefähige Tabellen erzeugen. Die Daten werden ohne Code transformiert und es sind keine zusätzlichen dbt-Projekte oder Tools von Drittanbietern erforderlich. Sie können auch mit Dutzenden zusätzlicher dbt-Pakete, die Fivetran entwickelt und bereitgestellt hat, eine Verbindung zu Ihrem eigenen dbt Core-Projekt herstellen.

Transformations umfasst eine integrierte Planung. Nach Abschluss der Fivetran-Konnektor-Synchronisierungen löst diese automatisch das Ausführen des Modells aus. Dann können Sie sich die große Auswahl an Konnektoren ansehen, die Quickstart-Datenmodelle, dbt Core und jetzt auch dbt Cloud unterstützen. Ihnen stehen also drei Optionen für unterschiedliche Transformations-Anforderungen zur Verfügung.

Jetzt loslegen

Das Erstellen von GenAI-Apps für Suche und Chat mit Google BigQuery und Vertex AI war einfach und schnell möglich. Fivetran stellt sicher, dass alle Datenbewegungen in die Google Cloud über alle Datenquellen hinweg standardisiert und automatisiert verlaufen. Dabei bieten alle vollständig automatisierten und verwaltete Pipelines Zuverlässigkeit, Skalierbarkeit, Vorhersehbarkeit, Sicherheit und Kontext für GenAI-Anwendungen.

Wenn Sie Fivetran für einen Google Cloud-GenAI-Anwendungsfall oder eine andere Daten-Workload ausprobieren möchten, können Sie Fivetran einfach 14 Tage lang kostenlos testen.

Ich würde mich freuen, von Ihnen zu hören, welche Konnektoren, Daten-Workloads oder Anwendungsfälle Sie gerne als Nächstes präsentiert sehen möchten. Passen Sie auf sich auf!

Über den Autor

Kelly Kohlleffel leitet den Bereich Global Partner Sales Engineering von Fivetran. Er arbeitet zusammen mit einem breiten Ökosystem aus Technologie- und Beratungspartnern an Ansätzen für moderne Datenprodukte und Lösungen. Er moderiert außerdem den Fivetran Data Drip-Podcast, in dem einige der klügsten Köpfe der Daten-Community über ihren Werdegang, ihre Visionen und ihre Herausforderungen sprechen. Vor Fivetran war Kelly Kohlleffel bei Hashmap und NTT DATA (Consulting für Datenlösungen und -services), Hortonworks (im Hadoop-Land) und Oracle tätig. Sie können sich mit Kelly Kohlleffel auf LinkedIn verbinden oder ihm auf Twitter folgen.

Schauen Sie sich unser Webinar zu diesem Thema an, wenn Sie dies lieber im Video erleben möchten
Hier ansehen

Verwandte Beiträge

Automate building ML apps with Databricks, AutoML and Fivetran
Data insights

Automate building ML apps with Databricks, AutoML and Fivetran

Beitrag lesen
When are you ready for artificial intelligence and machine learning?
Data insights

When are you ready for artificial intelligence and machine learning?

Beitrag lesen
10 bold predictions for AI in 2024
Company news

10 bold predictions for AI in 2024

Beitrag lesen
No items found.
What is a database? Definition, types & examples
Blog

What is a database? Definition, types & examples

Beitrag lesen
PostgreSQL vs. MySQL: What you need to know
Blog

PostgreSQL vs. MySQL: What you need to know

Beitrag lesen
Unlock ELT: Essential strategies for data integration
Blog

Unlock ELT: Essential strategies for data integration

Beitrag lesen

Kostenlos starten

Schließen auch Sie sich den Tausenden von Unternehmen an, die ihre Daten mithilfe von Fivetran zentralisieren und transformieren.

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.