Data Stack
- Pipeline: Fivetran
- Quellen: Über 40, darunter PostgreSQL, SQL Server, Oracle, NetSuite, Workday, Salesforce
- Destinations: Snowflake, AWS Data Lake
- Transformations: dbt Cloud
Autodesk ist ein Fortune-1000-Unternehmen, das Softwareprodukte für eine Vielzahl weltweiter Branchen entwickelt. Mit über 100 Produkten für die Bereiche Architektur, Ingenieurwesen und Konstruktion, Produktdesign und Fertigung sowie Medien und Unterhaltung hatten Sie wahrscheinlich schon einmal Kontakt mit einem Ort oder einem Produkt, bei dem die Autodesk-Software im Mittelpunkt stand – sei es in Wolkenkratzern oder im Bildmaterial für Filme.
Ein großes Software-Portfolio bringt eine Menge Daten mit sich. Tatsächlich handelt es sich um Petabyte an Daten. Für die Verwaltung seiner Analytics Data Platform verlässt sich das Unternehmen auf Mark Kidwell, Chief Data Architect of Data Platforms and Services.
Mark Kidwells wichtigste Aufgaben:
- Modernisierung und Optimierung der Datenplattformen mit erstklassigen Tools, um die Leistung zu verbessern und gleichzeitig die Kosten im Griff zu behalten
- Beschleunigung der Bereitstellung von Daten für Teams, die diese für Analysen benötigen – z. B. die Bereiche für Marketing, Vertrieb, Umsatz und Produkt
Bereitstellung von Data-as-a-Service mit zuverlässigen Pipelines
Die Analytics Data Platform von Autodesk ist die zentrale Anlaufstelle für Teams, um kritische Produktnutzung nachzuvollziehen – alles von Abonnements über das Kundenverhalten bis hin zum Zustand des Unternehmens. Mit einer Data Lake-Architektur war der Zugriff auf Daten für Analysen jedoch kompliziert und fehleranfällig.
„Mit unseren bisherigen Tools und Prozessen konnten wir nicht einmal einen ansatzweisen Self-Service ermöglichen. Wir hatten ein zentrales Ingestion-Team, das sich ausschließlich um die Ingestion-Anfragen gekümmert hat. Diese Arbeit konnte nur dieses Team erledigen.“
– Mark Kidwell, Chief Data Architect of Data Platforms and Services
Mark Kidwell wusste, dass sich die Analytikdatensätze in einem Data Warehouse befinden mussten, damit die über 13.000 Mitarbeiter im gesamten Unternehmen Self-Service-Daten nutzen und problemlos abfragen konnten. Mark griff auf moderne Datentools wie Fivetran, Snowflake und dbt zurück, um die Aufnahme, Transformation und Orchestrierung zu verbessern.
„Im Grunde war es die Entscheidung zwischen einer nicht verwalteten Low-Level-Pipeline, die ausfällt, oder einer Pipeline [wie Fivetran], die Schemaentwicklung, Backfill und weitere Fälle handhabt, von denen wir wissen, dass wir sie nicht unterstützen können“, ergänzt Kidwell.
Dieser Schritt hin zu einem modernen Data Stack erforderte eine große Anstrengung, an der mehrere Geschäftsbereiche beteiligt waren, darunter zwei der vier jüngsten Akquisitionen für Konstruktionsprodukte: BuildingConnected und BIM 360. Das Analytics Data Platform-Team hat seine gesamten geschäftskritischen Daten für die Ausführung auf Snowflake verschoben.
In der ersten Phase wurden lediglich einige wenige Pipelines ersetzt. Nachdem diese erfolgreich migriert waren und der Wert von Funktionen wie die Verarbeitung von Schemaabweichungen und inkrementellen Updates ersichtlich wurde, hat das Team auch seine wichtigsten Datenquellen übertragen.
„Unsere Salesforce-Pipeline, die unser wichtigstes Ingestion-Produkt ist, haben wir zu Fivetran migriert. Im Laufe der Jahre haben wir mehr Nutzer und Anwendungsfälle freigeschaltet, weswegen die Nutzung mit der Zeit ziemlich stark zugenommen hat.“
– Mark Kidwell, Chief Data Architect of Data Platforms and Services
Im Ergebnis haben wir eine zuverlässige Lösung für Data Movement und Warehousing, mit der das Unternehmen unter dem Strich Zeit und Geld spart. „Es funktioniert einfach“, erklärt Kidwell.
Funktionen auf Unternehmensniveau, die die komplexen, hochgradig geschützten Datenanforderungen von Autodesk erfüllen
Das Team der Analytics Data Platform hat Teams und Nutzer schnell und sicher in Fivetran integriert, damit sie ihre eigenen Verbindungen hinzufügen. Fivetran bietet den Nutzern Zugang zu den Pipelines und Destinations, die sie für ihre Arbeit benötigen. Enterprise Data Governance-Funktionen wie Team- und Konnektorberechtigungen, benutzerdefinierte Rollen sowie Teamzugriff und Single Sign-On ermöglichten dem Autodesk-Team eine skalierbare Durchsetzung der Plattformsicherheit für seine große Nutzerbasis.
„Wir haben fast 60 Datenteams erfolgreich auf die Analytics Data Platform migriert, die ihre eigenen Datenprodukte einspeisen, verwenden und teilweise veröffentlichen. Über die Hälfte dieser Teams arbeitet in Fivetran und ist dort unterschiedlichen Destinations und Rollen zugewiesen. Dieser Self-Service-Ansatz bedeutet, dass wir die Regeln für die Plattform festlegen, über die die Teams dann auf ihre Daten zugreifen können, ohne uns kontaktieren zu müssen.“
– Mark Kidwell, Chief Data Architect of Data Platforms and Services
Modernisierung des Data Lake
Nachdem die Grundlagen für Self-Service hergestellt wurden, konzentrieren sich Mark Kidwell und sein Team nun darauf, die Plattform für interne Kunden noch benutzerfreundlicher zu gestalten und weitere Anwendungsfälle zu prüfen wie:
- Metadaten-API: Autodesk hat sich kürzlich für Atlan als Datenkatalog entschieden und plant, diesen noch in diesem Quartal in Fivetran zu integrieren, um einen Datenabgleich zu ermöglichen.
- REST-API: Das Ziel besteht darin, zu einem Unternehmen zu werden, das API-basierte Services und Produkte entwickeln kann. Dabei wird die API von Fivetran eine Schlüsselrolle spielen.
Laden Sie diesen IDC-Bericht herunter und erfahren Sie, wie Fivetran finanzielle Auswirkungen in Millionenhöhe und neue Geschäftsinitiativen für Unternehmen ermöglicht.