La recette secrète de la croissance de Databricks en analyse marketing
- L'équipe d'analyse marketing de Databricks est passée de l'enfer des entrepôts de données cloisonnés à un data lakehouse moderne, s'agrandissant d'une personne à cinq en deux ans.
- L'accès à des données fiables a accru la visibilité sur les performances de l'équipe marketing et a contribué à instaurer une culture de responsabilisation.
- Fivetran fait économiser à Databricks plus de 40 heures par mois de temps d'ingénierie – l'équivalent d'un Data Engineer à temps partiel.
- Grâce au temps économisé, l'équipe d'analyse marketing peut désormais se concentrer sur la création de tableaux de bord, la génération d'insights commerciaux et la collaboration avec d'autres équipes sur des projets d'apprentissage automatique.
La situation
Voici Chris Klaczynski : Responsable de l'analyse marketing et utilisateur avancé de Fivetran chez Databricks. En tant que premier membre à temps plein de l'équipe d'analyse marketing de Databricks, Chris a apporté une riche expérience des équipes de comportement client Kindle et Alexa d'Amazon lorsqu'il a rejoint l'entreprise en 2019.
Le rôle de Chris était clair : aider les spécialistes du marketing de Databricks à résoudre leurs problèmes les plus complexes. Databricks – une entreprise qui, à son tour, se targue d'aider les équipes de données à résoudre les plus grands défis mondiaux – a été fondée en 2013 par les créateurs originaux d'Apache Spark, Delta Lake et MLflow. Construite sur une architecture Lakehouse moderne dans le cloud, Databricks combine le meilleur des entrepôts de données et des lacs de données pour offrir une plateforme ouverte et unifiée pour les données et l'IA.
Le problème
La première responsabilité de Chris chez Databricks était de soutenir les principaux objectifs marketing : générer des pipelines, développer la base de données et améliorer le retour sur investissement. Mais à mesure que Databricks se développait rapidement, le besoin de données centralisées et documentées devenait de plus en plus évident. Des silos de données apparaissaient dans l'entreprise, y compris au sein de l'équipe marketing de Chris, où les données étaient stockées dans leur propre entrepôt de données.
Il était essentiel que les tableaux de bord nouvellement créés par Chris soient alimentés par des données fiables et opportunes pour que les opérations marketing continuent de fonctionner sans accroc – mais sans ressources d'ingénierie dédiées, et face à une équipe marketing en pleine expansion, la mise à l'échelle en fonction de la demande est devenue quasiment impossible.
« 97 % de mon travail consistait à maintenir les systèmes en marche. Sortir de cet enfer de données a été une amélioration majeure de ma qualité de vie. »
Lorsque Chris a rejoint Databricks, les données étaient assemblées à l'aide de Notebooks, d'Alteryx et de pipelines hérités des équipes centrales. Ce n'était pas une approche évolutive, et Chris recevait des quantités d'e-mails de la part des responsables marketing qui ne faisaient pas confiance à leurs données et à leurs rapports. Databricks était confronté à plusieurs défis avec son entrepôt de données traditionnel :
- Des problèmes avec leurs pipelines Salesforce et Marketo en particulier – ils ne parvenaient pas à intégrer nativement les données au format Delta et devaient utiliser Parquet comme solution de contournement.
- Les problèmes d'ajout natif de données aux tables existantes nécessitaient l'utilisation de tables temporaires et d'un ETL plus complexe.
- Les modifications de schéma cassaient systématiquement les pipelines, entraînant des pannes et des données obsolètes et peu fiables.
De ce fait, les parties prenantes ne pouvaient pas discerner si une information pertinente était réelle ou simplement un problème de qualité des données. L'équipe de Chris perdait la confiance des parties prenantes chaque fois que leurs données ne correspondaient pas aux systèmes sources. Cela entravait la planification, l'allocation budgétaire et d'autres prises de décision.
La solution
Chris a commencé à chercher une solution clé en main, à faible code, qui fournirait à son équipe les pipelines fiables dont elle avait besoin. Une stratégie en trois points a guidé sa recherche :
- Sortir de la « jungle » de l'ingénierie des données pour se concentrer sur les insights et l'analyse prédictive.
- Embaucher des analystes et des experts numériques (SME), et non des ingénieurs de données et des DevOps.
- Être autonome avec nos pipelines de données et utiliser Delta et AutoML.
« Nous ne voulions pas faire de l'ingénierie des données – nous voulions nous concentrer sur la fourniture d'insights et la réalisation d'analyses qui génèrent des résultats commerciaux. »
Fivetran s'est immédiatement imposé comme une solution aux besoins de Chris en matière de pipelines de données. Lors de l'essai du produit, la configuration s'est avérée rapide et simple. « Nous avons suivi les instructions rapides, configuré un cluster, mis les adresses IP sur liste blanche et nous étions opérationnels en quelques jours. »
L'équipe de Chris utilise désormais Fivetran pour importer des données de tous ses systèmes sources marketing principaux : Marketo, Salesforce, Facebook Ads et Google Analytics. « Pour faire simple, ça marche tout simplement. » Une fois dans leur lakehouse, l'équipe de Chris combine les données avec d'autres sources provenant des équipes Produit et Centrales, les transformant de manière significative pour exécuter des projets de science des données, d'apprentissage automatique et générer des tableaux de bord Tableau essentiels pour l'analyse.
Le Bilan
Chris soutient désormais une équipe de données en pleine croissance, composée d'analystes et de responsables qui, à leur tour, fournissent des informations cruciales à plus de 90 spécialistes du marketing. Au total, Fivetran fait économiser à Databricks plus de 40 heures par mois en temps d'ingénierie, soit l'équivalent d'un ingénieur de données à temps partiel.
« Au lieu d'embaucher le type de personnel d'ingénierie traditionnel, Fivetran nous permet de nous concentrer sur la valeur commerciale, en embauchant des analystes, des créateurs de tableaux de bord, des experts en analyse web et en médias payants. Notre infrastructure est beaucoup plus vaste et plus avancée qu'il y a un an ou deux. »
En faisant appel à Fivetran pour gérer l'ingestion de données, Chris a libéré du temps pour créer une suite complète de tableaux de bord Tableau qui répondent aux questions les plus fréquentes de son équipe marketing, faisant gagner du temps à son équipe et lui permettant de se concentrer sur la création de valeur avec trois projets de science des données et d'apprentissage automatique :
- Des prévisions précises au niveau de la campagne pour permettre aux responsables de comprendre leur progression et si leurs performances sont conformes aux attentes.
- Un modèle d'impact causal qui détermine l'impact d'un événement client spécifique sur leur consommation.
- Un modèle de propension qui prédit la participation à un événement en fonction du comportement antérieur, permettant aux équipes d'être plus ciblées dans leur marketing par e-mail.
Les impacts en aval des décisions de Chris se font déjà sentir en interne chez Databricks. Le service client et le succès client ont constaté la facilité du processus et demandent que davantage de cas d'utilisation et de connecteurs soient activés.
« En utilisant Fivetran, nous pouvons importer de nouvelles sources de données que nos nouvelles recrues utiliseront – des domaines que nous n'avons pas explorés en profondeur. Ils peuvent être opérationnels immédiatement et commencer à créer des tableaux de bord sans délai. Ils n'ont pas à construire de pipelines, ni à se familiariser avec les notebooks ou à écrire du code. Ils ont un accès immédiat aux données afin de pouvoir se concentrer sur les informations et l'établissement de relations avec leurs parties prenantes. »
L'accès à des données fiables a été essentiel pour les responsables de comptes marketing, qui sont désormais plus responsables des prévisions qu'ils établissent. Une visibilité accrue grâce à des tableaux de bord sophistiqués a facilité le suivi et l'action rapide des équipes sur les performances des campagnes.
Ingérer des données dans un Delta Lake ? Découvrez le portail partenaires Databricks pour en savoir plus sur la puissance de Databricks et Fivetran.
Visitez la page de Fivetran sur les Analyses Marketing pour découvrir comment vous pourriez centraliser vos données marketing de manière rapide, fiable et en temps réel.
Téléchargez ce Rapport IDC pour découvrir comment Fivetran génère des millions en retombées financières et permet de nouvelles initiatives commerciales pour les entreprises.

Découvrez comment l'automatisation du mouvement de data stimule la productivité et accélère l’obtention d’informations pour votre entreprise.
Télécharger le rapport
Découvrez comment Fivetran booste l’IA et l’analytique
Télécharger le guide.png)







.png)
.png)