Une approche totalement repensée de l’intégration de data via des modern data stack fait gagner du temps d’ingénierie.
Le modern data stack (MDS) est une suite d’outils utilisés pour l’intégration de data. Dans l’ordre du flux de data, ces outils comprennent :
- un pipeline de data ELT entièrement géré ;
- un data lake ou un data warehouse en colonne basé sur le cloud comme destination ;
- un outil de transformation de data ;
- une plateforme de business intelligence ou de visualisation de data.
L’objectif d’une pile de data moderne (MDS pour Modern Data Stack) est d’analyser les data de votre entreprise afin de découvrir de manière proactive de nouveaux domaines d’opportunités et d’améliorer l’efficacité. Étant donné que les MDS sont un concept relativement nouveau, nous répondrons ci-dessous à certaines des questions les plus courantes concernant ses capacités.
[CTA_MODULE]
Qu’est-ce qui différence la pile de data moderne d’une ancienne pile de data ?
La différence la plus importante entre les anciennes piles de data et les piles de data modernes réside dans le fait que ces dernières sont hébergées dans le cloud et nécessitent peu de configuration technique par l’utilisateur. Ces caractéristiques favorisent l’accessibilité pour les utilisateurs finaux, ainsi que l’évolutivité qui permet de répondre rapidement à vos besoins croissants en matière de data sans de longues interruptions liées à l’évolution des instances du serveur local.
En fin de compte, le modern data stack réduit les obstacles techniques liés à l’adoption de l’intégration de data. Les composants d’un modern data stack sont construits en gardant à l’esprit les analystes et les utilisateurs commerciaux, ce qui signifie que les utilisateurs de tous les horizons peuvent non seulement facilement utiliser ces outils, mais également les administrer sans avoir besoin de connaissances techniques approfondies.
Quels sont les avantages d’un modern data stack ?
Le modern data stack permet d’économiser du temps, de l’argent et des efforts. Les coûts peu élevés et en baisse du cloud computing et du stockage cloud continuent de renforcer les économies réalisées grâce à une pile de data moderne par rapport aux solutions locales. Les connecteurs prêts à l’emploi permettent de gagner un temps considérable d’ingénierie, autrement passé à concevoir, construire et maintenir des connecteurs de data, libérant ainsi vos analystes, vos data scientists et vos ingénieurs data pour réaliser des projets de science des data et des analyses à plus forte valeur ajoutée.
Voici quelques témoignages de clients ayant construit une pile de data moderne avec Fivetran :
« Fivetran nous a permis de synchroniser nos data produit, financières, marketing, et les data du service client, vers le data warehouse en moins d’une journée, sans assistance d’ingénierie. Désormais, nos utilisateurs peuvent se concentrer sur la découverte d’informations plutôt que sur la validation des data et le dépannage. »
- Brendon McKeon, directeur des data et de l’analyse, MessageYes
« Fivetran présente un réel avantage : notre personnel peut consacrer son temps à l’optimisation de la valeur des data. Nous pouvons désormais effectuer une analyse plus complète, et ce plus rapidement. Nous nous concentrons sur la modélisation et l’analyse des data plutôt que sur l’ETL. »
- Gustavo Rada, directeur Business intelligence, Exporo
« Fivetran nous a permis d’économiser au moins 20 heures par mois en capital humain, que nous pouvons utiliser pour développer des idées stratégiques afin d’aider l’entreprise à progresser au lieu de procéder à l’extraction et au chargement de data. »
- Sean Rober, directeur de l’analyse, Zenefits
La configuration est-elle complexe ?
C’est très simple ! En étant hébergées dans le cloud et en éliminant les complications liées à la configuration d’une infrastructure, les modern data stacks actuels peuvent être facilement configurés en moins d’une heure.
[CTA_MODULE]
Quels éléments rechercher dans chaque composant du modern data stack ?
Le modern data stack comprend un pipeline de data, une destination, une couche de transformation et une plate-forme d’informatique décisionnelle ou de visualisation de data. Voici les caractéristiques importantes pour chaque composant :
Pipeline de data
Recherchez un outil qui dispose de connecteurs pré-construits pour toutes les sources de data de votre entreprise, qui peut être configuré rapidement pour faire évoluer l’intégration de data, tout en étant entièrement géré pour tenir compte des modifications d’API ou de schéma.
Destination
Votre destination de data doit pouvoir facilement évoluer en termes de calcul et de stockage, sans nécessiter de longues interruptions pour répondre à vos besoins en matière de stockage et d’analyse de data. Des fonctionnalités supplémentaires peuvent être examinées au cas par cas, par exemple selon la manière dont vous allez configurer et fournir le futur contrôle d’accès basé sur les rôles ou exécuter vos modèles d’analyse. Il existe plusieurs critères techniques pour l’évaluation des data warehouses cloud.
Transformations
Votre outil de transformation doit être compatible avec votre destination et disposer de fonctionnalités qui facilitent la traçabilité des data, comme le contrôle des versions et/ou la documentation permettant de définir l’impact des transformations sur vos tableaux.
Business intelligence/visualisation de data
En général, vous devez tenir compte de la mise en œuvre technique (par exemple la définition des variables pour les utilisateurs), la flexibilité de la visualisation et l’accessibilité utilisateur. D’autres critères, tels que la possibilité ou non pour les utilisateurs finaux d’utiliser l’outil en libre-service, dépendent de votre structure de data interne. Nous avons déjà publié un article sur la recherche d’une plateforme d’informatique décisionnelle appropriée.
Quand est-il nécessaire de passer à un modern data stack ?
Il existe deux cas d’utilisation courants pour l’adoption d’un modern data stack. Les entreprises plus grandes ou plus anciennes disposent souvent d’une infrastructure locale à migrer vers le cloud. À mesure que les start-ups et les petites entreprises se développent, elles peuvent construire une pile de data moderne et basée sur le cloud pour remplacer la génération de rapports à petite échelle, manuelle et effectuée dans une application.
Vous ne souhaitez certainement pas être trop à la traîne. Le modern data stack évolue constamment et continuera à propulser l’analyse vers de nouveaux sommets.
Intégration des data
Déterminez le temps nécessaire à vos ressources d’ingénierie pour construire de nouveaux connecteurs de data et maintenir ou mettre à niveau ceux dont vous disposez déjà. Dans quelle mesure cela impacte-t-il les délais d’analyse en aval ? Combien de temps et combien d’argent sont nécessaires ? Aujourd’hui, les entreprises exécutent des modèles data en temps réel ou quasi réel afin de surveiller leurs opérations. Cela nécessite souvent l’utilisation d’un outil ELT moderne et entièrement géré.
Destination
La destination est généralement liée à l’utilisation du calcul et du stockage. Nous entendons souvent que d’anciennes databases sont fréquemment indisponibles en raison d’un stockage saturé ou d’exécutions de requêtes qui durent pendant toute la pause déjeuner. Lorsque cela se produit, il est temps d’effectuer une mise à niveau. 73 % des entreprises affirment que leurs projets de migration vers le cloud prendront plus d’un an, mais il n’existe tout simplement pas d’alternative pour une évolutivité et une centralisation simples. Il vaut mieux effectuer la mise à niveau le plus tôt possible.
Transformations
Dans certains cas, vous pouvez tirer profit des fonctionnalités natives de vos destinations ou de vos outils de visualisation de data afin d’exécuter des transformations, telles que des scripts SQL reproductibles. Pour bénéficier d’une meilleure transparence et de l’évolutivité, vous devriez envisager d’adopter un outil de transformation techniquement accessible à tous les membres de votre équipe, doté de fonctionnalités telles que le contrôle des versions afin de suivre l’historique de vos transformations.
Business intelligence/visualisation de data
De plus en plus de questions sont posées chaque jour aux équipes data efficaces et les outils de business intelligence deviennent rapidement la porte d’accès aux réponses souhaitées. Examinez comment les parties prenantes utilisent les data (tel que les visualisations, les tableaux de bord et les rapports) et ce dont vous aurez besoin pour rendre les data accessibles en libre-service autant que possible.
La première étape de la migration vers le cloud consiste à choisir une destination sur le cloud dans laquelle stocker vos data. Lorsque vous êtes prêts à commencer le déplacement de vos data vers une destination cloud, l’équipe Fivetran est heureuse de vous aider.
Commencer sa premier modern data stack de manière abordable
Si vous configurez une pile de data moderne pour la première fois, nous sommes conscients que le nombre d’options d’outils ETL et de destinations peut s’avérer impressionnant. Pour une infrastructure de data, la fiabilité est essentielle afin que vous et votre entreprise puissiez toujours vous fier aux data.
L’évolutivité est tout aussi importante. Les pipelines simples à configurer et sans maintenance vous aideront à construire une pile de data qui évolue de manière fluide au rythme de votre entreprise, sans générer de problèmes en aval. Les solutions peu chères disponibles peuvent entraîner des coûts cachés, mais heureusement, le forfait gratuit de Fivetran donne aux professionnels comme vous un accès à des pipelines premium gratuitement, afin de ne jamais avoir à sacrifier la fiabilité pour réaliser des économies.
En outre, vous pouvez également transformer vos data entièrement gratuitement grâce aux modèles data Fivetran compatibles avec dbt Core™*. Grâce aux modèles de data à démarrage rapide en un clic, il est possible d’exécuter des transformations sans créer de projet dbt. Si vous êtes un expert dbt, vous pouvez tirer profit de nos modèles data disponibles afin d’automatiser vos transformations après chaque chargement.
Si vous n’en êtes qu’au début de votre parcours et que vous disposez de petits volumes de data, le forfait gratuit de Fivetran et ses transformations gratuites vous permettront d’effectuer toutes les étapes du processus ELT sans frais.
[CTA_MODULE]
*dbt Core est une marque déposée de dbt Labs, Inc. Tous les droits y afférents sont réservés à dbt Labs, Inc.Fivetran Transformations n’est pas un produit ou un service détenu ou approuvé par dbt Labs, Inc.