Les plus grandes entreprises internationales, dont 98 des 100 plus grandes entreprises du monde, s'appuient sur les systèmes ERP SAP pour mener à bien leurs opérations. Les systèmes SAP servent de socle à plus de 430 000 entreprises clientes à travers le monde et gèrent des processus essentiels tels que les finances, la gestion des stocks, la gestion de la relation client (CRM) et la gestion du capital humain (HCM). En tant qu'épine dorsale des opérations de l'entreprise, les data générées à l'aide de SAP sont cruciales pour toutes sortes d'analyses, du reporting à l'intelligence artificielle en passant par la veille économique.
Bien que SAP ait été conçu dans une optique de personnalisation, ses pratiques commerciales limitent de plus en plus l'accès des clients à leurs propres data ainsi que leur utilisation, en particulier en ce qui concerne les data pour l’analyse. La stratégie manifeste de SAP consiste à conserver les data à l'intérieur des systèmes SAP, ce qui limite considérablement la capacité des clients de SAP à extraire des data de ses applications et à utiliser des référentiels de data tiers.
Dans cette série de blogs, nous aborderons les thèmes suivants en détail :
- Tentatives de SAP pour limiter le mouvement des data et comparaison de Datasphere, sa plateforme data propriétaire, avec les options tierces
- Comment déplacer efficacement et en toute sécurité des data à partir de divers systèmes ERP SAP, tout en respectant les directives SAP
- Entreprises qui ont réussi à transférer leurs data hors de SAP afin de réaliser des gains d'efficacité, d’obtenir une vue client à 360°, etc.
Voici un résumé de chaque thème.
SAP Datasphere et les plateformes data modernes
Les data provenant des ERP sont intrinsèquement difficiles à intégrer en raison de la complexité et de la personnalisation des systèmes sous-jacents. Toutefois, ces dernières années, SAP a intensifié ses efforts pour encourager les clients à adopter des produits certifiés SAP et à abandonner les solutions génériques ELT/ETL. Cette démarche s'inscrit dans une approche concertée visant à promouvoir leurs propres offres de gestion et d'analyse des data et à exclure l'utilisation d'autres solutions. Dans un blog de 2023, SAP a déclaré sans ambages qu'il ne certifierait plus les fournisseurs d'intégration de data non-SAP, limitant ainsi les outils que les clients peuvent utiliser pour accéder à leurs data. En 2024, SAP a interdit l'utilisation d'ODP (Operational Data Provisioning) via les RFC (Remote Function Calls), une méthode d'extraction data très répandue.
SAP Datasphere, lancé en 2023, est un data warehouse propriétaire avec des connecteurs natifs pour les data des applications SAP. L'intention manifeste de SAP est d'intégrer verticalement l'ensemble des data, en décourageant l'adoption de data warehouses et de data lakes tiers. Toutefois, par rapport aux offres de tiers, Datasphere présente plusieurs inconvénients :
- Coûts élevés et évolutivité limitée : Les coûts peuvent exploser en raison de la dépendance de SAP Datasphere à une base de données en mémoire. Lorsque le calcul et le stockage sont étroitement liés, le déploiement à grande échelle devient à la fois coûteux et inefficace.
- Écosystème fermé et interopérabilité limitée : Datasphere ne prend en charge que les outils de modélisation spécifiques à SAP, offre une compatibilité limitée avec les plateformes BI tierces et fournit une prise en charge restreinte et coûteuse des sources de data externes.
- Lacunes dans la prise en charge des architectures data modernes : Il n'y a pas de prise en charge native pour Delta Lake, Iceberg ou Kafka. L'intégration des data lakes est limitée au stockage des lakes HANA, un module complémentaire payant. Les modifications de schéma sont fastidieuses et la prise en charge SQL est limité. Dans l'ensemble, les fonctionnalités sont limitées par rapport aux outils modernes d'entreposage dans le cloud.
Il en résulte que les clients de SAP sont confrontés à des choix limités, coûteux et non évolutifs. En résumé : Les plateformes modernes telles que Databricks, Snowflake et BigQuery offrent des socles bien plus capables, flexibles et performants pour l’analyse que les outils de SAP. Le véritable défi n'est pas de décider si l'on doit déplacer les data, mais de trouver comment extraire les data de SAP de manière efficace et fiable.
Une plongée technique dans la centralisation des data SAP par Fivetran
Les data, y compris celles des applications SAP, sont plus performantes lorsqu'elles sont extraites et combinées avec d'autres sources de data critiques, telles que les CRM, les fichiers multimédias non structurés, les applications SaaS et d'autres bases de données. En fin de compte, le client reste propriétaire des data et, malgré les restrictions juridiques et techniques imposées par SAP, il est toujours possible d'extraire et de charger des data SAP dans des systèmes tiers, tout en respectant les directives.
Fivetran réalise l'extraction data via une connexion RFC (Remote Function Call, appel des fonctions à distance) SAP, que SAP met à disposition des intégrations tierces depuis des décennies. Ce RFC s'interface avec une composante Module de fonction SAP de Fivetran au sein de l'application SAP NetWeaver, connu sous le nom de Fivetran NetWeaver API. Cette composante :
- Collecte et traite les data modifiées à l'aide de pointeurs de modification dans les systèmes SAP et de déclencheurs sur les tables, ce qui limite les frais généraux supplémentaires sur la source SAP.
- Valide et compresse les data pour un transfert optimisé, en utilisant au mieux la capacité disponible du réseau.
Comme la solution de Fivetran repose uniquement sur la couche d'application standard NetWeaver de SAP pour l'extraction data, elle fonctionne avec les environnements HANA d'entreprise et d'exploitation, y compris les systèmes déployés dans SAP RISE Private. Pour les clients ECC disposant d'une licence d'entreprise, Fivetran peut se connecter directement à la base de données (Oracle ou SQL Server). Fivetran prend également en charge l'approvisionnement à partir de points d'extrémité SAP OData, ce qui permet la réplication à partir de SAP RISE Public, c.à.d. Grow with SAP.
.png)
Les destinations comprennent tout l’éventail des datalakes et des data warehouses tels que Snowflake, Databricks, Google Cloud Platform, S3, etc. En outre, Fivetran prend en charge les charges de travail et les architectures comprenant des systèmes cloud, hybrides et locaux.
Comment les grandes entreprises utilisent Fivetran pour éliminer les obstacles liés aux data SAP
Des entreprises de premier plan de différents secteurs utilisent Fivetran pour répliquer en toute sécurité des data SAP et non-SAP vers le cloud, avec rapidité, à grande échelle et sans aucune dépendance vis-à-vis des fournisseurs.
Par exemple, pour unifier son paysage data, le détaillant de luxe LVMH s'est tourné vers Fivetran pour automatiser et standardiser l'intégration des data dans des dizaines de systèmes, y compris SAP. L'entreprise a automatisé le mouvement des data de SAP et de plus de 60 autres sources vers BigQuery, éliminant ainsi les pipelines de data manuels dont l'exploitation et la maintenance étaient coûteuses. Cela a entraîné une visibilité instantanée sur les transactions de vente, la livraison des produits et les performances financières - une percée dans un environnement SAP historiquement complexe.
L'entreprise de matériaux de construction Cemex a fait appel à Fivetran pour répliquer les data de ses 7 instances SAP ECC et HANA. Grâce à Fivetran, Cemex est passé d'un travail par lots toutes les heures à des mises à jour en temps réel toutes les 2 minutes, ce qui a considérablement accéléré la prise de décision. Les équipes peuvent désormais analyser à la demande des data provenant de n'importe quelle région, ce qui permet d’optimiser les cas d'utilisation critiques dans l'ensemble de l'entreprise.
Pitney Bowes, leader de la technologie B2B, a remplacé ses scripts batch personnalisés et ses anciens outils ETL par les pipelines automatisés de Fivetran, spécialement conçus pour SAP. Les temps de chargement des lots ont été réduits de 95 %, le traitement des data passant de plusieurs jours à moins d'une heure. Grâce à Change Data Capture (CDC), l'entreprise synchronise désormais les data SAP plusieurs fois par jour, au lieu de tous les 2 ou 3 jours, et ce sans impact sur les systèmes sources.
Dans de nombreux secteurs, les entreprises ont la possibilité d'utiliser les data SAP en dehors de l'écosystème SAP et de les combiner avec des data provenant d'autres sources, ce qui permet d'obtenir des informations en temps réel sans compromettre la sécurité ou les performances.
Examen détaillé des offres de SAP
Les applications SAP contiennent certaines des informations les plus précieuses et les plus sensibles d'une entreprise, qu'il s'agisse des dossiers financiers ou des data client et employé. La valeur de ces data ne fait qu'augmenter lorsqu'elles sont combinées avec des data provenant d'autres sources, que ces data proviennent du cloud, de réseaux privés ou de systèmes locaux. Pourtant, pour de nombreux clients de SAP, ces data sont extrêmement difficiles à extraire et à charger dans les plateformes data de leur choix.
Dans le prochain article de cette série, nous aborderons la racine du problème : L'écosystème étroitement contrôlé de SAP. Des architectures restrictives aux coûts technologiques cachés, nous examinerons comment ces limitations peuvent empêcher les clients de découvrir des informations critiques pour l'entreprise - et ce qu'ils peuvent faire pour y remédier.
[CTA_MODULE]