Plus de 430 000 entreprises à travers le monde s'appuient sur les systèmes ERP SAP pour mener à bien leurs opérations, dont 98 des 100 plus grandes entreprises mondiales. Les systèmes SAP servent de socle à de nombreuses entreprises, en gérant des processus essentiels tels que les finances, la gestion des stocks, la gestion de la relation client et la gestion du capital humain. Les data provenant de tous ces systèmes sont inestimables, car elles permettent d'avoir une vue d'ensemble des opérations d'une organisation, de faciliter la prise de décision et de favoriser l'innovation sous toutes ses formes.
Alors que les produits SAP sont hautement personnalisables, l'écosystème SAP est fermé de par sa conception, un exemple classique de la façon dont les fournisseurs peuvent rendre leurs clients dépendants de leurs services. Les clients ont souvent du mal à accéder à leurs propres data et à les utiliser sur des plateformes tierces, ce qui complique l'analyse et entrave l'innovation. Au lieu de cela, SAP pousse ses clients à utiliser sa plateforme de data propriétaire sous-développée.
Notre équipe s'est entretenue avec plusieurs entreprises internationales qui souhaitent intégrer leurs data SAP dans des data lakes ou data warehouses. modernes. Bien qu'il existe plusieurs solutions, comme l'utilisation d'une plateforme tierce pour l'analyse, le stockage et autres, les clients se sentent obligés de choisir entre les deux :
- Paiement d’un supplément pour une licence de base de données SAP HANA d'entreprise afin d'accéder à leurs data
- Utilisation de Datasphere comme un outil ELT coûteux, avec des frais supplémentaires pour les data sortantes
- Création d’une architecture fédérée dans Datasphere qui a du mal à passer à l'échelle
Réduction du choix des clients
Au fil des versions successives de ses produits, SAP a pris des mesures claires pour tenter de limiter la manière dont les clients extraient les données, en orientant les utilisateurs vers des produits certifiés SAP et en les éloignant des solutions génériques ELT/ETL. Cette approche s'est poursuivie avec son produit phare actuel, SAP S/4HANA, lancé pour la première fois en 2015, et s'est intensifiée depuis.
En 2022, la note SAP 2971304 a soulevé des préoccupations concernant la réplication basée sur les journaux. Dans un blog de 2023, SAP a déclaré sans ambages qu'il ne certifierait plus les fournisseurs d'intégration de data non-SAP, ce qui a effectivement limité les outils que les clients pensaient pouvoir utiliser pour accéder à leurs data. La note 3255746, publiée en juillet 2024, visait à interdire l'approche populaire consistant à utiliser l'ODP (Operational Data Provisioning) via les RFC (Remote Function Calls, appels des fonctions à distance). Ces mises à jour à mi-parcours sont le signe d'une insistance croissante en faveur des solutions propriétaires de SAP par rapport aux options tierces qui ont fait leurs preuves.
Sur ECC et S/4 HANA, SAP permet aux clients d'accéder directement à leur base de données pour extraire des data SAP, mais seulement si les clients ont acheté une licence de base de données d'entreprise. Cette licence est souvent vendue plusieurs fois plus cher que la licence d'exploitation, introduisant des frais inattendus qui peuvent faire exploser les budgets et prendre les clients au dépourvu.
Les voies de mise à niveau des produits SAP incitent de plus en plus les clients à opter pour RISE with SAP, leur service géré basé sur le cloud. RISE est le plus souvent vendu avec une licence d'exploitation restreinte qui n'autorise pas l'accès direct à la base de données ; les clients doivent utiliser des interfaces définies par SAP. L'accès direct et la prise en charge d'outils d'extraction tiers ne sont donc pas inclus par défaut et nécessitent l'achat d'une licence d'entreprise. Cela limite la capacité des clients à accéder librement à leurs propres data, à les extraire et à les gérer, et continue d'illustrer la stratégie de longue date de SAP consistant à maintenir les data client attachées à sa plateforme.
Si cette approche a permis de fidéliser les clients dans les années 1990, elle est aujourd'hui dépassée. Les entreprises modernes, telles que Salesforce, ont démontré que le fait d'offrir aux clients une plus grande flexibilité sur leurs data renforce en fait la fidélité des clients et la valeur de la plateforme. SAP ne doit pas avoir peur de l'ouverture et de l'interopérabilité ; il est peu probable que les clients qui utilisent SAP pour leur ERP ou d'autres systèmes critiques quittent l'entreprise en raison de la force et de l'importance inhérentes des services de SAP. Si SAP adoptait des pratiques plus ouvertes, les clients seraient en mesure de tirer une plus grande valeur de leurs data SAP dans des plateformes data modernes, ce qui, en retour, donnerait plus de valeur à SAP.
SAP Datasphere
Pour répondre au besoin croissant des clients d'intégrer et d'analyser des data dans tous les systèmes, SAP a lancé Datasphere (anciennement SAP Data Warehouse Cloud) en tant que centre d'intégration des data SAP et non-SAP. SAP oriente ses clients vers Datasphere, qu'elle considère comme la seule plateforme de data viable, en particulier lorsqu'il s'agit d'accéder à des fonctionnalités plus récentes telles que l'IA et la modélisation avancée.
SAP positionne Datasphere comme l'avenir de l'entreposage de data et de l'analyse, tout en abandonnant progressivement les outils existants tels que SAP Business Warehouse. De même, la prise en charge de l'ECC devrait prendre fin en 2027, avec des extensions optionnelles jusqu'en 2030. Pour prolonger la maintenance de l'ECC jusqu'en 2033, les clients doivent adopter SAP RISE, ce qui nécessite une migration et limite les options pour les clients qui préfèrent utiliser des systèmes locaux ou des architectures hybrides. Ces mesures reflètent la stratégie plus globale de SAP visant à consolider ses clients au sein de son propre écosystème cloud.
Qu'il s'agisse d'analyse, de tableaux de bord ou d’IA générative, les entreprises ont besoin de centraliser les data SAP et non-SAP. Toutefois, l'exportation de data de Datasphere vers des destinations non-SAP entraîne souvent des coûts supplémentaires. Si l'on ajoute à cela l'abandon d'outils tels que SAP Business Warehouse et la migration vers SAP RISE, les clients se retrouvent avec moins de choix pour la mise en œuvre technique de leur stratégie data et des prix de plus en plus élevés.
Datasphere fait pâle figure face aux plateformes data modernes
Par rapport aux data lakes et data warehouses tiers tels que Snowflake, Databricks, Google BigQuery et Redshift, Datasphere manque de rentabilité, de flexibilité, d'interopérabilité et de performance, ainsi que de certaines capacités analytiques et de traitement des data non structurées. Lors de multiples conversations avec les clients, plusieurs thèmes récurrents sont apparus.
Coûts exorbitants
Datasphere propose un modèle tarifaire fragmenté, comprenant des frais fragmentaires et imprévisibles pour les fonctions de calcul, de stockage, de catalogue, d'accès aux data lakes et d'autres fonctions.
Faible interopérabilité
En amont, Datasphere donne la priorité aux intégrations natives de SAP et propose un nombre très limité de connecteurs entrants et sortants, que les clients doivent payer séparément.
En aval, Datasphere ne fonctionne pas bien avec les outils et les plateformes de tiers. L'utilisation par Datasphere de vues CDS et d'une modélisation spécifique à HANA empêche l'interopérabilité avec des outils de transformation et de modélisation open-source tels que dbt. Les changements de schéma sont fragiles et nécessitent des modifications manuelles des vues SAP, même pour des tâches simples comme l'ajout d'une colonne. Seules les définitions DDL ou les définitions de vues limitées sont valables, et il existe des lacunes dans la compatibilité des fonctions SQL.
La situation n'est pas meilleure pour la visualisation des data et la veille économique. Un client a indiqué qu'il avait dû créer plusieurs couches de vues pour que des tableaux de bord simples fonctionnent dans Tableau, car Tableau ne peut pas interroger directement les tables dans Datasphere en raison de la modélisation spécifique de SAP.
Même avec la copie zéro, l'intégration d'énormes ensembles de data avec des exigences de faible latence peut s'avérer difficile.
Limites architecturales
Les ressources de calcul et de stockage de Datasphere sont incluses dans ce que SAP appelle « l'application principale », qui contribue à l'utilisation des unités de capacité. Bien que SAP ne précise pas si ces ressources peuvent être déployées à grande échelle de manière indépendante, le modèle tarifaire groupé implique une élasticité limitée. Cela peut entraîner des inefficacités dans les charges de travail dynamiques où les besoins en calcul ou en stockage varient de manière indépendante.
En outre, des clients ont signalé des problèmes de performance dans SAP Datasphere liés à l'allocation de mémoire, en particulier lors de l'exécution de transformations complexes. Dans certains cas, une gestion insuffisante ou incohérente de la mémoire a conduit les équipes à transférer les charges de travail les plus exigeantes sur d'autres plateformes. Comme l'a indiqué un client, il « s'appuie toujours sur Snowflake parce que cette plateforme gère l'allocation de mémoire de manière plus fiable ».
Les plateformes data modernes sont conçues pour répondre aux besoins des entreprises en matière de data
Pour toutes les raisons susmentionnées, de nombreuses organisations préfèrent encore centraliser les data SAP dans des data lakes et des data warehouses tels que Snowflake, Google BigQuery, Databricks ou Redshift, car ces plateformes offrent :
- Rentabilité et évolutivité. Tarification transparente basée sur l'utilisation, avec une facturation prévisible du calcul et du stockage et moins de suppléments inattendus.
- Capacité de traiter en temps réel de grands ensembles de data provenant de diverses charges de travail et de prendre en charge des modifications rapides des schémas
- Interopérabilité entre les fournisseurs de services cloud, les applications SaaS, les principales plateformes BI, etc.
Toutes les capacités critiques pour l'IA et l'analyse avancée.
Annonces récentes de SAP
L'annonce en février 2025 de SAP Databricks, intégrée dans SAP Business Data Cloud (BDC), est actuellement limitée aux clients de SAP RISE Private. BDC introduit également un modèle tarifaire par abonnement, distinct du Business Technology Platform Enterprise Agreement (BTPEA) de SAP. Bien que Databricks soit inclus dans la structure de licence BDC, cela représente un investissement supplémentaire qui s'ajoute aux dépenses existantes de SAP Datasphere. L'intégration peut également introduire une complexité architecturale, les organisations devant naviguer dans deux écosystèmes distincts, ce qui peut compliquer la gouvernance data et l'interopérabilité.
Qu'en est-il des clients de SAP ?
Pour justifier ces contraintes, SAP invoque l'intégrité du système et l’assistance spécialisée. Mais si l'objectif est vraiment la performance et le succès des clients, pourquoi imposer autant d'obstacles à la liberté des data ou pousser les clients dans un écosystème fermé qui limite l'intégration avec les meilleurs outils ?
En réalité, les clients veulent et méritent d'avoir le choix. Les équipes data doivent avoir la liberté de créer la meilleure architecture data pour leurs objectifs, qu'elle inclut SAP ou non. C’est là que Fivetran entre en jeu.
Fivetran propose une approche moderne de l'intégration des data SAP, permettant aux clients de centraliser leurs data SAP et non-SAP dans des plateformes de data cloud avec un minimum d'efforts d'ingénierie. Nous aidons les entreprises à éviter la dépendance vis-à-vis des fournisseurs, à réduire leur coût total de possession et à réduire le délai d’obtention d’informations.
Dans la prochaine partie de cette série, nous explorerons les voies pratiques à suivre pour les clients de SAP qui cherchent à moderniser leur pile de data, à s'affranchir des licences restrictives et à exploiter une véritable agilité à leur convenance.
[CTA_MODULE]