Expertenmeinung

Die neueste SAP-Evolution im Bereich Data & Analytics: SAP Datasphere

Donnerstag, 13. April 2023

Kategorie: BI Cloud, Business Intelligence, Controlling, Datenmanagement, Reporting, Self Service BI

Aus SAP Data Warehouse Cloud wird SAP Datasphere! Was steckt hinter dem neuen Release? Bloß ein neuer Name – also anders ausgedrückt reines Marketing – oder verbirgt sich mehr hinter der neuesten Evolution aus dem Hause SAP?

Am 8. März 2023 launchte SAP Datasphere im Rahmen von SAP Data Unleashed, einem virtuellen Event rund um Neuerungen im Kontext Data & Analytics. Auch auf den diesjährigen DSAG-Technologietagen am 22. und 23. März in Mannheim war Datasphere eines der Hot Topics. Und so viel vorneweg: Die Neuausrichtung seitens SAP verspricht einiges und Datasphere bietet bereits einige spannende neue Features.

Werfen wir aber zunächst nochmal einen Blick zurück. Die Entwicklung der Data Warehouse Cloud (DWC) in den letzten anderthalb Jahren war wirklich rasant. Mit jedem neuen Release spürte und spürt man die Intensität und Manpower, mit denen hinter den Kulissen an neuen Features und der Verbesserung bestehender Funktionalitäten gearbeitet wird.

Auf einige der aktuellsten Neuerungen im Rahmen der Umbenennung zu Datasphere werde ich später noch genauer eingehen. Einen detaillierten Blick auf die neue strategische Data Warehousing Lösung von SAP hatte ich bereits in einem früheren Whitepaper gegeben.

In der Praxis zeigte sich in den letzten Monaten, dass die DWC insbesondere beim Thema Datendemokratisierung ein sehr interessanter und relevanter Baustein für Unternehmen werden kann. Durch die zentralen Elemente der Spaces, Sharing-Optionen zwischen den unterschiedlichen virtuellen Bereichen sowie Data Access Controls als wichtige Governance-Elemente auf der einen Seite und der Möglichkeit, Modelle auf Basis eines grafischen Editors zu erstellen. Auf der anderen Seite, ergeben sich mitunter komplett neue Möglichkeiten in der Zusammenarbeit zwischen IT und Business.

Ein Tool alleine ermöglicht natürlich keine Datendemokratisierung im Unternehmen – die technischen Möglichkeiten erfordern immer auch das Vorhandensein von Datenkompetenz innerhalb der involvierten Bereiche (Data Literacy) sowie klar definierte Data & Analytics-Rollen.

Die Agilität sowie die leichte und intuitive Bedienbarkeit bei der Erstellung neuer analytischer Modelle beziehungsweise semantischer Sichten auf vorhandene Datensets sind in der agilen und schnelllebigen Business-Welt ein absoluter Unterscheidungsfaktor im Analytics-Umfeld. Auf der anderen Seite wurden auch die Möglichkeiten aus Entwicklersicht stark erweitert. Ein Beispiel ist hier das Command Line Interface (CLI).

Seit einiger Zeit ist es über das DWC-CLI möglich, gewisse manuelle und vor allem wiederkehrende Tätigkeiten beim Administrieren des Tenants, der Userverwaltung oder dem Erstellen von Tabellen und Views mithilfe der Kommandozeile programmatisch zu lösen – oder besser gesagt zu automatisieren. Das DWC-CLI ist technisch gesehen ein eingeständiges Node.js-Modul. Voraussetzung ist die Installation der letzten node.js-Version auf dem Client. Mithilfe des CLI lassen sich lästige und wiederkehrende Mehrfacharbeiten in der UI reduzieren und wie bereits erwähnt automatisieren – und letztendlich auf diese Weise auch standardisieren.

Seit der Einführung der DWC wurden neue Innovationen im Bereich Data & Analytics nach und nach nur noch im neuen Cloud-Service integriert; ein Beispiel ist hier der Data Marketplace, der mittlerweile etliche Datenmodelle von Drittanbietern bereitstellt.

Ebenso hat man als Unternehmen die Möglichkeit, eigene Datenprodukte nach draußen zu verteilen. Hier denke man zum Beispiel an Lieferanten oder enge Partner, mit denen auf diese Weise noch enger kooperiert werden kann. Sogar innerhalb eines Unternehmens lässt sich der Marketplace nun einsetzen, um beispielsweise Datenprodukte an die eigenen Fachbereiche auszuliefern.

SAP Datasphere – auf dem Weg zur „Business Data Fabric“

Werfen wir nun einen genaueren Blick auf die neueste Evolutionsstufe im Data & Analytics-Portfolio von SAP. Was verbirgt sich hinter dem Begriff Datasphere? Zunächst einmal ändert sich für DWC-Kunden nicht sonderlich viel: Das Look&Feel des Tools ist gleich geblieben, lediglich der Name wurde ausgetauscht und bereits einige neue technische Features hinzugefügt.

Mit Datasphere möchte SAP den Data Fabric Ansatz stärker verfolgen und spricht in dem Zusammenhang nun von einer „Business Data Fabric“. Aber was versteht SAP eigentlich unter diesem Begriff?

SAPs Definition der Business Data Fabric ist im Kern eine Datenmanagementarchitektur für einen virtuellen oder persistierten semantischen Daten-Layer über der darunterliegenden Datenlandschaft (Beispiele: zentrales DWH, Lakehouse, MES- beziehungsweise Produktionsdaten, IoT-Daten etc.) eines Unternehmens. Die Basis für dieses Vorhaben soll mit SAP Datasphere und einem offenen Daten-Ökosystem, das im Zuge einiger strategischen Partnerschaften mit unter anderem Databricks, Collibra, Confluent und DataRobot angekündigt wurde, geschaffen werden. Das grundlegende Ziel, das SAP hiermit verfolgt, ist, einen skalierbaren und einheitlichen Datenzugriff ohne Datenduplikationen im Unternehmen zu ermöglichen.

Als Grundlage einer Business Data Fabric bringt Datasphere sämtliche Funktionalitäten eines modernen Data Tools mit, angefangen vom Datenzugriff via Self-Service & Data Discovery bis hin zur Datenintegration sowie Governance & Security. Data Warehousing, Virtualisierung, die semantische Modellierung von Businesslogik sowie Orchestrierung und Processing als zentrale Datenmanagementaufgaben gehören ebenso zum Funktionsumfang.

Auf dem Weg zum vollumfänglichen Data Tool 

Wer sich bereits mit der DWC beschäftigt hat, wird merken, dass dies nun erstmal nichts Neues ist, denn auch die DWC verfügte schon über die genannten Funktionalitäten. Rein technisch ist Datasphere daher aktuell vielmehr als das neueste Release der DWC zu interpretieren. Dennoch gibt es einige Neuigkeiten. die den Weg der der SAP Datasphere zum vollumfänglichen Data Tool aufzeigen.  Im Folgenden habe ich einige dieser Neuerungen für Sie aufgelistet:

Neue Datenintegrationsmöglichkeiten mit dem Cloud-basierten Replication Flow
Der Replication Flow ist ein Data Intelligence Feature, das nun in Datasphere integriert wurde. Mit der Komponente kann man eine Cloud-basierte Datenreplikation ohne Transformationslogik durchführen und somit große Datenmengen von A nach B bewegen. Ebenso unterstützt der neue Replication Flow den Change Data Capture (CDC). Stand heute ist der Funktionsumfang noch stark eingeschränkt. So stehen derzeit als Ziel beispielsweise lediglich SAP Datasphere, HANA Cloud und HANA Data Lake zur Auswahl. Es wurde jedoch angekündigt, dass zukünftig für den Replication Flow auch Third-Party-Applikationen als mögliches Ziel angeboten werden.

Neues analytisches Modell
Mit dem neuen Artefakt für die semantische Datenmodellierung hat SAP deutlich mehr Modellierungsmöglichkeiten geschaffen. Es ist nun in Datasphere möglich, ein auf die Anforderungen des Business abgestimmtes und optimiertes semantisches Datenmodell mit Variablen, eingeschränkten Kennzahlen und Filtern für die SAC bereitzustellen. Darüber hinaus bietet das neue analytische Modell eine wirklich sehr hilfreiche Datenvorschau bei der Modellierung und eine verbesserte Integration mit der SAC bei der späteren Nutzung.

Nächster Schritt Richtung Datendemokratisierung und Governance mit dem neuen Catalog
Mit Datasphere hat SAP nun auch einen Data Catalog gelauncht. Über den Catalog Crawler werden die Metadaten aus Datasphere automatisch in den Catalog geladen, ebenso lassen sich zusätzlich SAC-Instanzen mit wenigen Klicks integrieren.

Über den Catalog und dessen Suchfunktion kann man seinen Business Usern jetzt einen sehr guten Überblick über die verfügbaren Datenprodukte geben, KPIs definieren, kategorisieren und in den Assets pflegen sowie Business Terms in Form eines Glossars definieren. Über die Lineage lassen sich so schnell und einfach die Views und Tabellen in Datasphere ausfindig machen, auf die beispielsweise ein Report in der SAC auf Basis eines analytischen Modells aufsetzt.

Auf dem Data & Analytics Forum im Juni 2022 kündigte SAP das Projekt „SAP Data Suite“ an. Mit Datasphere präsentiert das Unternehmen aus Walldorf nun die ersten Ergebnisse.

Wenn die Entwicklung der neuen Data Suite von SAP mit der gleichen Geschwindigkeit wie in den vergangenen Monaten weitergeht, sind wir sehr optimistisch, dass die aktuell noch bestehenden Funktionslücken Schritt für Schritt geschlossen werden.

Beispielsweise verspricht der Blick auf die Roadmap im Laufe des Jahres eine nahtlose Integration der SAC-Planung mit Datasphere und die Erweiterung des neuen Catalogs hinsichtlich der Anbindung zusätzlicher SAP-Quellen. Ebenso soll es zukünftig möglich sein, User pro Space unterschiedlich zu berechtigen. Auch das analytische Modell wird weiter ausgebaut und um Multi-Fact sowie weitere Modellierungsfunktionen erweitert.

Aber es gibt auch noch genügend Themen, die dringend angegangen werden müssen. Insbesondere beim Thema Life-Cycle Management – Stichwort CI/CD – hat SAP Datasphere aktuell noch keine wirklich zufriedenstellende Antwort zu bieten.