Expertenmeinung

Microsoft Fabric – Data Driven in einer Technologie 

Donnerstag, 1. Juni 2023

Kategorie: Advanced Analytics, Business Intelligence, Data Warehouse, Datenmanagement, Microsoft Azure, Power BI

Microsofts konsequente Reise hin zur Datendemokratisierung 

Letzte Woche hat Microsoft auf der “Build-Konferenz” einige Neuerungen vorgestellt. Unsere Data & Analytics Ohren sind dabei natürlich insbesondere bei dem Thema “Microsoft Fabric” hellhörig geworden. Seitdem ist ein bisschen Zeit vergangen, die wir genutzt haben, das Neue von Microsoft einmal intern in unseren Innovation Labs und mit unseren Kunden zusammen genauer unter die Lupe zu nehmen. 

Alles unter einem Dach

Mit Microsoft Fabric wiederholt Microsoft sein Power BI-Erfolgsrezept und bündelt eine ganze Palette an Werkzeugen, auch aus dem Datenmanagement Bereich, unter einem neuen Dach. Das Dach heißt Microsoft Fabric.

Die Werkzeuge umfassen alles, was das Data (& Science)-Herz begehrt:  Data Integration, Data Engineering, Data Warehousing, Data Science, Real Time Analytics und Power BI selbst. Dabei sind die meisten Funktionen, die sich hinter diesen Diensten verbergen, nicht komplett neu in Azure, so ist in der Fabric Data Integration ein großes Stück Azure Data Factory zu finden, und auch das Data Engineering Feature hat die Besten Stücke rund um die serverless Spark Pools in Azure Synapse erhalten. 

Was auffällt ist die Einfachheit, mit der es Microsoft gelungen ist, all die Dienste im neuen Haus unterzubringen.

Das gelingt insbesondere durch zwei konsequent verfolgte Prinzipien:

  • SaaS überall! Der Fokus bei Microsoft Fabric ist auf Software-as-a-Service (SaaS) ausgelegt. Das heißt: Kein händisches verwalten von Servern! 
  • Ein gemeinsamer Standard: Onelake & Delta Lake. Alle Daten in Microsoft Fabric (ja, auch die im „Warehousing“ Bereich), werden in Onelake als Delta Tabellen gespeichert. Das ermöglicht den nahtlosen Wechsel von Werkzeugen in Microsoft Fabric basierend auf dem immer gleichen Daten & Zugriffen, die durch Onelake sichergestellt werden. Wir hoffen in Zukunft auch noch auf die Unterstützung von Iceberg. 

Neben der ganzen Nutzerfreundlichkeit und Einfachheit mit der Microsoft die Dienste im Fabric bündelt, gibt es zudem ein paar handfeste technologische Neuerungen:  

Mit „Direct Lake“ ist es nun möglich Dateien auf dem Lake aus Power BI abzufragen, OHNE dass wir zusätzlichen Compute wie z.B. Synapse Serverless benötigen oder etwa die Datasets regelmäßig aktualisieren müssen, um ein maximal performantes Nutzererlebnis durch importierte In-memory-Daten zu ermöglichen. Etwas ähnliches hat Tableau & Databricks über Delta Share zwar schon vor zwei Jahren angekündigt (Link), allerdings ist die Funktion bis heute nicht öffentlich verfügbar. Danke Microsoft für dieses Schmankerl! 

Auch Onelake fällt in eine Box, für die wir in unserem Beraterlager noch gar kein Label haben: Während Onelake viele aus dem Azure Data Lake Store Gen 2 (ADLS Gen 2) bekannte Funktionen mitbringt, hat auch hier Microsoft nochmal einen draufgesetzt: Es ist nun möglich mit dem altbekannten „abfss“-Treiber über OneLake nicht nur auf Daten in der Azure Cloud zuzugreifen und den Zugriff zu steuern, sondern sogar verbundene S3 Buckets können abgefragt werden. Für Abfragewerkzeuge innerhalb des Fabrics ist zusätzlich auch Row- und Columnlevel Security angekündigt. Das dies nur innerhalb des Fabrics funktioniert ist zwar schade, aber aus technischer Sicht absolut nachvollziehbar. 

Mit Fabric entwickelt sich Microsoft in die absolut richtige Richtung

Die Einfachheit mit dem Microsoft es schafft die Komplexität aus den verschiedensten Data Domänen zusammenzubringen hat uns wirklich beeindruckt. Damit rücken insbesondere alle Themen rund um Data Engineering ein gutes Stück näher an den Großteil der Datennutzer in Unternehmen. Und während das natürlich keine Ausrede für unsauberes Datenmanagement ist, kann Transparenz und Einfachheit gerade im Bereich Daten gar nicht hoch genug bewertet werden. 

Early Adopters aufgepasst: Aktuell gibt es noch viele Features die zwar angekündigt, allerdings aktuell noch nicht verfügbar sind. Das fällt uns bei der No-code-Komponente Data Activator deutlich einfacher als mit der fehlenden Zugriffssteuerung auf Tabellenebene.  

Unser Tipp: Wenn Sie mehr über Fabric wissen wollen, folgen Sie uns auf LinkedIn und Xing oder abonnieren Sie einfach unseren Newsletter. Wir bleiben an der Fabric dran und halten Sie über unsere Erkenntnisse und Learnings informiert.

AUTOR(EN)

Alexander Kreller

Senior Consultant | Analytics, Data Visualization, Data Culture, QUNIS GmbH

Christian Thiel

Senior Consultant Data Architecture, Data Engineering, Data Science, QUNIS GmbH

Ulf Papenfuß

Senior Consultant | Data Engineering, Data Architecture, Analytics, QUNIS GmbH