Data Science Archive

Archiv für die Kategorie Data Science

Digital Workplaces, Data Literacy, Cloud, Data Catalogs und mehr – das bewegt die Data & Analytics-Welt

Erstellt am: Dienstag, 31. Mai 2022 von Monika Düsterhöft

Das Thema Data & Analytics hat deutlich an Fahrt aufgenommen: Die Initiale für Projekte und Initiativen sind dabei so vielfältig wie nie zuvor. Die Herausforderungen und Antworten darauf ebenso.

Viele Organisationen stellen sich aktuell IT-seitig komplett neu auf

Aus selbst definierten strategischen Gründen oder auch weil technische Erweiterungen von Softwareherstellern eine komplett neue Ausrichtung erfordern. Dabei wird kaum noch monolithisch alles einer einzigen, zentralen Strategie untergeordnet. Stattdessen eröffnen sich heterogene Welten beispielsweise mit Cloud-Angeboten, Spezialapplikationen unter anderem für Product-Lifecycle-Management oder Firmendatenbanken wie etwa Produktinformationssysteme.

Diese Entwicklung erfordert angesichts der Vielfalt und Komplexität der Aufgaben im Kontext von Data & Analytics umso mehr feste Konzepte für das Stamm- und Metadaten-Management. Schließlich gilt es, jederzeit den Überblick zu bewahren und Transparenz zu gewährleisten.

Ebenso geht nicht erst seit, aber forciert durch Corona der Trend hin zum verteilten Arbeiten. Sogar Unternehmen, die sich vor nicht allzu langer Zeit noch dagegen gesperrt haben, stellen mittlerweile Digital Workplaces bereit. Auch hier spielt die Cloud eine zunehmend wichtige Rolle, um den mobilen Zugriff auf die Systeme etablieren und von der Infrastruktur her überhaupt ausrollen zu können. Über die Technologie hinaus erfordert dies vielfach neue Konzepte und Handlungsweisen.

Zudem betrifft die Digitalisierung die unterschiedlichsten Bereiche in einem Unternehmen – ob in der Kommunikation, im Vertrieb, dem Kundenservice oder der HR-Abteilung. Neben dem elementaren Organisationsmanagement, das die Struktur des „Gesamtkonstrukts Digitalisierung“ steuern und optimieren soll, benötigen diese Transformations- oder vielmehr Veränderungsprozesse immer auch ein gutes Change Management. Denn nicht nur die Prozesse müssen stimmen, sondern die Menschen dahinter müssen abgeholt und mitgenommen werden, um die veränderten Prozesse dauerhaft und erfolgreich im Unternehmen zu etablieren.

Damit einher geht auch der steigende Bedarf an Kompetenzen, dem sogenannten Upskilling. Die zunehmend digitalisierte Arbeitswelt erfordert abteilungsübergreifende Kompetenzerweiterungen; das gilt für den IT- und Technik-Bereich, aber auch in Marketing & Kommunikation und erstreckt sich ebenso über Anforderungen wie Mitarbeiterentwicklung, Problemlösungskompetenzen oder Konfliktmanagement bzw. Teamwork. Das alles muss bedacht und umgesetzt werden, da sonst Digitalisierungsinseln entstehen und ein Scheitern des ganzheitlichen Ansatzes vorprogrammiert ist.

Datenlandschaften gehören erweitert, sichere Zugänge gewährleistet

Immer bedeutender werden die sogenannten Digitalen Zwillinge oder auch Digital Twins. Dabei handelt es sich um digitale Nachbauten von physischen Objekten, Produkten und Services. Diese müssen in die Prozesslandschaften integriert werden, damit Simulationen und Forecasts rein digital stattfinden können – interessant ist dies beispielsweise für Produktentwicklung oder Qualitätsmanagement.

Die Daten als erfolgsentscheidendes Asset zu begreifen und entsprechend zu nutzen, bedeutet in der Konsequenz: Alle Mitarbeiter müssen im Sinne von Data Literacy (ein neu aufgekommenes Buzzword) möglichst einfachen Zugang zu den Daten haben – und dies umso mehr an den Stellen, an denen sie Potenzial zu einem echten Mehrwert mitbringen. Das zu ermöglichen, zeigt sich als weiterer Treiber für Data & Analytics-Projekte.

Durch all dies zieht sich der effiziente und nachhaltige Schutz der Daten wie ein roter Faden. Dabei geht es sowohl um alltägliche Dinge wie Zugriffsrechte als auch um heikle Themen, Stichwort Cyber-Kriminalität. Hier stellt der Gesetzgeber teils klare Forderungen. Vor diesem Hintergrund sind deutlich strukturiertere Vorgehensweisen erforderlich, als sie bislang vielerorts praktiziert wurden.

Das gilt ganz speziell für das Umfeld von Data & Analytics, wo aus bloßen Daten wahre Datenschätze entstehen und zu schützen sind. Gerade in Cloud-Umgebungen muss man genau hinsehen, wo genau und wie die Daten gespeichert werden und wer Zugriff darauf hat.

Datengetriebene Produkte und Services schüren Innovationskraft

Sah es noch vor einem Jahr n ganz anders aus, so werden heute bei uns viel mehr Add-Ons zu den Bestandsprodukten, Erweiterungen zu bestehenden Devices oder auch Zusatzservices und Dienstleistungen nachgefragt. Dieser Trend zur Anbindung von Geräten zeigt sich auch im privaten Umfeld, wo sich mittlerweile der Kühlschrank, die Heizung, das Auto und anderes mehr problemlos mit dem Internet verbinden lassen.

Viele Unternehmen wollen darüber ihr bisheriges Business-Modell von Verkaufen auf Vermieten umstellen, um so neuen Marktanforderungen gerecht zu werden. Auch hier entstehen große Mengen an hochwertigen Daten, die in der Analytics-Welt gewinnbringend genutzt werden können. Ein Beispiel von vielen: In unseren Kundenprojekten nehmen wir verstärkt einen Trend zur Produktindividualisierung wahr.

Hierfür stehen die Organisationen jedoch vor der Herausforderung, möglichst genau zu wissen, an welcher Stelle sie mit der Individualisierung ansetzen können und inwieweit dies überhaupt lohnenswert ist. Die notwendigen Daten dafür liefern Data & Analytics.

Technologie wird zum Service

Es zeichnet sich ganz allgemein eine Entwicklung dahingehend ab, dass die technologischen Konzepte, die in den vergangenen zehn bis fünfzehn Jahren gut funktioniert haben, in unseren zunehmend dynamischen Zeiten an ihr Limit stoßen: Aktuelle Herausforderungen erfordern moderne und innovative Methoden und Werkzeuge. Unternehmen müssen daher konkrete Überlegungen über ihre künftige Ausrichtung anstellen.

In diesem Kontext wird Technologie zum Service. So gehen derzeit zwischen 70 und 80 Prozent aller neu begonnenen Projekte von QUNIS in Richtung Cloud-orientierter Nutzung von Services. Die Organisationen bauen nicht mehr inhouse Technologien auf, sondern verwenden teils komplette Softwarelösungen verschiedener Cloud-Anbieter als Managed Services. Dabei wird je nach Anwendungsfall sehr häufig auch auf hybride Architekturen gesetzt, bestehend aus der Kombination von Cloud- und On-Premise-Systemen.

Generell jedoch ist festzustellen, dass Cloud-Architekturen nicht mehr nur auf dem Vormarsch sind, sondern speziell in der Data & Analytics-Welt sogar überwiegen.

Oft nämlich könnten die Unternehmen die angebotenen Services gar nicht eigenständig betreiben, weil ihnen die erforderlichen Ressourcen und das entsprechende Know-how für die teils sehr komplexen Technologien fehlen. War es beispielsweise in früheren Zeiten noch mit dem Aufbau eines kleinen Data Warehouses getan, sind heute deutlich mehr Spezialtechnologien notwendig wie etwa Machine-Learning-Algorithmen.

Immer mehr Daten werden in zunehmend mehr Anwendungsfällen verarbeitet. Aufgrund dessen wird eine nochmals verbessere Usability für die Nutzer mit möglichst niedrigen Eintrittshürden schlichtweg erfolgsentscheidend bei der Anwendung der unterschiedlichen Technologieprodukte.

Hier bewähren sich Business-Glossars und Data Catalogs, mit denen sich die zunehmenden Datenvolumina automatisiert ordnen und vereinheitlichen lassen. Metadaten-Management-Lösungen können dabei helfen, mit den Daten und modellierten Inhalten besser und unkomplizierter zu arbeiten.

Data & Analytics wächst und weitet sich aus

Branchenübergreifend zeigt sich, dass Organisationen fachlich gesehen mit immer heterogeneren Datenformaten umzugehen haben, um daraus ihre Erkenntnisse zu gewinnen. Dazu zählen im Kontext von Data & Analytics beispielsweise Sensordaten und Texte, aber auch Bild- und Audio-Material.

Gleichzeitig werden die Anwendungsfälle tendenziell businesskritischer. Bislang beispielsweise war ein kurzfristiger Ausfall des BI-Systems nicht sonderlich problematisch, weil es nicht direkt relevant für die operative Ebene war, sondern lediglich steuernd und informativ. Heute hingegen greifen wir hierüber in Echtzeit tief in die Prozesse hinein und generieren Erkenntnisgewinne für die operative Steuerung etwa von Produktions- oder Logistikprozessen oder hinsichtlich der Up- und Cross-Selling-Potenziale von Webshops.

Zudem verzeichnen wir stetig komplexere Self-Service-Anforderungen. Die Nutzer möchten etwa nicht mehr nur schnell ein einfaches Dashboard selbst bauen. Sie fordern vielmehr technologische Strukturen, um über den Self-Service-Ansatz beispielsweise Massendaten selbstständig auswerten zu können. Da es ihnen hierbei jedoch an der jahrelangen Erfahrung echter Experten mangelt, entsteht entsprechender Anleitungsbedarf – dabei müssen Standardisierung und Harmonisierung natürlich jederzeit gewährleistet bleiben.

Wahl der Plattform wird zweitrangig

Bei der Wahl der Infrastruktur gibt es für Unternehmen verschiedene Optionen: On-Premise, Public Cloud in Form von PaaS und SaaS oder Container-Strategien. Häufig nutzen Unternehmen auch eine Multi-Cloud-Strategie mit mehr als nur einem Hyperscaler. Eine wichtige Rolle spielt hier die Portierbarkeit, damit zu jeder Zeit die Flexibilität erhalten bleibt, den Cloud-Anbieter gegebenenfalls problemlos wechseln zu können. Alternativ entscheiden Organisationen sich von vornherein für eine hybride Lösung aus Cloud und On-Premise.

Nicht zuletzt wird die Rolle von Open-Source-Technologie zunehmend bedeutender. In der klassischen BI-Welt weniger eingesetzt, kommt sie im Umfeld von Streaming, Big Data, Machine Learning sowie bei Prozessen auf Basis von Massendaten jetzt verstärkter zum Einsatz – mit dem Potenzial, den Markt nahezu zu dominieren.

Data Management Units zur Umsetzung Ihrer Datenarchitektur

Das Thema Architektur und wie sich Architekturen verändern kann man derzeit als klaren Trend am Markt erkennen. In diesem Zusammenhang bieten wir bei QUNIS je nach der Zielsetzung, die Unternehmen mit ihrer jeweiligen Data & Analytics-Strategie verfolgen, sogenannte Data Management Units (DM Units) an. Diese bilden das Herzstück der Datenverarbeitung und -speicherung bei Data & Analytics-Initiativen.

Mit Self-Service-BI, Data Warehouse, Data Warehouse & Data Lake, Lakehouse und Streaming stehen insgesamt fünf DM Units mit einem jeweils unterschiedlichen Leistungsspektrum zur Verfügung.

Welche DM Unit für ein Unternehmen infrage kommt, hängt dabei immer von der Ausrichtung der künftigen Architektur ab. Die Entscheidung darüber sollte stets vorab getroffen werden, weil sich etwa die eher pragmatische Variante Self-Service-BI im Nachhinein nicht so schnell in ein komplexeres Lakehouse umwandeln lässt. Mit verschiedenen Add-Ons lassen sich die zentrale Datenspeicherung und -verarbeitung der DM Units modular um zusätzliche Funktionen erweitern. In jedem Fall notwendig sind Visualization & Reporting, Monitoring und Process Control, hinzu kommen optionale, teils kombinierbare Add-Ons wie beispielsweise für API, Virtualisierung oder Metadaten-Management wählbar.

Ihr Thema ist mit dabei? Sie haben sich und Ihre aktuellen Herausforderungen widererkannt und wünschen sich dafür Beratung und Begleitung von QUNIS und unseren Experten?

Sprechen Sie einfach Ihren QUNIS-Berater*in an oder schreiben Sie direkt eine E-Mail an team@qunis.de und verraten Sie uns ein wenig mehr zu Ihrer Motivation, Ihren Zielen und Vorhaben. Wir freuen uns auf den Austausch und die Diskussion mit Ihnen.

Modern Data Worker: Wer sie sind, wie sie sich unterscheiden, was sie antreibt?

Erstellt am: Montag, 17. Januar 2022 von Monika Düsterhöft

Nicht nur die Menge und Verfügbarkeit von Daten, auch das Thema Datenarbeit und die Aufgaben, die sich drumherum ranken, haben sich in den letzten Jahren rasant verändert und weiterentwickelt.

Zu den Experten und Spezialistinnen für Business Intelligence (BI), die vor allem in den Finance & Controlling-Abteilungen, bei Software-Anbietern und Beratungshäusern zu finden waren und die von jeher das Thema Data Management besetzt hatten, sind mit dem unternehmensweiten Einzug von Digitalisierung, Big Data, Cloud-Services sowie der Demokratisierung von Daten neue Anforderungen und Bedarfe hinzugekommen.

Neue Aufgaben, Rollen und Berufsbilder haben sich herausgebildet und die Data Scientisten, Data Architekten und Data Engineers sind auf der Bildfläche erschienen.

Allen gemein ist zunächst das Interesse an und die Arbeit mit Daten – aber was genau ist ihr Ziel, was macht sie speziell, was macht sie glücklich und mit welchen Technologien und Methoden arbeiten sie? Wie funktionieren sie zusammen und wo unterscheiden sie sich? Nachfolgend haben wir eine kleine Einordnung für Sie zusammengestellt. Diese soll helfen, die verschiedenen Disziplinen der Modern Data Worker ein wenig besser zu verstehen:

1. BI & Data Manager

BI steht für Business Intelligence und das wiederum steht für Geschäftsanalytik. Kurzum: die systematische Analyse von verfügbaren, meist in strukturierter Form vorliegender Unternehmensdaten. Ziel dabei ist es, möglichst optimale Entscheidungen für das Unternehmen treffen zu können bzw. die Entscheidungsprozesse bestmöglich mit Erkenntnissen aus Daten zu unterstützen sowie Geschäftsabläufe, Kunden- und Lieferantenbeziehungen zu verbessern.

Ein BI & Data Manager legt die Grundlage dafür, in dem verschiedenste Datenquellen angebunden und die relevanten Daten in ein Data Warehouse bzw. einen Data Lake integriert werden. Dafür müssen Schnittstellen zu den unterschiedlichen Datenquellsystemen geschaffen, Daten miteinander verknüpft und formatiert sowie schrittweise veredelt werden.

Ein weiterer zentraler Aspekt ist die Umsetzung der übergreifenden Geschäftslogik, damit die Daten am Ende auch in einer einheitlichen und vergleichbaren Form vorliegen. Dies können unterschiedlichste Logiken sein wie z. B. die Historisierung von Daten, Datenqualitätsprüfungen oder eine einheitliche Währungsumrechnung. Ein Data Manager liefert mit dem Aufbau und der Bereitstellung von logischen Datenmodellen das zentrale Fundament für darauf aufbauende Reports, Dashboards oder weiterführende Analysen.

Im Bereich des Information Designs werden die bereitgestellten Daten mit einem geeigneten Frontend-Werkzeug wie beispielsweise Excel, Power BI, Pyramid Analytics oder vergleichbaren Tools visualisiert und je nach Zielgruppe entsprechend aufbereitet. Hier spielt die Art und Weise der Darstellung eine zentrale Rolle, Standards für die Visualisierung und fokussiertes Data Storytelling sind in dieser Disziplin entscheidende Erfolgsfaktoren.

Ein BI & Data Manager liebt Daten und deren Aufbereitung bis zur passenden Visualisierung. In diesen Bereichen fühlt er sich wohl und löst so manche Knobelaufgabe, wenn es darum geht, wie man bestmöglich die Daten für Endanwender, Power User oder Analysten vorbereiten und bereitstellen kann.

2. Data Scientists

Während die BI-Welt auf sauber aufbereiteten, tabellarisch strukturierten Daten fußt, geht es in der Data-Science-Disziplin etwas wilder zu. Hier werden analytische Applikationen entwickelt, indem entsprechende Technologien wie u. a. Machine Learning oder Data-Science-Plattformen eingesetzt werden. Zudem ist ein tiefes Prozessverständnis erforderlich, damit die Anforderungen der Fachanwender an die Analyseergebnisse auch interpretiert werden können.

Vor einem Data Scientist sind auch unaufbereitete, untabellarische, unstrukturierte Daten nicht sicher: Data Scientists werten nicht nur strukturierte Tabellen aus, sondern auch Fotos, Texte, Videos und Sprachnachrichten. Dafür ist es häufig erforderlich, diese heterogenen Datenbestände vor- bzw. aufzubereiten. Um eine grundlegende Struktur in die Daten zu bekommen, nutzen sie mathematische bzw. statistische Algorithmen, Verfahren zum Clustern der Daten und zum Erkennen von Anomalien.

Data Scientists adaptieren die neuesten Verfahren zur Datenauswertung, sie arbeiten in Python und R und bauen dabei vor allem auf die Open-Source-Welt; Docker, Kubernetes, Tensorflow und github sind aus ihrem Arbeitsalltag nicht wegzudenken. Data Scientists arbeiten sehr eng mit Data Engineers zusammen. Diese kümmern sich um die gesamte Dateninfrastruktur, damit die Data Scientists ihre komplizierten Berechnungen und Datenauswertungen realisieren können.

3. Data Architects

Bevor ein Data Engineer die Dateninfrastruktur jedoch erstellen kann, sollte ein Data Architect sie konzipieren. Das kann man sich so vorstellen wie beim Hausbau: Architekten planen hier zunächst, wie ein Haus gebaut oder umgebaut werden soll. Sie berücksichtigen dabei technische, wirtschaftliche, funktionale und gestalterische Aspekte und sind dafür zuständig, dass am Ende alles zusammenpasst und das Haus nicht einstürzt. Data Architects sind ihre Pendants in der IT-Landschaft.

Ein Data Architect ist für die Gesamtarchitektur einer Datenplattform verantwortlich – insbesondere dann, wenn komplexere Strukturen aufgebaut werden müssen. Dazu gehören die Definition und Anwendung von Architekturrichtlinien und Methoden sowie der Aufbau von Leitlinien für die Systemarchitektur und die damit verbundenen Einsatzbereiche von entsprechenden Technologien.

Diese komplexeren Strukturen fangen meist da an, wo die klassische BI-Welt aufhört – wo Big Data anfängt: dort, wo Daten in Echtzeit verarbeitet werden müssen, dort, wo unstrukturierte Daten verarbeitet werden und dort, wo hoch frequentierte Daten in kurzer Zeit verarbeitet werden. Beim Einsatz von Sensoren, die in Sekundenabständen Daten erzeugen, entstehen beispielsweise hochfrequentierte Daten. Müssen diese Daten noch in real-time – also sofort, in Echtzeit verarbeitet werden, dann erhöht sich die Komplexität zusätzlich.

Der Einsatz von Algorithmen oder anderer Analyseverfahren, wie etwa im Data-Science-Bereich, erfordert beispielsweise punktuell sehr hohe Rechenpower über einen begrenzten Zeitraum. Hier kommt dann auch die Infrastruktur mit ins Spiel, die den unterschiedlichen Anforderungen der verschiedenen Disziplinen gerecht werden muss. Die Vielfalt der technologischen Möglichkeiten, insbesondere im Cloud-Umfeld, stellen hohe Anforderungen an die Datenarchitektur. Ein Data Architect stellt sicher, dass die geforderten Anwendungsszenarien mit der angedachten Architektur und den dafür vorgesehenen Technologien umgesetzt werden können.

4. Data Engineers

Ein Data Engineer ist ein Spezialist für Datenmanagement insbesondere im Big-Data-Umfeld. Seine Arbeit umfasst die Konzeption und Implementierung von Datenintegrations- und Transformationsprozessen zur Unterstützung datengetriebener Use Cases und Data-Science-Projekte, damit eine bestmögliche Datenvorbereitung ermöglicht wird. In diesem Zusammenhang legen Data Engineers den Fokus auf die Entwicklung von analyseoptimierten Datenarchitekturen.

Data Engineers und Data Scientists arbeiten oft eng zusammen, wobei der Fokus des Data Engineers darauf liegt, Daten aus unterschiedlichsten Quellen und Formaten aufzubereiten, zu organisieren und die erforderlichen Datenpipelines aufzubauen sowie diese zu betreiben. Data Engineers arbeiten somit an der Schnittstelle zwischen Infrastruktur und Datenmanagement, überwachen Datenquellen und steuern Integrationsprozesse sowie die Instanzen, die für die Analyse und Weiterverwendung der generierten Daten zuständig sind.

In dem Sinne ist ein Data Engineer für alle Prozesse rund um das Generieren, Speichern, Pflegen, Aufbereiten, Anreichern und Weitergeben von Daten verantwortlich. Zudem ist für einen Data Engineer von hoher Bedeutung, dass die bereitgestellten Lösungen performant laufen und kontinuierlich optimiert werden. Über ein entsprechendes Monitoring hat ein Data Engineer alles im Blick.

Eng verknüpft mit Big Data, ist die Disziplin des Data Engineering noch vergleichsweise jung und stetig in der Weiterentwicklung. Data Engineers müssen sich daher stets am technischen Fortschritt orientieren, um der Entwicklung nicht hinterherzuhängen und sich in neue Frameworks, Konzepte und Technologien einarbeiten.

Mit Strategie, Roadmap, klaren Visualisierungskonzepten sowie der bewussten Verankerung in der Organisation ans Ziel

Damit datengetriebene Lösungen entstehen und nachhaltig funktionieren, sind weitere Rollen und Disziplinen gefordert und arbeiten mit den Modern Data Workern Hand in Hand. Gerne erzählen wir Ihnen auch dazu mehr. Sprechen Sie einfach Ihren QUNIS-Berater*in an oder schreiben Sie direkt eine E-Mail an team@qunis.de und verraten Sie uns ein wenig mehr zu Ihrer Motivation, Ihren Zielen und Vorhaben. Wir freuen uns auf den Austausch mit Ihnen.

the factlights 2020: Die zentrale Erhebung zum Stand von Data & Analytics

Erstellt am: Mittwoch, 18. März 2020 von Monika Düsterhöft

Die Digitalisierung verändert unsere Arbeitswelt in einer rasanten Geschwindigkeit. Und auch die aktuelle Krise zeigt, was Digitalisierung und Datenarbeit zu leisten vermögen. Doch wo stehen wir aktuell? Welche Prozesse und Geschäftsmodelle wandeln sich im Unternehmen? Was bedeutet dies für unseren Arbeitsalltag? Digitalisierung ohne Wenn und Aber? Diese und weitere Fragen möchten wir im Rahmen einer Studie klären und die daraus resultierenden Erkenntnisse und Empfehlungen mit Ihnen teilen.

Machen Sie mit bei the factlights 2020 – die zentrale Erhebung zum Stand von Data & Analytics im deutschsprachigen Raum.

Alle Teilnehmer der ONLINE-UMFRAGE erhalten ein exklusives Management Summary und die Möglichkeit auf attraktive Gewinne, wie einen E-Scooter, Taschen von ‚The North Face‘ oder einen 10 Euro Amazon-Gutschein als Sofort-Dankeschön.

Die Studie hinterfragt: Welche Prozesse und Geschäftsmodelle wurden umgestaltet? Was ist noch pure Vision, was in der Planung und was bereits gelebte Praxis? Was passiert bewusst und was eher unterbewusst? Welche Umstände halten Unternehmen und Mitarbeiter davon ab, die Möglichkeiten moderner Datenarbeit auszuschöpfen? Wo liegen Ängste, Sorgen und Nöte? Wie wird diesen begegnet? Was wird vorausgesetzt und was erwartet? Und wie soll es idealerweise weitergehen?

the factlights 2020 ist eine Initiative der QUNIS

Gemeinsam mit den Partnern CA Controller Akademie, HEUSSEN, Liebich & Partner, QUNIS und WTS ITAX wird im Zeitraum von März bis Mitte Juni 2020 die großangelegte Online-Umfrage the factlights 2020 – About Datat & Analytics Reality durchgeführt. Es geht um eine Bestandsaufnahme dazu, ob und wo Digitalisierung & Co. im Arbeitsalltag der Fachbereiche angekommen sind. In mittelständischen und Großunternehmen. Befragt werden sowohl Leitungsebene als auch Mitarbeiter aus allen Branchen und Bereichen. Angefangen von Finance, Accounting, Controlling, Sales und Marketing bis hin zu IT, Logistik und HR.

Trend-Artikel, Fachbeiträge, Tipps, Studien, Downloads und mehr

Auf the factlights informieren führende Unternehmen verschiedenster Disziplinen und Branchen zu aktuellen Herausforderungen, Stand von Forschung, Lehre, Markt und Technologie. Ganzjährig und aus den verschiedensten Blickwinkeln des Marktes. Hier geht‘s zu WWW.THE-FACTLIGHTS.DE

PUREN Pharma: Effiziente Prozesse und Datenanalysen im Web-Portal mit QUNIS

Erstellt am: Donnerstag, 12. März 2020 von Monika Düsterhöft

Das erfolgreiche Pharmaunternehmen PUREN Pharma hat mit Hilfe der QUNIS digitale End-to-End Geschäftsprozesse umgesetzt, zu denen auch fortgeschrittene Analysen mit zahlreichen internen und externen Datenarten gehören. Das spart viel Zeit und sichert die hohe Qualität von Prozessen und Informationen.

Wir haben mit QUNIS unsere komplexen Geschäftsprozesse unternehmensweit standardisiert und automatisiert. Basis ist ein zentrales Informations- und Analyse-Portal, in das wir jederzeit weitere Nutzer und Datenquellen oder neue On-Premise- und Cloud-Technologien einbinden können.

Christoph Gmeiner,
Teamlead Data Science & Business Intelligence,
PUREN Pharma GmbH & Co. KG

Die Anforderung: Umfangreiche Rechnungsbearbeitung

Generika von PUREN tragen entscheidend dazu bei, dass hochwertige Arzneimittel für jeden bezahlbar bleiben. In diesem Rahmen hat PUREN zudem zahlreiche Rabattverträge mit Krankenkassen abgeschlossen. Die Verwaltung der Verträge und der einzelnen Abschlagszahlungen an die Krankenkassen wurde für das erfolgreiche Pharmaunternehmen jedoch immer komplizierter.

Problematisch war vor allem, dass in einzeln geführten Excel-Listen der direkte Bezug zwischen den in den Apotheken getätigten Umsätzen und den monatlich, quartalsweise oder jährlich verrechneten Abschlagszahlungen an die Krankenkassen fehlte. Bei bundesweiten Verträgen mit rund 150 Krankenkassen, in denen u.a. unterschiedliche Abrechnungs-Zyklen, Rabatte und Dateiformate der Kassen zu berücksichtigen waren, entstand erheblicher manueller Aufwand für die Erfassung und Bearbeitung der Daten in einer Vielzahl von Excel-Dateien.

Das zuständige Team Data Science & Business Intelligence wollte den Prozess daher automatisieren und suchte nach einer Lösung, die einen einfach steuerbaren Freigabeworkflow für die Rechnungsbearbeitung mit einer zentralen Datenhaltung und Rechnungsprüfung im Backend verbindet. Die Systemlösung sollte flexibel und nach Bedarf skalierbar sein, um die wachsenden Anforderungen des Pharmaunternehmens dauerhaft abdecken zu können.

Die Lösung: Einfach steuerbare Prozess und Analyseplattform

Mit der Unterstützung von QUNIS hat PUREN seine ideale Lösung für anspruchsvolle Geschäftsprozesse gefunden und implementiert. Das Projektteam hat im ersten Schritt eine prozessorientierte BI-Plattform für die Bearbeitung der Abschlagsrechnungen realisiert und diese dann in Folgeprojekten systematisch zum umfassenden Portal für alle Fachbereiche ausgebaut.

Grundlage der umgesetzten Informations- und Analyseprozesse ist ein zentrales Data Warehouse auf Basis des Microsoft SQL Servers. Für die Auswertung der Daten werden je nach Bedarf OLAP-Analysen mit den Microsoft Analysis Services und Power BI sowie ML-Funktionalität (Machine Learning) aus der Cloud genutzt.

Als wesentlicher Erfolgsfaktor des Projekts hat sich der Einsatz eines anwenderfreundlichen Web-Frontends basierend auf GAPTEQ erwiesen. Durch das einfache Handling der Software konnte das interne Projektteam von PUREN nach der anfänglichen Unterstützung durch QUNIS schnell eigenständig weitere Module umsetzen. Inzwischen sind neben einigen Detail-Anwendungen vor allem drei zentrale Geschäftsprozesse in GAPTEQ abgebildet:

1. Transparenter Prüf- und Freigabeworkflow für Abschlagsrechnungen

Was die Sachbearbeiter in der Buchhaltung früher einzeln in Excel und auf Papier erledigen mussten, läuft heute größtenteils automatisiert. Abschlagsrechnungen der Krankenkassen in verschiedensten Dateiformaten werden maschinell in GAPTEQ eingelesen und vom System geprüft. Die integrierte Power BI-Datenbank gleicht dafür Umsatz- und Absatzdaten sowie bereits geleistete Abschlagszahlungen, die per Schnittstelle aus dem ERP-System importiert werden, mit den Rechnungsdaten ab.

Automatisierte Datenströme sorgen für zuverlässige Ergebnisse, auf deren Basis dann der Workflow in GAPTEQ angesteuert wird. Gemäß der hinterlegten Matrix, z.B. je nach Höhe der Zahlungssumme, gelangt die Rechnung nach Freigabe durch die Sachbearbeiter oder ihre Vorgesetzten zur Zahlung an die Abteilungen Customer Service und die Finanzbuchahltung. Das Tracking und die Bearbeitung der zahlreichen Rabattverträge konnte PUREN so in einem übersichtlichen Standard-Workflow mit den Aktionen „Eingabe, Prüfung, Signatur, Zahlung“ umsetzen. Die Mitarbeiter der verschiedenen Abteilungen werden im anwenderfreundlichen Web-Portal sicher durch ihr Tagesgeschäft geführt, während aufwändige Arbeitsroutinen wie Datenimport, Berechnungen, Datenabgleich und Validierung automatisch im leistungsstarken Backend ablaufen.

2. Präziser Forecast für langwierige Bestell- und Lieferketten

Arzneimittel müssen für die Patienten jederzeit in ausreichender Menge verfügbar sein – in der globalisierten Pharmabranche sind jedoch lange Bestell- und Lieferketten üblich. So sind für Produkte, die PUREN Pharma von seiner indischen Muttergesellschaft bezieht, Vorlaufzeiten von bis zu sechs Monaten einzuplanen. Ein möglichst präziser Forecast der erwarteten Absatzzahlen als Grundlage für punktgenaue Besellungen ist daher erfolgsentscheidend.

Im Rahmen des „Tender Managements“ hat das interne BI-Team dafür eine Plattform für Planung und Forecast realisiert, die sich vom Vertrieb über das Bestands und Produkmanagement bis zum Einkauf durchzieht. Durch maschinell erzeugte Vorschlagswerte erreicht PUREN dabei eine sehr hohe Forecast-Genauigkeit. Die Vorschlagswerte werden mit Machine-Learning-Funktionalität aus der Cloud in drei verschiedenen Algorithmen berechnet.

Neben den historischen ERP-Daten fließen u.a. auch externe Marktdaten aus den Apotheken in die Kalkulationen ein. Die Planer können die Vorschlagswerte in ihren Planmasken dann übernehmen oder manuell anpassen. Durch übersichtlich visualierte Berichte, die z.B. die Entwicklung der Umsatzdaten und Marktanteile zeigen, werden sie bei ihrer Entscheidungsfindung unterstützt und können gegebenfalls Abweichungen vom Vorschlag fundiert herleiten und begründen.

Während früher Produktprognosen in Tausenden von Excel-Dateien gepflegt wurden, wird der Forecast heute in der leistungsfähigen Systemumgebung effizient und zuverlässig erstellt und täglich aktualisiert. Das Supply Chain Management kann für seine monatlichen Bestellungen auf sehr präzise Verkaufsprognosen im Portal zugreifen.

3. Strategische und operative Steuerung der Produktlaunches

Die Lösung unterstützt zudem sämtliche Prozesse rund um die Portfolio-Planung und die Einführung neuer Produkte. Sowohl die Entscheidungsfindung als auch die Umsetzung von Produkt-Launches wird dabei mit allen involvierten Fachbereichen in der einheitlichen Systemumgebung gesteuert. Da es sich um langfristige Projekte handelt, sind hier vor allem der hohe Standardisierungsgrad und die nachvollziehbare systemgestützte Dokumentation entscheidende Vorteile. Die Systemlösung reduziert damit die Risiken durch Spezialwissen, das an einzelne Mitarbeiter gebunden ist, und fördert
stattdessen die unternehmensweite Zusammenarbeit im mehrjährigen Projekt durch standardisierte Prozesse und klar definierte Workflows.

Der Launching-Prozess startet bei PUREN mit dem Monitoring auslaufender Patente. Der Zeithorizont bis zum Patent-Verfall der überwachten Produkte beträgt im Schnitt fünf bis sechs Jahre. Um erfolgsversprechende Kandidaten für die eigene Generika-Produktpalette zu ermitteln, werden dabei im System Business Cases durchgespielt und Szenarien mit vielfältigen Annahmen gebildet. Typische Parameter sind beispielsweise Marktdaten zu Absatz und Umsatz in den Apotheken, mögliche Verpackungsgrößen, verschiedene Rabattverträge, Zertifizierungs- und QM-Kosten, usw. Durch die mächtige Analyse-Power im Backend können die Fachanwender im Verlauf der Zeit auch jederzeit Szenarien mit veränderten Rahmenbedingungen oder Auswertungen der „Pipeline“ auf Knopfdruck erstellen.

Die Entscheidung für einen Produktlaunch fällt so auf der Basis genauer Zahlen und Fakten. Die operative Umsetzung eines Launches, der sich wiederum über rund 18 Monate ziehen kann, wird dann ebenfalls in der Systemlösung gesteuert und dokumentiert. Ab diesen Zeitpunkt wird das Projekt zu einem unternehmensweiten Workflow- Thema. GAPTEQ sorgt als Arbeitsumgebung mit transparenten Abläufen und Alerts für die sichere und effiziente Abwicklung des komplexen Prozesses. Alle Abteilungen arbeiten dabei mit einheitlichen Material- Stammdaten aus dem zugrundeliegenden Data Warehouse.

Die Vorteile: Transparenz, Effizienz und Qualität gesteigert

PUREN Pharma hat mit seiner flexiblen BI-Lösung zentrale Geschäftsprozesse automatisiert. Durch die Gestaltung digitalisierter End-to-End-Prozesse und die Integration unterschiedlichster Datenformen wurden die Effizienz und Qualität von Abläufen und Informationen erheblich gesteigert. Individuelle Anforderungen des Pharmaunternehmens konnten dabei flexibel in einem standardisierten Microsoft-Umfeld abgebildet werden. Entstanden ist ein unternehmensweites Portal für alle Nutzergruppen und verschiedene Themen.

Ein wesentlicher Vorteil ist die anwenderorientierte Nutzeroberfläche. GAPTEQ dient sowohl als einfach bedienbares Web-Frontend für die leistungsstarke Analyse-Architektur und unterstützt zugleich mit dezidierter Workflow- Funktionalität die unternehmensweite Zusammenarbeit und Kommunikation. Sämtliche Nutzer arbeiten dabei auf einer zentralen Datenbasis, und sämtliche Eingaben sind nachvollziehbar im System dokumentiert.

Das Projektteam von PUREN kann die Systemlösung jederzeit selbst weiter ausbauen, verschiedenste Daten integrieren, Eingabe-Formulare und Reports gestalten und Workflows mit dezidierten User-Berechtigungen definieren. Im nächsten Schritt sollen Pozesse für die Vertragsverwaltung, die Einkaufspreis-Steuerung und das Qualitätsmanagement umgesetzt werden. Die Microsoft Standardlösung, die bereits heute On-premise- und Cloud-Produkte in einer Hybrid-Architektur kombiniert, gewährleistet dabei einen jederzeit bedarfsgerecht skalierbaren und kosteneffizienten Systemausbau.

Die Projekt-Highlights

Komplexe Geschäftsprozesse digitalisiert, automatisiert und standardisiert
Transparente Workflows, aktive Nutzerführung mit Warnfunktionen
Anwenderfreundliche Nutzeroberfläche für ausgefeilte BI- und MLArchitektur
Schnelle Analyse und übersichtliche Visualisierung von Daten
Flexible Integration diverser Vorsysteme und Dateiformen
Effiziente und sichere Rechnungsprüfung und -Bearbeitung
Präziser Forecast mit maschinellen Vorschlagswerten
Sichere stragische und operative Steuerung mehrjähriger Launching-Projekte
Einheitliches Web-Portal mit zentraler Datenbasis für alle Fachbereiche
Valide Daten und Ergebnisse durch Automatisierung
Excel-Insellösungen reduziert
Investitionssichere, einfach skalierbare Standardsoftware

Mehr zu PUREN Pharma: Als deutsches Traditionsunternehmen mit einem über Jahrzehnte gewachsenen Produktportfolio für Praxis, Klinik und Selbstmedikation stellt PUREN die Weichen als ein zukunftsorientierter Partner im Gesundheitswesen. Mit über 120 kostengünstigen Produkten in Topqualität für den Einsatz in der Praxis, Klinik und Selbstmedikation bietet PUREN ein umfassendes, etabliertes Spektrum für fast alle relevanten Therapieoptionen. Durch umfassende Rabattverträge ist PUREN dabei ein starker Partner für Ärzte, Apotheken, Krankenkassen und Patienten zum Erhalt der Ökonomie im Gesundheitswesen. Es ist das erklärte Ziel von PUREN, durch hochwertige, preisgünstige Arzneimittel zur Gesunderhaltung aller Menschen beizutragen.

Was Data & Analytics Verantwortliche bewegt – vier Themen, die Sie dieses Jahr beachten sollten.

Erstellt am: Dienstag, 18. Februar 2020 von Monika Düsterhöft

I. Voraussetzungen für den Business Value schaffen

Der Hype um BI ist abgeflacht, keiner stellt ihre Bedeutung mehr in Frage. Man weiß, die Technologien funktionieren. Die Unternehmen sind gerüstet, Budgets sind eingestellt. Genügend Erfahrungswerte und Best Practices sind vorhanden. Die große Herausforderung liegt jetzt darin, die vorhandenen Konzepte in Projekte zu gießen, die tatsächlich den größten und nachhaltigsten Nutzen stiften. Doch wo investiert man? Wie geht man vor? Was muss man beachten? Ein Patentrezept gibt es nicht. Was jedoch für alle Unternehmen gilt, es müssen die drei folgenden Fragen, und zwar besser gestern als heute, bearbeitet und geklärt werden:

Wer managt das Asset Daten? Als ersten und zentralsten Punkt gilt es zu defiinieren: Wer hat den Hut für die Daten und die analytischen Ergebnisse auf? Diese ist grundlegend und entscheidend, denn auswertungsrelevante Daten folgen häufig weder einem etablierten Unternehmensprozess noch der organisatorischen Linie. Vielmehr werden Daten cross-funktional erzeugt und an verschiedensten Stellen angereichert. Analytische Szenarien haben sehr häufig die Eigenschaft, diese Daten kombiniert auszuwerten.

Zudem gibt es im Gegensatz zu vielen traditionellen Bereichen wie der HR, die ein Talent- und Personal-Management kennt, oder dem Anlagenmanagement mit seinen Investitionsspiegeln und -plänen für die Datenwelt bis dato so gut wie keine, allenfalls rudimentäre Managementstrategien. Die Strukturen für unternehmensweites Datenmanagement und Analytics müssen daher in nahezu allen Unternehmen erst geschaffen werden. Und je nach Data-Driven-Business-Modell werden dabei Daten aus völlig verschiedenen Quellen, Bereichen und von unterschiedlichster Art benötigt.

Das alles unter eine Managementstrategie zu bringen, fordert also vor allem den Mut, vorhandene Organisationsstrukturen aufzubrechen. Denn, so hat sich gezeigt: Aus dem Boden gestampfte Sonderabteilungen sind nicht die Lösung! Vielmehr geht es darum, eine unternehmensübergreifende Datamanagementkultur zu schaffen und eine Organisationsform, die nicht aneckt und keine Flaschenhälse schafft. Immer mehr Unternehmen erkennen dies und setzen sich damit proaktiv auseinander.

Welchen Business Value bedient ein Use-Case? Der zweite wesentliche Aspekt auf dem Weg zum Business-Value liegt in der Betrachtung seiner selbst. Dabei geht es nicht um eine reine ROI-Berechnung, sondern um die Beantwortung der Frage, auf welchen betrieblichen Mehrwert die BI-, Big-Data- oder Analytics-Initiative einzahlen soll. Geht es beispielsweise darum, Prozesse besser zu analysieren, um damit Kosten zu sparen? Ist man auf mehr Umsatz oder bessere Qualität aus? Zielt die Initiative auf das Erreichen höherer Effizienz ab oder steht Risikominimierung im Vordergrund?

Wie werden Daten nachhaltig zugänglich gemacht? Der dritte nicht zu unterschätzende Punkt, den es bei BI und Analytics im Hinblick auf Nutzen und Value zu beachten gilt, ist das Thema Dokumentation. Gerade der Data Catalog erhält hier aufgrund der zunehmenden Komplexität und Heterogenität der Datenlandschaften als verlässlicher Wegweiser durch die Datenwelt eine wachsende Bedeutung. Um den Zugang zu Daten nachhaltig zu gewährleisten, müssen relevante Daten quellenübergreifend dokumentiert sein. Geeignete Data-Catalog-Tools sind am Markt gefragt und werden gesucht. Aber auch methodische Aspekte sind zu klären: Was soll drinstehen, wo findet man die relevanten Daten im Unternehmen und wer ist zuständig für die Datenqualität?

Auch wenn klassische Data-Warehousing-Konzepte im Sinne von Daten zusammenführen und harmonisieren weiterhin ihre Berechtigung behalten werden, ist ein Trend weg vom physischen Vorhalten aller Daten an einer zentralen Stelle bereits Realität. Der Weg geht hin zum Entwurf von Datenlandkarten, über die die Zugriffe realisiert werden. Das spart Zeit und Geld. Vor dem Hintergrund ständig wachsender Datenmengen entstehen so Datenarchitekturen, die den Geschwindigkeiten und Flexibilitätsanforderungen heutiger Geschäftsmodelle entsprechen. Es entstehen Data Landscapes und Data Oceans. Den Begriffsneuschöpfungen scheinen hier keine Grenzen und kein Ende gesetzt.

II. Cloud-Frontends setzen sich durch

Was in der Analytics-Welt am Backend schon eine Zeit lang gang und gäbe ist, gilt verstärkt nun auch für die Frontend-Welt: Moderne Cloud-basierte Frontends sind verfügbar und werden zunehmend diskussionsloser genutzt. Die Unternehmen scheinen ihre Skepsis und Furcht vor Cloud-Computing immer weiter abzulegen, gerade in unkritischeren Bereichen wie Vertrieb und Finance; allenfalls in sensibleren IP-nahen Bereichen mag das noch anders sein, etwa bei Rezepturen und Bauplänen. Die Öffnung hin zur Cloud ist dabei auf den generellen technologischen Fortschritt zurückzuführen, aber auch auf die naturgemäße „Ver-Rentung“ von Bedenkenträgern mit ihrer „alten Denke“ im Gepäck. So oder so ist der Trend hin zur Cloud nicht mehr zu stoppen: On-Premise-Systeme werden immer mehr zu Insellösungen.

III. Query-Engines verbinden Welten

War es im letzten Jahr an gleicher Stelle noch reine Prognose, wird es jetzt zur Realität: Es gibt immer mehr Query- Engines am Markt, die strukturierte und unstrukturierte Datenwelten miteinander verbinden, ohne dass man hierfür Technologiewechsel in den Architekturen benötigt. Insofern wird es eine Orientierung auf nur eine Seite nicht mehr geben. Denn egal, was man an Quellen darunterpackt: Jegliche Formate lassen sich künftig über ein und denselben Dienst kombinieren und das unbegrenzt in beliebigem Ausmaß. Anbieter wie Azure Synapse Analytics verbinden Data Warehousing und Big Data. Dadurch wachsen die Welten im Sinne einer „Single Source of Truth for Enterprise Analytics” konzeptionell zusammen. Data Engineers, Data Scientisten und Analysten können so kollaborativ den gesamten Daten-Fundus abfragen, ohne dafür irgendwelche Daten bewegen zu müssen.

IV. Zusammenspiel von Data Science, Data Engineering und Data Governance bewusst fördern

Apropos Data Scientist: Der bleibt auch weiterhin wichtig, muss aber zunehmend zu den Business Values beitragen, um seine Bedeutung und Daseinsberechtigung im Unternehmen zu bewahren. Zu oft nämlich konnte er in der Vergangenheit das Delivery-Versprechen mangels verfügbarer Daten nicht einlösen und die damit verbundenen Erwartungshaltungen nicht erfüllen. An der Schnittstelle von Architektur und Datenmanagement wird gleichzeitig die Stellung des Data Engineers mit entsprechend großem Potenzial massiv nach oben gehen. Zu seiner strategischen Schlüsselposition als Garant für das zuverlässige Funktionieren der Analytics Infrastruktur gehört dabei auch das Thema Data Governance. Dieses ist 2020 ein absolutes Top-Thema und schließt nicht zuletzt wieder den Kreis zur Schaffung einer Data-Management-Organisation, Quelldokumentation und letztendlich damit der Grundlage zur Erzielung von Business Value.

Mein Tipp: QUNIS hat ein Klassifizierungsschema entwickelt, das Ihnen hilft, Analytics-Use-Cases einzuordnen und zu identifizieren, an welcher Stelle Sie mit Ihrem B-I und Analytics-Projekt welchen Business-Value erzielen können und womit gegebenenfalls nicht. Mehr zum QUNIS BUSINESS CLASSIFICATION FRAMEWORK erfahren.

AI, Advanced Analytics, Big Data und ihre Bedeutung für die BI

Erstellt am: Mittwoch, 1. Mai 2019 von Monika Düsterhöft

Artificial Intelligence (AI) nutzt Machine Learning

Artificial Intelligence ist ein Begriff, der sofort sehr stark mit Innovation assoziiert wird und gleichermaßen eine große Faszination wie diffuse Ängste auslösen kann, obwohl oder vielleicht auch gerade weil es bis dato keine generell akzeptierte oder allgemeingültige Definition dessen gibt.

Sprach Richard Bellman 1978 beispielsweise von „der Automatisierung von Aktivitäten, die wir mit menschlichem Denken assoziieren, also dem Fällen von Entscheidungen, Problemlösung, Lernen …“, definierte Patrick Henry Winston 1992 die AI als „das Studium von Berechnungen, die es möglich machen, wahrzunehmen, schlusszufolgern und zu agieren“. Eine weitere Definition aus dem Jahre 1990 von Ray Kurzweil trifft es ebenso im Kern: „Die Kunst, Maschinen zu entwickeln, die Funktionen ausüben, welche Intelligenz erfordern, wenn sie vom Menschen ausgeführt werden.“

Ein Großteil der Methoden, mit denen Artificial Intelligence (AI) realisiert wird, fasst man unter dem Oberbegriff des Machine Learning (ML) zusammen. Maschinelles Lernen ist sehr stark der Art nachempfunden, wie wir Menschen lernen – so werden der Maschine in immer wiederkehrenden Schleifen Beispiele vorgelegt, anhand derer ein Sachverhalt gelernt wird, nur um das Gelernte anschließend verallgemeinern zu können.

Beispielsweise zeigt man der Maschine zahlreiche verschiedene Bilder von Katzen, auf dass sie danach das Prinzip „Katze“ verinnerlicht hat und solche auch auf Bildern erkennen kann, die sie vorher noch nicht zu sehen bekommen hat. Wie auch beim Menschen wird beim maschinellen Lernen nach der Lernmethode unterschieden – so unterscheiden wir zwischen dem überwachten Lernen (Supervised Learning), also dem Lernen anhand vordefinierter Beispiele, dem unüberwachten Lernen (Unsupervised Learning), was das automatische Erkennen von Mustern oder Merkmalen zum Inhalt hat, sowie dem bestärkenden Lernen (Reinforcement Learning), das auf dem Prinzip des Belohnens und Bestrafens basiert.

Advanced Analytics nutzt AI

Bei der Advanced Analytics kommen maschinelles Lernen sowie andere mathematisch-statistische Verfahren und Modelle zur Anwendung. Hierunter verstehen wir das methodische Analysieren und Interpretieren von Daten beliebiger Strukturen mit Ziel einer möglichst automatischen Erkennung von Bedeutungen, Mustern und Zusammenhängen und/oder der Prognose bestimmter Eigenschaften oder Kennzahlen.

Die Advanced Analytics kann somit auch als nächste Evolutionsstufe der Business Intelligence gelten. Während die traditionelle Business Intelligence den Blick vorrangig in die Vergangenheit richtet, um den Manager zu ermächtigen, die richtigen Rückschlüsse und bestmöglichen Entscheidungen für die künftige Ausrichtung des Unternehmens zu treffen, versucht die Advanced Analytics, diesen Prozess weitestgehend der Maschine zu überlassen, also zu automatisieren und selbst in die Zukunft zu schauen. Dies erfolgt in zwei aufeinanderfolgenden Schritten – im ersten werden durch die Predictive Analytics Vorhersagen über zu erwartende Entwicklungen gemacht, im zweiten zeigt die Prescriptive Analytics potenzielle Maßnahmen auf, gezielt wünschenswerte Ergebnisse zu erreichen.

Big Data erweitert BI

Wie auch in des Managers Entscheidungsprozess weitere relevante Zusatzinformationen neben den reinen Geschäftsergebnissen einfließen, beispielsweise Wetterdaten, geolokale Informationen oder Markttrends, so ist dies analog gültig für die Advanced Analytics. So beschafft man sich neben den strukturierten Daten aus ERP-, CRM- oder anderen Systemen wie beispielsweise dem zentralen Data Warehouse weitere Informationsquellen, die in die Analytics mit eingebunden werden. Dies können nicht selten Datenbestände sein, die man im Allgemeinen dem Begriff Big Data zuordnet.

Konkret bezeichnet Big Data eine bestimmte Art und Beschaffenheit von Daten plus dazu passende Methoden und Technologien für die hochskalierbare Erfassung, Speicherung und Analyse. Gerne wird in dem Zusammenhang auch von den drei Vs gesprochen:

Variety oder die Datenvielfalt: Immer mehr Daten liegen in unstrukturierter und semistrukturierter Form vor, beispielsweise aus den sozialen Netzwerken oder auch Geräten und Sensoren.
Volume oder die Datenmenge: Immer größere Datenvolumina werden angesammelt – Größenordnungen von mehreren Petabytes sind keine Seltenheit mehr.
Velocity oder die Geschwindigkeit: Riesige Datenmengen müssen immer schneller ausgewertet werden, bis hin zur Echtzeit. Die Verarbeitungsgeschwindigkeit muss mit dem wachsenden Datenvolumen Schritt halten.

Bezieht man also neben strukturierten Daten auch unstrukturierte, polystrukturierte und Massendaten, idealerweise realtime in die Analyse mit ein und bedient sich dafür unter anderem der Methoden des Machine Learnings, erweitert man die BI durch Big Data und den Einsatz von AI hin zur Advanced Analytics.

Viele spannende Informationen warten darauf, auf diese Art von Ihnen entdeckt zu werden!

Mein Tipp: Sie wollen den Machine Learning Algorithmen auf den Grund gehen? Holen Sie sich das kostenfreie QUNIS Machine Learning Cheat Sheet als PDF, im Pocket-Format oder als Poster für die Wand. Hier direkt QUNIS MACHINE LEARNING CHEAT SHEET holen.

CDS – der Citizen Data Scientist als Weg aus dem Analytics-Ressourcen-Engpass

Erstellt am: Montag, 18. März 2019 von Monika Düsterhöft

Für die Umsetzung von Advanced-Analytics-Vorhaben ist eine durchdachte Datenstrategie unverzichtbar. Sie regelt alle Fragen rund um die technische Systemintegration, die Data Governance und das unternehmensweite Data Quality Management (DQM).

Darüber hinaus gibt es neue fachliche Anforderungen und Aufgabenfelder wie die Definition komplexer Algorithmen für das Heben wirtschaftlicher Potenziale oder das Deployment der entstandenen Data-Science-Services. Der Data Scientist nimmt bei diesen Aufgaben eine der zentralen Schlüsselrollen ein.

Neue Advanced-Analytics-Aufgaben benötigen Data Scientisten mit vielfältigen mathematischen, technischen und prozessualen Skills.

Mit seinem tiefen Einblick in die Fachbereiche formuliert der Data Scientist die Projektanforderungen, kümmert sich um die Themen Datenmanagement und Data Quality Management unter Beachtung der Data Governance und übernimmt die Definition von Datenmodellen und Algorithmen. Er hat tiefe mathematisch-statistische Kenntnisse, kann programmieren, kennt sich mit Datenschutz und sonstigen Compliance-Regeln aus und verfügt über umfangreiches Business-Know-how.

Kurzum, der Data Scientist ist ein Allrounder mit viel Spezialwissen und umfassender Erfahrung. Kein Wunder daher, dass diese Fachkräfte äußerst gefragt und ziemlich rar sind und dass viele Digitalisierungsvorhaben schlichtweg wegen dieser fehlenden Skills und Ressourcen stagnieren.

Arbeitsteilung, Tools und das Konzept des Citizen Data Scientist (CDS) können Abhilfe aus dem Ressourcen-Dilemma schaffen.

Ein Ansatzpunkt ist die Entlastung des Data Scientists von Routinen im Datenmanagement. Speziell bei der Datenakquisition können technisch versierte Experten, die sogenannten Data Engineers, den Data Scientist gut unterstützen. Ein zweiter Ansatzpunkt, der sich derzeit am Markt für analytische Applikationen abzeichnet, ist die zunehmende Verlagerung von analytischem Know-how in die Systemwelt.

Etablierte BI-Anbieter beispielsweise erweitern ihr Portfolio um Datenvisualisierungstools, die Visual Analytics ohne Programmieraufwand unterstützen. Per Drag-and-drop können hier Datenströme hinzugefügt, verbunden und analysiert werden, und im Hintergrund laufen die neuesten Algorithmen für die fortgeschrittene Datenanalyse. Auch die Branche der AI-Spezialisten liefert unter der Bezeichnung „Augmented Analytics“ anwenderorientierte Werkzeuge, die Funktionen zur Automatisierung der Datenaufbereitung, Erkenntnisfindung und Datenanalyse enthalten.

Mithilfe solcher anwenderorientierten Frontends können geübte BI Power User, die ein mathematisch-statistisches Grundverständnis sowie Interesse an Analytics mitbringen, bestimmte Aufgabenfelder der Data Science übernehmen und so neben den Data Engineers ebenfalls ihren Teil dazu beitragen, das begehrte Skillset des Data Scientists zu erfüllen. Es kristallisiert sich ein neues Rollenbild heraus. Wir sprechen vom Citizen Data Scientist (CDS), der mit den richtigen Tools in der Lage ist, analytische Aufgaben auszuführen und auch selbst Modelle zu erstellen, die fortgeschrittene Analysen, Vorhersagen und präskriptive Funktionen enthalten.

Die Ausbildung von CDS ist ein aussichtsreicher Ansatzpunkt, um analytische Kompetenzen im Unternehmen aufzubauen.

Im Grunde kann jeder Fachanwender oder IT-Spezialist, der ein Grundverständnis für Datenarbeit sowie statistisches und mathematisches Know-how mitbringt, den Umgang mit Self-Service-Data-Science-Werkzeugen erlernen. Besonders geeignet sind BI Power User, die lernbereit und neugierig darauf sind, Data Science und vorhersagende Algorithmen für ihre Geschäftsprozesse zu erkunden.

Im Gegensatz zum klassischen BI-Anwender, der auf der Basis vorgefertigter Daten-Cubes arbeitet, bewegt sich der CDS dabei jedoch auch auf der Ebene der Rohdaten, um explorativ neue Erkenntnisse zu generieren. Weitere aussichtsreiche Kandidaten für Citizen Data Science sind Ingenieure mit Hintergrundwissen aus Mathematik, Statistik und Modellierung.

Die neuen Data-Science-Experten benötigen Rückendeckung und Unterstützung für ihr Tätigkeitsfeld.

Für ihre Aufgabenfelder bringen unternehmensintern ausgebildete CDS neben ihren analytischen Fähigkeiten auch ihr bereits vorhandenes Markt- und Branchen-Know-how sowie das Wissen um interne Prozessen in die Datenanalysen mit ein. Ein wesentlicher und nicht zu unterschätzender Vorteil. Sie brauchen aber auch Rückendeckung durch das Management sowie Unterstützung durch die interne IT.

CDS benötigen mehr Daten, zum Teil auch mehr ungefilterte Daten und sie brauchen IT-Umgebungen, in denen sie mithilfe aktueller Tools und Technologien experimentieren und Prototypen von Modellen und Applikationen bauen können. Zudem müssen sie den zeitlichen Freiraum für ihre Datenrecherchen erhalten.

Ein versierter Partner an der Seite, der neben der expliziten Data-Science-Expertise auch Erfahrung aus anderen Projekten mit einbringt und die neuen CDS auf ihrem Weg begleitet, ist eine weitere äußerst wertvolle Hilfe und ein wichtiger Baustein für den Erfolg einer Advanced-Analytics-Initiative.

Wenn die Rahmenbedingungen stimmen, können sich Unternehmen auf diese Weise pragmatisch wertvolle Personalressourcen aus den eigenen Reihen erschließen und richtig Schubkraft in ihre Digitalisierungsprojekte bringen.

Mein Tipp: Besuchen Sie das CA-Seminar – Deep Dive Advanced Analytics – Machine Learning in der Praxis mit „R“ – und lernen Sie das Tagesgeschäft eines Data Scientist besser kennen. Das Seminar wird von und mit QUNIS Experten durchgeführt und findet im Rahmen der Kooperation mit der CA Controller Akademie und des Ausbildungsprogramms zum Information Manager statt. Mehr zu allen CA-Seminaren finden Sie hier.

Data-Science-Services einfach und stabil bereitstellen mit dem AHUB Deployment Framework.

Data Science liebt Docker

Erstellt am: Freitag, 1. März 2019 von Monika Düsterhöft

Moderne Verfahren zur Datenanalyse dringen immer mehr in den Unternehmensalltag ein. Als Experte für das Erkennen von Strukturen in großen Datentöpfen und daraus abzuleitenden Vorhersagen spielt der Data Scientist eine bedeutende Rolle. Er leitet und begleitet die Entwicklung des Data-Science-Services von der Modellierung bis zur Bereitstellung an die Nutzer und hat es dabei typischerweise mit folgenden Herausforderungen zu tun:

Erstellung eines Modells in R oder Python inklusive einer REST API für webbasierte Aufrufe zum Modelltraining und Scoring

Im ersten Schritt, der explorativen Phase, befasst sich der Data Scientist mit dem Erstellen eines Modells mit Hilfe von Skripten. Diese trainieren das Modell mit historischen Daten und rufen Vorhersagen auf Basis neuer Datensätze ab. Die Umsetzung der Skripte erfolgt meist in Umgebungen wie R oder Python, die sich dank ihrer umfangreichen Bibliotheken aus dem Bereich der Statistik und des Machine Learning sowie einer sehr aktiven Entwickler-Community zum Quasi-Standard erhoben haben.

Für die Modell-Findung arbeitet der Data Scientist gerne in einer „Sandkasten-Umgebung“. Das kann eine virtuelle Maschine, ein lokaler Rechner oder auch ein Cloud-gehostetes „Notebook“ mit browserbasierter Entwicklungsumgebung sein. Das fertige Modell sollte über eine webbasierte Schnittstelle (REST-API) für andere Services ansprechbar sein. Hierfür haben sich die Bibliotheken Flask (Python) und Plumber (R) bewährt.

Definition der Code-Abhängigkeiten und Aufbau eines Images über Dockerfiles sowie Start der Container auf einem Cloud- oder On-Premise-Server

Ist ein Vorhersagemodell mit hoher Güte entstanden, gilt es dieses dem Nutzer zur Verfügung zu stellen. Wir sprechen vom Deployment des Data-Science-Services. Für diesen Zweck hat sich in den letzten Jahren die Docker-Container-Technologie als extrem flexibles und einfach handhabbares Werkzeug erwiesen. Denn Docker-Container lassen sich durch eine simple Konfigurationsdatei (das Dockerfile) in Minutenschnelle bauen und auf einem beliebigen System zur Ausführung bringen. Es gilt das große Docker-Versprechen: Wenn ein Container im Sandkasten läuft, lässt er sich auf jeder anderen Infrastruktur gleichermaßen betreiben.

Ein Container ist dabei ein gekapselter Prozess in dem sowohl der auszuführende Code, als auch alle dafür benötigten Abhängigkeiten (Laufzeitumgebung, Bibliotheken) untergebracht sind. Die Hardware-Ressourcen wie CPU und RAM werden dem Container vom Docker-Daemon, der auf dem Host-Betriebssystem läuft, zugewiesen. Container lassen sich so als ressourcenschonendere Variante einer dedizierten virtuellen Maschine sehen, da im Gegensatz zur VM nicht für jeden gekapselten Prozess ein eigenes Betriebssystem ausgeführt werden muss.

Fragestellungen rund um GUI, Sicherheit, Betrieb bedenken und lösen

Wer den Deployment-Prozess für einen Data-Science-Service einmal durchlaufen hat, wird feststellen, dass neben der reinen Data Science auch noch folgende Fragestellungen bedacht werden müssen:

Wie kann ein technisch weniger versierter Nutzer die Modellvorhersage abrufen? Welche GUI braucht er?
Wie kann der Zugriff auf das Modell nur berechtigten Personen erlaubt werden? Welche Sicherheitsthemen sind zu beachten?
Wie ist der fortdauernde Betrieb und die Nachvollziehbarkeit im Fehlerfall gewährleistet? Wie ist ein stabiler Betrieb und Governance möglich?

Da diese übergeordneten Fragestellungen bei jedem Deployment auftauchen, bietet es sich an, diese in standardisierter Form zu adressieren. Aus dieser Überlegung heraus ist bei QUNIS im Rahmen eines Forschungsprojektes das AHUB Deployment Framework entstanden.

Schnelle und stabile Bereitstellung mit Docker-basiertem Deployment-Framework

AHUB ist Docker-basiert und bietet eine orchestrierte Container-Landschaft aus standardisierten Modulen, die sich den obigen Fragestellungen annehmen. Mithilfe des Frameworks lassen sich beliebig viele analytische Teil-Applikationen mit minimalem Aufwand von der Sandbox-Umgebung in ein professionelles, produktives Setup und schlussendlich in einen stabilen Betrieb überführen.

Das ganze Framework ist als Open-Source-Projekt konzipiert. Der Quellcode und eine Demo-Applikation stehen über GitHub für jedermann zur Verfügung. Eine wirkliche Wohltat für jeden Data Scientisten. DIREKT ZU AHUB AUF GITHUB

Mehr zu AHUB erfahren.