Archiv für die Kategorie Advanced Analytics

Hilfe im Dschungel der Analytics Tools. Wir haben den Markt für Sie sondiert.

Erstellt am: Dienstag, 16. Juli 2019 von Monika Düsterhöft

Kaum ein Segment im Softwaremarkt unterliegt derzeit so vielen Veränderungen wie das der analytischen Werkzeuge.

Jedes Jahr sprudeln neue Produkte auf den Markt: branchenspezifische Nischenprodukte, Produkte für spezielle Aufgabenstellungen wie Textanalysen, Produkte für spezielle Fachabteilungen wie das Marketing, und, und, und…. Hinzu kommen noch umfangreiche Analytics-Plattformen, die versuchen, viele Anwendungsbereiche abzudecken oder Nutzer verschiedenster Kompetenzstufen anzusprechen.

Manche Tools setzen zudem auf einfache Zusammenarbeit in Teams, andere auf automatisiertes Reporting oder auf gute Visualisierungsmöglichkeiten. Jedes Produkt hat seine Vor- und Nachteile und ist beim heutigen Entwicklungs- und Innovationsdruck sicher noch nicht am Ende seiner Fähigkeiten angekommen. Nicht alle Produkte werden sich auf Dauer am Markt durchsetzen können – alle Produkte werden sich aber mit Sicherheit weiterentwickeln.

Man muss nicht zwingend Data-Science-Profi sein.

Der derzeitige Markttrend geht in Richtung Augmented Analytics. Dies bedeutet, mit den entsprechenden Werkzeugen können auch mathematisch und statistisch versierte Fachanwender und Citizen Data Scientisten Künstliche Intelligenz für Ihre Datenauswertung nutzen. Denn mittels Artificial Intelligence (AI) und Machine Learning werden Analyseschritte wie die Auswahl des richtigen Algorithmus von den Tools automatisiert, so dass der Nutzer kein Data-Science-Profi sein muss, um bestimmte Data-Science-Analysen durchführen zu können.

Es werden zum Beispiel Daten mit einer Clusteranalyse gruppiert, ohne dass der Nutzer verstehen muss, was im Hintergrund passiert. Ebenso können mit einem Klick Umsätze oder ähnliche geschäftsrelevante Daten mittels Zeitreihenanalysen vorhergesagt werden. In manchen Tools kann zudem durch die Einbettung von AI die Suche nach relevanten Daten mittels Sprachsteuerung oder Google-ähnlicher Suchfunktionen erleichtert werden. All das rangiert unter Augmented Analytics und gibt einen Eindruck davon, wie sich der Markt an Analytics-Werkzeugen weiter wandeln wird.

Welches Tool passt zu mir?

Bei der Vielzahl an Produkten und dem stetigen Wandel ist es schwer, den Überblick zu behalten. Wir haben den Markt gescannt und die Tools anhand typischer Nutzeranforderungen segmentiert.

  • Marktsegment 1: Reportingwerkzeuge
  • Marktsegment 2: BI & Analytics Suiten
  • Marktsegment 3:  Machine Learning (ML) & Data Science (DS) Plattformen
  • Marktsegment 4: Integrierte Entwicklungsumgebungen (IDEs) und Notebooks

Diese Segmentierung soll Ihnen helfen, das für Sie passende Tool zu finden. Um nun die für Sie passende Zuordnung zu identifizieren machen Sie sich bewusst, was Sie von dem Analysewerkzeug erwarten. Folgende Fragen unterstützen Sie dabei:

  • Reichen starre und einfache Visualisierungen von Daten, die sich als Bilddatei oder Tabelle abspeichern können?
  • Sollen mehrere Nutzer in einer explorativen Analyse zusammenarbeiten können?
  • Wenn ja, inwiefern soll die Zusammenarbeit unterstützt werden?
  • Nutzer welcher Fähigkeitsstufen sollen kollaborieren?
  • Wie ist deren Aufgabenverteilung?
  • Welche Anforderungen bestehen bezüglich Visualisierungen, statistischen und Machine-Learning-Funktionalitäten?
  • Inwiefern soll das Tool Data-Science-Prozesse wie das Trainieren von ML-Modellen unterstützen?

Mit Antworten auf diese Fragen sehen Sie schnell, in welchem Marktsegment sich das zu Ihren Anforderungen passende Tool befindet. Reicht Ihnen ein Reportingwerkzeug (Marktsegment 1) oder suchen Sie eher ein Tool für einen Power User (Marktsegment 2)? Oder gehen die Nutzer schon einen Schritt weiter in Richtung Data Science (Marktsegment 3)? Oder wollen Ihre Nutzer vollste Flexibilität und scheuen sich nicht vor anspruchsvoller Programmierung in Entwicklungsumgebungen (Marktsegment 4).

Marktsegmentierung von Analyse-Werkzeugen 

Sie fallen in mehrere Segmente? Kein Problem.

Die Anforderungen und Fähigkeiten der Nutzer in Ihrem Unternehmen gehen weit auseinander, so dass Sie nicht nur EIN relevantes Marktsegment für sich identifizieren? Keine Angst, das ist normal. Mit der richtigen Strategie und einem durchdachten Datenmanagementkonzept können diverse Tools auch problemlos miteinander kombiniert werden. Gerne unterstützen wir Sie hier bei der Auswahl und Implementierung, so dass Sie in Ihrem Unternehmen die datenbasierte Entscheidungsfindung mit Technologie der neuesten Generation schnellstens vorantreiben können.

Mein Tipp: Denken Sie zudem daran, dass die Nutzer mit dem Werkzeug gerne arbeiten und beziehen Sie diese in die Auswahl mit ein. Ich als Data Scientistin kann Ihnen sagen: „Nichts erschwert die Kreativität bei der explorativen Analyse mehr als eine Software, mit der man sich nicht wohl fühlt.“

In diesem Sinne, nutzen Sie unsere Segmentierung zur Orientierung und sprechen Sie uns gerne an. Ich freue  mich auf den Austausch mit Ihnen!

Übrigens – unsere beliebtesten Data Science Algorithmen haben wir ebenfalls übersichtlich für Sie zusammengestellt. Sie finden diese direkt hier auf unserem kostenfreien QUNIS MACHINE LEARNING CHEAT SHEET

AI, Advanced Analytics, Big Data und ihre Bedeutung für die BI

Erstellt am: Mittwoch, 1. Mai 2019 von Monika Düsterhöft

Artificial Intelligence (AI) nutzt Machine Learning

Artificial Intelligence ist ein Begriff, der sofort sehr stark mit Innovation assoziiert wird und gleichermaßen eine große Faszination wie diffuse Ängste auslösen kann, obwohl oder vielleicht auch gerade weil es bis dato keine generell akzeptierte oder allgemeingültige Definition dessen gibt.

Sprach Richard Bellman 1978 beispielsweise von „der Automatisierung von Aktivitäten, die wir mit menschlichem Denken assoziieren, also dem Fällen von Entscheidungen, Problemlösung, Lernen …“, definierte Patrick Henry Winston 1992 die AI als „das Studium von Berechnungen, die es möglich machen, wahrzunehmen, schlusszufolgern und zu agieren“. Eine weitere Definition aus dem Jahre 1990 von Ray Kurzweil trifft es ebenso im Kern: „Die Kunst, Maschinen zu entwickeln, die Funktionen ausüben, welche Intelligenz erfordern, wenn sie vom Menschen ausgeführt werden.“

Ein Großteil der Methoden, mit denen Artificial Intelligence (AI) realisiert wird, fasst man unter dem Oberbegriff des Machine Learning (ML) zusammen. Maschinelles Lernen ist sehr stark der Art nachempfunden, wie wir Menschen lernen – so werden der Maschine in immer wiederkehrenden Schleifen Beispiele vorgelegt, anhand derer ein Sachverhalt gelernt wird, nur um das Gelernte anschließend verallgemeinern zu können.

Beispielsweise zeigt man der Maschine zahlreiche verschiedene Bilder von Katzen, auf dass sie danach das Prinzip „Katze“ verinnerlicht hat und solche auch auf Bildern erkennen kann, die sie vorher noch nicht zu sehen bekommen hat. Wie auch beim Menschen wird beim maschinellen Lernen nach der Lernmethode unterschieden – so unterscheiden wir zwischen dem überwachten Lernen (Supervised Learning), also dem Lernen anhand vordefinierter Beispiele, dem unüberwachten Lernen (Unsupervised Learning), was das automatische Erkennen von Mustern oder Merkmalen zum Inhalt hat, sowie dem bestärkenden Lernen (Reinforcement Learning), das auf dem Prinzip des Belohnens und Bestrafens basiert.

Advanced Analytics nutzt AI

Bei der Advanced Analytics kommen maschinelles Lernen sowie andere mathematisch-statistische Verfahren und Modelle zur Anwendung. Hierunter verstehen wir das methodische Analysieren und Interpretieren von Daten beliebiger Strukturen mit Ziel einer möglichst automatischen Erkennung von Bedeutungen, Mustern und Zusammenhängen und/oder der Prognose bestimmter Eigenschaften oder Kennzahlen.

Die Advanced Analytics kann somit auch als nächste Evolutionsstufe der Business Intelligence gelten. Während die traditionelle Business Intelligence den Blick vorrangig in die Vergangenheit richtet, um den Manager zu ermächtigen, die richtigen Rückschlüsse und bestmöglichen Entscheidungen für die künftige Ausrichtung des Unternehmens zu treffen, versucht die Advanced Analytics, diesen Prozess weitestgehend der Maschine zu überlassen, also zu automatisieren und selbst in die Zukunft zu schauen. Dies erfolgt in zwei aufeinanderfolgenden Schritten – im ersten werden durch die Predictive Analytics Vorhersagen über zu erwartende Entwicklungen gemacht, im zweiten zeigt die Prescriptive Analytics potenzielle Maßnahmen auf, gezielt wünschenswerte Ergebnisse zu erreichen.

Big Data erweitert BI

Wie auch in des Managers Entscheidungsprozess weitere relevante Zusatzinformationen neben den reinen Geschäftsergebnissen einfließen, beispielsweise Wetterdaten, geolokale Informationen oder Markttrends, so ist dies analog gültig für die Advanced Analytics. So beschafft man sich neben den strukturierten Daten aus ERP-, CRM- oder anderen Systemen wie beispielsweise dem zentralen Data Warehouse weitere Informationsquellen, die in die Analytics mit eingebunden werden. Dies können nicht selten Datenbestände sein, die man im Allgemeinen dem Begriff Big Data zuordnet.

Konkret bezeichnet Big Data eine bestimmte Art und Beschaffenheit von Daten plus dazu passende Methoden und Technologien für die hochskalierbare Erfassung, Speicherung und Analyse. Gerne wird in dem Zusammenhang auch von den drei Vs gesprochen:

  • Variety oder die Datenvielfalt: Immer mehr Daten liegen in unstrukturierter und semistrukturierter Form vor, beispielsweise aus den sozialen Netzwerken oder auch Geräten und Sensoren.
  • Volume oder die Datenmenge: Immer größere Datenvolumina werden angesammelt – Größenordnungen von mehreren Petabytes sind keine Seltenheit mehr.
  • Velocity oder die Geschwindigkeit: Riesige Datenmengen müssen immer schneller ausgewertet werden, bis hin zur Echtzeit. Die Verarbeitungsgeschwindigkeit muss mit dem wachsenden Datenvolumen Schritt halten.

Bezieht man also neben strukturierten Daten auch unstrukturierte, polystrukturierte und Massendaten, idealerweise realtime in die Analyse mit ein und bedient sich dafür unter anderem der Methoden des Machine Learnings, erweitert man die BI durch Big Data und den Einsatz von AI hin zur Advanced Analytics.

Viele spannende Informationen warten darauf, auf diese Art von Ihnen entdeckt zu werden!

Mein Tipp: Sie wollen den Machine Learning Algorithmen auf den Grund gehen? Holen Sie sich das kostenfreie QUNIS Machine Learning Cheat Sheet als PDF, im Pocket-Format oder als Poster für die Wand. Hier direkt Cheat Sheet holen.

CDS – der Citizen Data Scientist als Weg aus dem Analytics-Ressourcen-Engpass

Erstellt am: Montag, 18. März 2019 von Monika Düsterhöft

Für die Umsetzung von Advanced-Analytics-Vorhaben ist eine durchdachte Datenstrategie unverzichtbar. Sie regelt alle Fragen rund um die technische Systemintegration, die Data Governance und das unternehmensweite Data Quality Management (DQM).

Darüber hinaus gibt es neue fachliche Anforderungen und Aufgabenfelder wie die Definition komplexer Algorithmen für das Heben wirtschaftlicher Potenziale oder das Deployment der entstandenen Data-Science-Services. Der Data Scientist nimmt bei diesen Aufgaben eine der zentralen Schlüsselrollen ein. 

Neue Advanced-Analytics-Aufgaben benötigen Data Scientisten mit vielfältigen mathematischen, technischen und prozessualen Skills.

Mit seinem tiefen Einblick in die Fachbereiche formuliert der Data Scientist die Projektanforderungen, kümmert sich um die Themen Datenmanagement und Data Quality Management unter Beachtung der Data Governance und übernimmt die Definition von Datenmodellen und Algorithmen. Er hat tiefe mathematisch-statistische Kenntnisse, kann programmieren, kennt sich mit Datenschutz und sonstigen Compliance-Regeln aus und verfügt über umfangreiches Business-Know-how.

Kurzum, der Data Scientist ist ein Allrounder mit viel Spezialwissen und umfassender Erfahrung. Kein Wunder daher, dass diese Fachkräfte äußerst gefragt und ziemlich rar sind und dass viele Digitalisierungsvorhaben schlichtweg wegen dieser fehlenden Skills und Ressourcen stagnieren.

Arbeitsteilung, Tools und das Konzept des Citizen Data Scientist (CDS) können Abhilfe aus dem Ressourcen-Dilemma schaffen.

Ein Ansatzpunkt ist die Entlastung des Data Scientists von Routinen im Datenmanagement. Speziell bei der Datenakquisition können technisch versierte Experten, die sogenannten Data Engineers, den Data Scientist gut unterstützen. Ein zweiter Ansatzpunkt, der sich derzeit am Markt für analytische Applikationen abzeichnet, ist die zunehmende Verlagerung von analytischem Know-how in die Systemwelt.

Etablierte BI-Anbieter beispielsweise erweitern ihr Portfolio um Datenvisualisierungstools, die Visual Analytics ohne Programmieraufwand unterstützen. Per Drag-and-drop können hier Datenströme hinzugefügt, verbunden und analysiert werden, und im Hintergrund laufen die neuesten Algorithmen für die fortgeschrittene Datenanalyse. Auch die Branche der AI-Spezialisten liefert unter der Bezeichnung „Augmented Analytics“ anwenderorientierte Werkzeuge, die Funktionen zur Automatisierung der Datenaufbereitung, Erkenntnisfindung und Datenanalyse enthalten.

Mithilfe solcher anwenderorientierten Frontends können geübte BI Power User, die ein mathematisch-statistisches Grundverständnis sowie Interesse an Analytics mitbringen, bestimmte Aufgabenfelder der Data Science übernehmen und so neben den Data Engineers ebenfalls ihren Teil dazu beitragen, das begehrte Skillset des Data Scientists zu erfüllen. Es kristallisiert sich ein neues Rollenbild heraus. Wir sprechen vom Citizen Data Scientist (CDS), der mit den richtigen Tools in der Lage ist, analytische Aufgaben auszuführen und auch selbst Modelle zu erstellen, die fortgeschrittene Analysen, Vorhersagen und präskriptive Funktionen enthalten.

Die Ausbildung von CDS ist ein aussichtsreicher Ansatzpunkt, um analytische Kompetenzen im Unternehmen aufzubauen.

Im Grunde kann jeder Fachanwender oder IT-Spezialist, der ein Grundverständnis für Datenarbeit sowie statistisches und mathematisches Know-how mitbringt, den Umgang mit Self-Service-Data-Science-Werkzeugen erlernen. Besonders geeignet sind BI Power User, die lernbereit und neugierig darauf sind, Data Science und vorhersagende Algorithmen für ihre Geschäftsprozesse zu erkunden.

Im Gegensatz zum klassischen BI-Anwender, der auf der Basis vorgefertigter Daten-Cubes arbeitet, bewegt sich der CDS dabei jedoch auch auf der Ebene der Rohdaten, um explorativ neue Erkenntnisse zu generieren. Weitere aussichtsreiche Kandidaten für Citizen Data Science sind Ingenieure mit Hintergrundwissen aus Mathematik, Statistik und Modellierung.

Die neuen Data-Science-Experten benötigen Rückendeckung und Unterstützung für ihr Tätigkeitsfeld.

Für ihre Aufgabenfelder bringen unternehmensintern ausgebildete CDS neben ihren analytischen Fähigkeiten auch ihr bereits vorhandenes Markt- und Branchen-Know-how sowie das Wissen um interne Prozessen in die Datenanalysen mit ein. Ein wesentlicher und nicht zu unterschätzender Vorteil. Sie brauchen aber auch Rückendeckung durch das Management sowie Unterstützung durch die interne IT.

CDS benötigen mehr Daten, zum Teil auch mehr ungefilterte Daten und sie brauchen IT-Umgebungen, in denen sie mithilfe aktueller Tools und Technologien experimentieren und Prototypen von Modellen und Applikationen bauen können. Zudem müssen sie den zeitlichen Freiraum für ihre Datenrecherchen erhalten.

Ein versierter Partner an der Seite, der neben der expliziten Data-Science-Expertise auch Erfahrung aus anderen Projekten mit einbringt und die neuen CDS auf ihrem Weg begleitet, ist eine weitere äußerst wertvolle Hilfe und ein wichtiger Baustein für den Erfolg einer Advanced-Analytics-Initiative.

Wenn die Rahmenbedingungen stimmen, können sich Unternehmen auf diese Weise pragmatisch wertvolle Personalressourcen aus den eigenen Reihen erschließen und richtig Schubkraft in ihre Digitalisierungsprojekte bringen.

Mein Tipp: Besuchen Sie das CA-Seminar – Deep Dive Advanced Analytics – Machine Learning in der Praxis mit „R“ – und lernen Sie das Tagesgeschäft eines Data Scientist besser kennen. Das Seminar wird von und mit QUNIS Experten durchgeführt und findet im Rahmen der Kooperation mit der CA Controller Akademie und des Ausbildungsprogramms zum Information Manager statt. Mehr zu allen CA-Seminaren finden Sie hier.

Data-Science-Services einfach und stabil bereitstellen mit dem AHUB Deployment Framework.

Data Science liebt Docker

Erstellt am: Freitag, 1. März 2019 von Monika Düsterhöft

Moderne Verfahren zur Datenanalyse dringen immer mehr in den Unternehmensalltag ein. Als Experte für das Erkennen von Strukturen in großen Datentöpfen und daraus abzuleitenden Vorhersagen spielt der Data Scientist eine bedeutende Rolle. Er leitet und begleitet die Entwicklung des Data-Science-Services von der Modellierung bis zur Bereitstellung an die Nutzer und hat es dabei typischerweise mit folgenden Herausforderungen zu tun:

Erstellung eines Modells in R oder Python inklusive einer REST API für webbasierte Aufrufe zum Modelltraining und Scoring

Im ersten Schritt, der explorativen Phase, befasst sich der Data Scientist mit dem Erstellen eines Modells mit Hilfe von Skripten. Diese trainieren das Modell mit historischen Daten und rufen Vorhersagen auf Basis neuer Datensätze ab. Die Umsetzung der Skripte erfolgt meist in Umgebungen wie R oder Python, die sich dank ihrer umfangreichen Bibliotheken aus dem Bereich der Statistik und des Machine Learning sowie einer sehr aktiven Entwickler-Community zum Quasi-Standard erhoben haben.

Für die Modell-Findung arbeitet der Data Scientist gerne in einer „Sandkasten-Umgebung“. Das kann eine virtuelle Maschine, ein lokaler Rechner oder auch ein Cloud-gehostetes „Notebook“ mit browserbasierter Entwicklungsumgebung sein. Das fertige Modell sollte über eine webbasierte Schnittstelle (REST-API) für andere Services ansprechbar sein. Hierfür haben sich die Bibliotheken Flask (Python) und Plumber (R) bewährt.

Definition der Code-Abhängigkeiten und Aufbau eines Images über Dockerfiles sowie Start der Container auf einem Cloud- oder On-Premise-Server

Ist ein Vorhersagemodell mit hoher Güte entstanden, gilt es dieses dem Nutzer zur Verfügung zu stellen. Wir sprechen vom Deployment des Data-Science-Services. Für diesen Zweck hat sich in den letzten Jahren die Docker-Container-Technologie als extrem flexibles und einfach handhabbares Werkzeug erwiesen. Denn Docker-Container lassen sich durch eine simple Konfigurationsdatei (das Dockerfile) in Minutenschnelle bauen und auf einem beliebigen System zur Ausführung bringen. Es gilt das große Docker-Versprechen: Wenn ein Container im Sandkasten läuft, lässt er sich auf jeder anderen Infrastruktur gleichermaßen betreiben.

Ein Container ist dabei ein gekapselter Prozess in dem sowohl der auszuführende Code, als auch alle dafür benötigten Abhängigkeiten (Laufzeitumgebung, Bibliotheken) untergebracht sind. Die Hardware-Ressourcen wie CPU und RAM werden dem Container vom Docker-Daemon, der auf dem Host-Betriebssystem läuft, zugewiesen. Container lassen sich so als ressourcenschonendere Variante einer dedizierten virtuellen Maschine sehen, da im Gegensatz zur VM nicht für jeden gekapselten Prozess ein eigenes Betriebssystem ausgeführt werden muss.

Fragestellungen rund um GUI, Sicherheit, Betrieb bedenken und lösen

Wer den Deployment-Prozess für einen Data-Science-Service einmal durchlaufen hat, wird feststellen, dass neben der reinen Data Science auch noch folgende Fragestellungen bedacht werden müssen:

  • Wie kann ein technisch weniger versierter Nutzer die Modellvorhersage abrufen? Welche GUI braucht er?
  • Wie kann der Zugriff auf das Modell nur berechtigten Personen erlaubt werden? Welche Sicherheitsthemen sind zu beachten?
  • Wie ist der fortdauernde Betrieb und die Nachvollziehbarkeit im Fehlerfall gewährleistet? Wie ist ein stabiler Betrieb und Governance möglich?

Da diese übergeordneten Fragestellungen bei jedem Deployment auftauchen, bietet es sich an, diese in standardisierter Form zu adressieren. Aus dieser Überlegung heraus ist bei QUNIS im Rahmen eines Forschungsprojektes das AHUB Deployment Framework entstanden.

Schnelle und stabile Bereitstellung mit Docker-basiertem Deployment-Framework

AHUB ist Docker-basiert und bietet eine orchestrierte Container-Landschaft aus standardisierten Modulen, die sich den obigen Fragestellungen annehmen. Mithilfe des Frameworks lassen sich beliebig viele analytische Teil-Applikationen mit minimalem Aufwand von der Sandbox-Umgebung in ein professionelles, produktives Setup und schlussendlich in einen stabilen Betrieb überführen.

Das ganze Framework ist als Open-Source-Projekt konzipiert. Der Quellcode und eine Demo-Applikation stehen über GitHub für jedermann zur Verfügung. Eine wirkliche Wohltat für jeden Data Scientisten. DIREKT ZU AHUB AUF GITHUB

Mehr zu AHUB erfahren.

Die Blockchain – ist das was oder kann das weg?

Erstellt am: Montag, 18. Februar 2019 von Monika Düsterhöft

Kryptowährungen sind nichts für mich, also warum sollte ich mich mit der Blockchain auseinandersetzen? So oder so ähnlich könnte man denken, wenn das Gespräch auf den mittlerweile nicht mehr gar so neuen Hype-Begriff kommt. Dass sich diese hochinteressante Technologie jedoch nicht nur für das Abbilden von Zahlungstransaktionen eignet, sondern auch anderen Anwendungsfällen eine solide und sehr sichere Plattform bieten kann, versteht man, wenn man sich mit dem Verfahren näher auseinandersetzt.

Wie funktioniert die Blockchain?

Rein technisch ist die Blockchain zunächst einmal eine Datenbank. Allerdings handelt es sich hier nicht um eine relationale Datenbank, wie wir sie vom SQL Server, Oracle, DB2 oder den vielen anderen namhaften Systemen kennen. Die Datenbank besteht vielmehr aus einer verketteten Liste von in Blöcken zusammengefassten Daten.


Verkettungen und Kopien machen die Blockchain einzigartig sicher

Die Verkettung definiert den Kern des Verfahrens

Diese Verkettung ist auch gleichzeitig das Spannende. Jeder der Blöcke „zeigt“ auf den jeweils vorigen Datenblock mittels eines sogenannten „Hashwertes“, der durch kryptografische Verschlüsselung jenes Vorgängerblocks mitsamt dessen Zeiger auf wiederum seinen Vorgängerblock entstanden ist.

Dieses Verfahren macht einen guten Teil dessen aus, was die Blockchain einzigartig und sicher macht: Würde man einzelne Daten innerhalb eines Blockes manipulieren, würde der Hashwert des Blockes damit verändert, was zur Folge hätte, dass man den nachfolgenden Block ebenfalls modifizieren müsste, sodann den nächstfolgenden, da auch dieser in Mitleidenschaft gezogen wäre, und so weiter und so fort.

Das Prinzip der Kopie sichert das Verfahren

Anders als in üblichen Systemen befindet sich die Blockchain-Datenbank nicht auf einem einzelnen zentralen Server, auf den die Teilnehmer des Netzwerkes zugreifen. Vielmehr verfügt jeder einzelne der teilnehmenden Rechner über eine vollständige Kopie der Blockchain. Durch vereinbarte Konsensregeln wird permanent überprüft, dass der Löwenanteil aller Teilnehmer das Gleiche gespeichert hat.

Ein betrügender Teilnehmer müsste also nicht nur seine eigene Kopie der Blockchain verändern, sondern dies insgesamt bei mehr als der Hälfte der Rechner tun, um seine Manipulation der Datenbank als die neue gültige Version durchbringen zu können. Dies jedoch ist wiederum durch das Verfahren selbst weitgehend ausgeschlossen.

Das Verfahren organisiert sich selbst

Jedes Mal, wenn ein Blockchain-Teilnehmer eine neue Transaktion, also einen neuen Datensatz meldet, schreiben alle beteiligten Rechner ihre Version der Blockchain eigenständig fort. Eine gewisse aufgelaufene Anzahl dieser neuen Datensätze wird sodann durch einen der teilnehmenden Rechner in einem neuen Block gebündelt, der dann wiederum mittels des Hashwert-Zeigers an die Kette angehängt wird.

Wer dieser Teilnehmer, der den neuen Block vorgibt, jeweils ist, wird durch einen vereinbarten Algorithmus, auch das Protokoll der Blockchain genannt, entschieden. Hierzu gibt es eine Vielzahl gängiger Methoden. Eine der bekanntesten nennt sich „Proof of Work“. Daneben gibt es aber auch den „Proof of Stake“ Algorithmus, „Proof of Authority“ und einige mehr.

Durch dieses Verfahren, das ein Beispiel der sogenannten Distributed Ledger Technologie darstellt, ist eine zentrale Instanz im Netzwerk überflüssig. Dies macht die Blockchain so spannend, denn damit ist es nunmehr erstmalig denkbar, dass es möglich sein könnte, auf zentralisierte Services wie zum Beispiel Banken zu verzichten, deren Servertechnologie und Programmen wir ja Stand heute quasi bedingungslos vertrauen müssen.

Kryptowährung, Smart Contracts, IoT – wo kommt die Blockchain zum Einsatz?

Am weitesten verbreitet und bekannt sind die sogenannten Kryptowährungen, also digitale Zahlungsmittel, deren Transaktionen auf einer Blockchain gespeichert werden. Bitcoin ist hierbei die älteste Währung, quasi die Mutter aller Blockchain-basierten Geldmittel.

Daneben ist Ethereum eine weitere sehr verbreitete Blockchain Technologie. Besonders bekannt geworden ist diese durch die Möglichkeit der Integration vollautomatischer dynamischer Verträge, sogenannter Smart Contracts.

Diese Programme, die ebenso unveränderlich und fälschungssicher wie alle übrigen Daten auf der Blockchain gespeichert sind und dort zur Ausführung kommen, eröffnen neue Möglichkeiten, die Blockchain im Unternehmensumfeld zu nutzen.

DAPPs für Versicherungen, Logistik, Hotellerie und mehr

Mit Smart Contracts ist es beispielsweise möglich, vertragliche Abkommen beliebiger Art vollautomatisch und unbestechlich zur Ausführung zu bringen, was ein enormes Potenzial an Möglichkeiten eröffnet, auch komplexe Prozesse auf sehr verlässliche Weise zu automatisieren. Man spricht hierbei auch von dezentralisierten Applikationen, sogenannten DAPPs.

So ist großes Automatisierungspotenzial beispielsweise bei Versicherungen denkbar – die Blockchain ermöglicht die verlässliche Sammlung aller Kundenzahlungen mit automatischer Auszahlung bei Eintritt eines im Smart Contract definierten Versicherungsfalls.
Ein weiteres großes Anwendungsfeld ist in der Logistik angesiedelt, lassen sich doch durch die Blockchain ganze Lieferketten mit allen Zwischenstationen zuverlässig dokumentieren.

Auch in IoT (Internet of Things)-Szenarien bieten Smart Contracts, neben der sich unter dem Namen IOTA etablierenden Blockchain, die sich durch eine ganz besonders hohe Transaktionsrate auszeichnet, hervorragende Optionen. So könnte beispielsweise ein Hotel enorme Einsparungen durch vollautomatische Services erzielen. Ein denkbares Szenario wäre: Bei Zahlung einer 24-Stunden-Gebühr werden für den Hotelgast Licht, Wasser sowie Strom aktiviert und das Türschloss automatisch geöffnet – was Schlüsselkarten oder ähnliches überflüssig macht.

Es ist noch nicht alles gedacht!

Bei all diesen vielen Möglichkeiten besteht zum aktuellen Zeitpunkt neben dem großen Hype um das Thema Blockchain noch einige Unsicherheit, was die Zukunft dieser Technologie betrifft. In einigen Aspekten gibt es auch noch Entwicklungsbedarf, um bestehende Schwachstellen zu beseitigen.

Dennoch lassen die Vielzahl der bereits umgesetzten Anwendungsfälle und die Möglichkeiten, die die Technologie in sich birgt, erahnen, dass das System Blockchain von dauerhaftem Bestand sein wird. Auch in der BI und Analytics tun sich spannende Einsatzfelder wie Echtzeitanalyse zur Anomalie- oder Betrugserkennung, eine Überwachung von Lieferketten oder einer Rückverfolgung von Produkten auf, die wir weiterverfolgen werden.

In Summe lässt sich also festhalten: Blockchain ist zwar nicht von Beuys, man sollte sie aber trotzdem nicht entsorgen. Vielmehr sollte man wachsam sein und bei Szenarien und Initiativen, bei denen es um sichere, nachvollziehbare Datenströme geht, immer auch mal ein Auge auf die Technologien und Plattformen der Blockchain werfen und untersuchen, wo sich ein Einsatz ausprobieren ließe oder gar lohnen könnte.

Vielleicht wollen Sie ja ein Vorreiter sein?

Sprechen Sie mit uns, wir bringen gerne unsere Erfahrung und Know-how mit ein KONTAKT

Datenqualität in BI und Big Data – wo liegt der Unterschied und wie funktioniert es zusammen?

Erstellt am: Freitag, 4. Januar 2019 von Monika Düsterhöft

In einer klassischen BI-Umgebung lagern typischerweise strukturierte Daten aus internen Vorsystemen wie Enterprise Resource Planning (ERP), Customer Relationship Management (CRM) oder der Buchhaltung. Für die Qualitätssicherung gibt es Best Practices und erprobte Technologien – man weiß genau, wie und wo man bei der Optimierung ansetzen kann, wenn der Bedarf da ist.

Unklar ist hingegen die Qualitätssicherung bei den für Predictive Analytics nötigen Big-Data-Quellen. Nutzen und Wertschöpfung der anvisierten Vorhersagemodelle hängt auch hier maßgeblich von der Qualität der zugrundeliegenden Daten ab. Systemarchitekten diskutieren nun, wie sie die Qualität von riesigen semi- und polystrukturierten Daten bewerten und sichern, welche Systemarchitekturen dabei ins Spiel kommen und wie das Datenmanagement funktioniert.

Das Data Warehouse bleibt der Single Point of Truth

Das klassische Data Warehouse hat als Kern einer typischen BI-Umgebung auch in der Welt der fortgeschrittenen Analysen seine Daseinsberechtigung. Es ist die beste Grundlage für standardisierte Berichts- und Analyseprozesse mit den unverzichtbaren Finanz- und Steuerungskennzahlen. Geht es um vorausschauende Unternehmenssteuerung, so sind diese Berichtsstandards um Trendanalysen und Prognosen aus der Big-Data-Welt zu ergänzen. In der Praxis erweist sich der sogenannte Data Lake als pragmatischer Implementierungsansatz, um hochstrukturierte Daten aus Transaktionssystemen und wenig strukturierte Big Data zusammenzuführen.

Ausgehend von der bewährten BI-Architektur mit offenen Schnittstellen lassen sich damit Big-Data-Komponenten in eine vorhandene Informationsplattform integrieren. Wichtig dabei ist, dass das zentrale Data Warehouse seinen Anspruch als Single Point of Truth im Unternehmen behält. Will man das Datenmanagement und die Qualität der Datenbasis für Advanced Analytics optimieren, ist es daher eine gute Idee, mit dem meist vorhandenen Data Warehouse zu starten.

Wie die Projektpraxis zeigt, besteht hier nämlich oft noch Handlungsbedarf. Abgesehen von Qualitätsmängeln und inkonsistenten Datenstrukturen wird mit dem Trend zu Self-Service-BI auch das bekannte Problem von Insellösungen und Datensilos wieder akut, das früher durch diverse Excel-Lösungen der Fachabteilungen verursacht wurde. Self-Service im Fachbereich ist praktisch und hat seine Berechtigung, aber das zentrale Business Intelligence Competence Center oder der BI-Verantwortliche müssen die Datenströme unter Kontrolle halten und darauf achten, dass der Single Point of Truth nicht ausgehebelt wird.

Data Warehouse Automation sichert die Datenqualität

Sind die Datenströme gut modelliert, bestehen große Chancen für eine dauerhaft hohe Datenqualität im BI-System. Durchweg strukturierte Daten von der operativen bis zur dispositiven Ebene, standardisierte Auswertungsverfahren und mächtige ETL-Werkzeuge (Extraktion, Transformation, Laden) mit integrierten Prüffunktionen ermöglichen eine hohe Automatisierung der Datenauswertung.

Für den effizienten Aufbau, die Anpassung und die Optimierung von Data Warehouses gibt es inzwischen ausgereifte Verfahren, die Standardisierung und Automatisierung erhöhen und damit die Fehlerrisiken auf ein Minimum senken. Diese Data Warehouse Automation beruht auf Frameworks, die bereits Best Practices für ETL nach etablierten Verfahren sowie Prüflogiken zur Sicherung der Datenqualität enthalten beziehungsweise deren Modellierung auf Meta-Ebene unterstützen. Neben einer effizienten Entwicklung und Administration vermeidet dieser lösungsorientierte Ansatz Konstruktionsfehler und sorgt dafür, dass für eine saubere Datenverarbeitung Best Practices zum Einsatz kommen.

Da Business Intelligence die Business-Realität möglichst genau abbilden will, ist ein hohe Datenqualität unverzichtbar. Klassische Kriterien wie Exaktheit und Vollständigkeit sind dabei zentrale Anforderungen. Schon ein Datenfehler oder eine Lücke im operativen Bestand kann das Ergebnis einer aggregierten Kennzahl verfälschen. Im Rahmen des internen und externen Berichtswesens stehen damit schnell falsche Entscheidungen oder Compliance-Verstöße im Raum.

Bei Big Data steuert der Business Case die Governance

In der Big-Data-Welt gestaltet sich die Datenqualität anders. Hier geht es zunächst darum, die relevanten Datenquellen zu bestimmen, die Daten abzuholen und zu speichern. Das ist nicht immer trivial angesichts einer Bandbreite von Daten aus dem Internet of Things, unstrukturierten Informationen aus Blogs und Social Networks, Sensordaten aus Kassensystemen und Produktionsanlagen, Messdaten aus Leitungsnetzen bis zu Datensätzen aus Navigationssystemen.

Im Gegensatz zur BI-Welt bestehen hier für die interne Datenarbeit keine allgemeingültigen Geschäftsregeln und Standards. Da es um die statistische Auswertung von Massendaten geht, sind die BI-typischen Qualitätskriterien Vollständigkeit und Exaktheit weniger wichtig. Im Rahmen der statistischen Verfahren fallen einzelne Fehler und Lücken nicht ins Gewicht, und Ausreißer lassen sich regelbasiert eliminieren. Wie groß die kritische Masse für belastbare Ergebnisse ist, wie genau, vollständig oder aktuell die Datenbasis sein muss und in welcher Form Informationen nutzbar gemacht werden, das ist für Big-Data-Analysen fallbezogen zu klären.

Die Vielfalt der Einsatzbereiche und damit die Rahmenbedingungen für die Bewertung und Bearbeitung von Daten sind nahezu unbegrenzt. Geht es etwa beim Internet of Things um die grobe Ressourcenplanung von Wartungsarbeiten für angebundene Geräte, sind Ausfälle einzelner Geräte-Meldesysteme irrelevant, da die Ermittlung von Peaks ausreicht. Im Rahmen von Predictive Maintenance ist dagegen jede konkrete Ausfallmeldung eines Gerätes wichtig. Für Kundenzufriedenheitsindizes auf Basis von Weblog-Analysen kommt es nicht auf jeden Beitrag an. Vielmehr geht es darum, Trends abzuleiten und diese in sinnvoll definierte Kennzahlen zu überführen.

Bei Big-Data-Anwendungen fallen also Datenqualitätsmanagement und Governance ebenso individuell aus wie das Analyseszenario des jeweiligen Business Case. In hoch automatisierten Anwendungen wie Autonomes Fahren oder Predictive Maintanance, in denen ausschließlich Maschinen über die Ergebnisse und Auswirkungen von Datenanalyen entscheiden, ist die Data Governance besonders wichtig. Die Quellen von Big Data liegen häufig außerhalb des Einflussbereichs der internen Prozesse: Maschinen-Output, Nutzereingaben oder Internet-Datenströme lassen sich nicht über interne organisatorische Maßnahmen kontrollieren. Bei permanent fließenden, unstrukturierten Datenquellen wie Chatforen greifen auch die klassischen ETL-Methoden nicht, und Störungen wie etwa eine Leitungsunterbrechung können nicht durch Wiederholung oder das Wiederherstellen des Datenbestands ausgeglichen werden.

Eine profunde Konzeption sichert den Projekterfolg

Das Potenzial von Predictive Analytics ist riesig, und viele Unternehmen erschließen sich gerade neue Dimensionen der Informationsgewinnung. Durch Cloud-Betriebsmodelle lassen sich neue Anwendungen schnell und kosteneffizient umsetzen. Voraussetzung dafür ist eine profunde Konzeption, die den kompletten Wertschöpfungsprozess der Daten mit Blick auf ein präzise formuliertes Projektziel abdeckt. Für ein erfolgreiches Projekt müssen anspruchsvolle Fragen der Fachlichkeit, Technik und Organisation geklärt werden. Hier empfiehlt es sich, die Erfahrung eines ganzheitlich orientierten Beratungsunternehmens hinzuzuziehen, um sich zeitraubende Umwege und schmerzhafte Lernzyklen zu ersparen.

Mehr zum QUNIS Data Lake Konzept erfahren.

Softbots als nächste Evolutionsstufe in der Anwendungsentwicklung

Erstellt am: Freitag, 24. August 2018 von Malte Hoffmann

Ein Chat- oder noch besser Softbot – je nachdem, wie leistungsfähig sein Kernprogramm ist – sehe ich als beste Idee einer möglichen Weiterentwicklung des klassischen Anwendungsprogramms, die mir seit langem begegnet ist. Nennen wir diese Konstruktion im Nachfolgenden einfach Bot, um die Sache nicht unnötig zu verkomplizieren.

Digitaler bester Freund, Kollege und Ratgeber

Ein Bot kann so vieles sein – schlichte Frage-/Antwortmaschine, leicht und effizient bedienbarer FAQ-Service, umfassendes und weltumspannendes Auskunftsbüro, unbürokratisches, sympathisches Helferlein bei der Datenerfassung oder effizientes Hilfsinstrument bei Recherchearbeiten. Der Einsatz geht bis hin zum digitalen intelligenten Assistenten, der on Demand entweder BI-Analysen interaktiv durchführt oder hochkomplexe KI-Algorithmen zur Ausführung bringt oder mir ganz schlicht über einen Internetservice eine Pizza bestellt, wenn mich der kleine Hunger packt.

Die möglichen Anwendungsfälle sind von unbegrenzter Mannigfaltigkeit. Vor allem aber ist ein Bot ein treuer, intelligenter – und wenn der Entwickler sich ein wenig Mühe mit dem Charakter gibt auch recht liebenswürdiger – vor allem aber nimmermüder hilfreicher Geselle, der mich, sei es privat oder auch und ganz explizit geschäftlich, angenehm und effizient unterstützend durch meinen Tag begleiten kann.

Funktion und Technik kurz erklärt

Um zu verstehen, wie so ein Bot technisch funktioniert, befassen wir uns am besten mit den Komponenten, aus denen er besteht.

Da haben wir zum einen die Schnittstellen zu seiner Umwelt – in der Grafik links und rechts außen dargestellt. Hier sitzt der Mensch, der mit dem Bot in Interaktion tritt und zwar üblicherweise mittels Text – also Tippen – oder Sprache – also verbal.

Kommt die Sprachsteuerung zum Einsatz, braucht es dafür auf beiden Seiten jedenfalls die dafür vorgesehenen Künstliche-Intelligenz (KI)-Bausteine – zum einen für die automatische Spracherkennung, also die Umwandlung des gesprochenen Wortes in maschinenlesbaren Text – und  zum anderen für die Sprachsynthese, also die Umwandlung des textbasierten Maschinenoutputs in eine künstliche Sprechstimme.

Beide Verfahren basieren heutzutage immer mehr auf Deep Learning Methoden, die einen sehr positiven Einfluss auf die Qualität des Ergebnisses haben – auf der einen Seite die Minimierung der Fehlerrate bei der Spracherkennung, auf der anderen Seite die Verbesserung der Natürlichkeit der Sprachmelodie.

Die Interpretation des Gesagten

Nachdem nun also die Benutzereingabe in maschinenlesbarer Form vorliegt, folgt oftmals als optionale Komponente ein weiterer KI-Baustein, der auf den ersten Blick eventuell gar nicht weiter als solcher auffällt, aber dennoch eine sehr essentielle Funktionalität darstellt. Ich spreche hier von der Notwendigkeit der Interpretation des Gesagten, also der Feststellung des besonderen Wunsches, der Intention des Anwenders.

Wie Sie vielleicht schon selbst beim Chatten mit einem Bot bemerkt haben, können Sie in mehr oder weniger ganzen, auch umgangssprachlichen Sätzen mit ihm kommunizieren. Weder ist es nötig, sich bestimmte Sprachbefehle zu merken oder aber verabredete Wortlaute zu verwenden; selbst kleine Tippfehler werden großzügig toleriert.

Wie funktioniert das? Nun, hier kommt eine weitere Disziplin der KI zum Einsatz, das Natural Language Processing (NLP). Es übernimmt die Interpretation des Anwenderwunsches.

Zu guter Letzt, sozusagen im Zentrum des Geschehens befindet sich dann das Kernprogramm. Hier passiert quasi die Fleißarbeit, alle Programmschritte, die für die Erfüllung des Anwenderwunsches vollzogen werden müssen. Und da befinden wir uns in der traditionellen, wenngleich auch sehr stark dialogorientierten Anwendungsentwicklung, die aber auch hier ganz stark über den Einbezug von weiteren, individuellen KI-Komponenten intelligent gemacht werden kann.

Ein Wort noch zur Sprachsteuerung

Diejenigen Bots, die Stand heute vorrangig durch direkte Ansprache funktionieren, sind beispielsweise Alexa von Amazon, Google Home, Siri von Apple oder Cortana von Microsoft, um jetzt nur ein paar bekannte Vertreter zu nennen. Wir haben uns mittlerweile mit dem permanenten Lauschangriff seitens dieser treuen Gefährten arrangiert, ist es doch zu bequem, auf diese Weise mit den gewünschten Funktionen zu korrespondieren.

Was jedoch im privaten Umfeld so angenehm anmutet, gilt – noch? – nicht gleichermaßen für das professionelle Umfeld. Zumindest wird es heutzutage bisher eher nicht toleriert, wenn im Großraumbüro der Kollege nebenan permanent mit seinem Computer spricht, um seine Anweisungen durchzugeben – dies stößt noch zu sehr auf Irritationen, vergleichbar mit einem Sitznachbarn im Bus, der mit seinem Bekannten lautstark mobil telefoniert.

Weder schöner Traum noch ferne Zukunftsvision

Wenn Sie jetzt anhand dieser Detail-Informationen den Eindruck gewonnen haben sollten, die Entwicklung eines Bots sei sehr aufwändig und kompliziert, so stimmt das nur bedingt, denn mittlerweile gibt es dafür umfassende Hilfestellung. So hat beispielsweise Microsoft mit seinem Bot Framework eine für die sofortige Nutzbarkeit bereitstehende Rahmenhandlung geschaffen, mittels derer man einen einfachen Bot binnen weniger Minuten zum Laufen bringen kann.

Für die notwendigen KI-Funktionalitäten stehen fertig nutzbare sogenannte kognitive Services zur Verfügung, so beispielsweise die Applikation LUIS – Language Understanding Intelligent System – eine Applikation für die Interpretation der Anwenderwünsche anhand der eingegebenen Anweisungen, die ich ganz nach den umzusetzenden Funktionalitäten gestalten kann. Hier definiere ich die zu realisierenden Intentionen und hinterlege diese mit dazu passenden Redewendungen, auf die ich anschließend einen Machine Learning Algorithmus trainiere, so dass auch sinnverwandte Formulierungen verstanden werden.

So kann sich der Entwickler voll und ganz auf die Umsetzung der Kernfunktionalität konzentrieren, für die er aus einem reichhaltigen Fundus an kognitiven KI- und anderen Services schöpfen kann, während der Bot Connector Service als universelle Schnittstelle dafür Sorge trägt, dass der Bot ohne Änderung des Programms über zahlreiche bekannte Kanäle angesprochen werden kann – sei es via Facebook Messenger, Microsoft Teams, Skype und viele mehr;  selbst Cortana steht für eine Anbindung zur Verfügung.

Denn schlussendlich ist der Bot ja ein Anwendungsprogramm ohne eigene grafische Benutzeroberfläche, benötigt also immer noch ein weiteres Medium für den Dialog mit dem Anwender.

Flexible Anwendungen mit großem Potential

Sicherlich haben all die großen ERP-, CRM- und übrigen Datenbankanwendungen mit unternehmensweitem Charakter unverändert und auch künftig ihre Daseinsberechtigung. Die flexiblen und wendigen Chat- und Softbots jedoch bergen ein enormes Potential, all die Aufgaben zu lösen, für die es bis dato kein spezielles oder aber viele kleine Programme brauchte.

War es bislang nur höhergestellten Personen im Unternehmen oder im Privaten vergönnt, einen persönlichen Assistenten zur Hand zu haben, der all die kleinen lästigen Aufgaben erfüllte, so rückt die enorme Vielfalt jetzt schon verfügbarer kleiner und großer KI-basierter Funktionalitäten den intelligenten digitalen Assistenten in greifbare Nähe. Es sollte kein Wunschtraum in ferner Zukunft mehr sein, sondern mit den zur Verfügung gestellten Mitteln und cloudbasierten Betreiberservices direkt in die Tat umgesetzt werden können.

Best-Practice zum Anfassen

Mit MrQ bietet QUNIS eine Best-Practice-Lösung und macht damit die Funktionsweise eines Softbots bestehend aus dialogorientierter klassischer Anwendungsentwicklung, Artifical Intelligence (AI), Cloud und Machine Learning direkt erlebbar. Darüber hinaus bildet MrQ den Grundstock für die Entwicklung kundenspezifischer Prototypen und Softbots. MrQ nutzt das Microsoft Bot Framework und die Azure Cognitive Services, betrieben wird MrQ als Azure Managed Service.

Mehr von MrQ finden Sie unter www.mr-qunis.com, auf seiner Facebook-Seite oder in der QUNIS-App.

Bereit für Künstliche Intelligenz?

Erstellt am: Donnerstag, 14. Juni 2018 von Monika Düsterhöft

Wir alle kennen den Begriff Künstliche Intelligenz und haben über das Science-Fiction-Genre Bekanntschaft mit An droiden oder dem Supercomputer Deep Thought gemacht. Wir nutzen Internet-Suchmaschinen oder Sprachassistenten, und in den Medien wird täglich über Innovationen wie selbstfahrende Autos, intelligente meinungsbildende Algorithmen oder menschlich anmutende, sogar mit Gefühlen ausgestattete Pflege- und Service-Roboter berichtet. Veränderungen, die KI für unsere Lebens-, Geschäfts- und Arbeitswelt mit sich bringt, werden in der kompletten Bandbreite von Panik über Skepsis und Besorgnis bis hin zur totalen Faszination diskutiert. Und dass Daten sowie der intelligente Umgang damit die Basis dafür bilden, ist kein Geheimnis mehr.

In diesem Zusammenhang den Umsetzungstand von KI in den Unternehmen zu erfragen und dabei den Fokus auf die Gruppe der Controller zu legen, erschien uns als logisch und interessant. Denn gerade die Controller sind es, die sich schon lange mit dem Thema Datenauswertung beschäftigen und auf dem Weg der digitalen Transformation zum datengetriebenen Unternehmen viele entscheidende Stationen mitgestaltet haben. Sie sind es, die innovativen Schlüsseltechnologien und Verfahren der Datenanalyse aufgegriffen, weiterentwickelt und bis hin zur Etablierung als Standardtechnologie vorangetrieben haben. Waren BI, OLAP, Big Data und Advanced Analytics namentlich bis dato zwar eher im Umfeld der Unternehmenssteuerung anzutreffen, so sind sie nun Teil von Digitalisierungsinitiativen und Innovationsprojekten.

Gemeinsam mit der Controller Akademie haben wir von QUNIS eine Anwenderbefragung zur Organisation von Projekten mit Big Data und Advanced Analytics durchgeführt und sind zu folgenden Ergebnissen gelangt: Eine große Mehrheit der Unternehmen gaben an, dass Advanced Analytics bzw. KI-Methoden hoch strategische Themen sind und eine wichtige Rolle bei der digitalen Transformation spielen. Dabei setzen 44 Prozent mit Advanced Analytics noch primär auf interne Prozessverbesserungen. Genauso viele Unternehmen sehen diese Methoden jedoch als entscheidend für zukünftige Innovationen rund um ihre Produkte und Services. Trotz der bestehenden Unsicherheiten hinsichtlich der Umsetzung erklären die Unternehmen fast durchweg ihre hohe Investitionsbereitschaft.

Beim Thema Datenmanagement ist den meisten sehr wohl klar, dass die klassische BI-Architektur mit Data Warehouse (DWH) nur begrenzt für die neuen Anwendungsbereiche geeignet ist. Die Kombination vorhandener Daten, die oft in einem DWH organisiert sind, mit weiteren internen oder externen Datenquellen und -formaten, wird als eine der größten Herausforderungen genannt. Dazu gehört auch die offene Frage, wie sich eine flexible Datenarchitektur schaffen lässt, welche die bisherige BI- mit der Big-Data-Welt zusammenführt und somit auch Investitionen schützt. Für diese Verbindung hat sich das Data-Lake-Konzept in der Praxis als sehr tragfähige Lösung bewährt. Dieses kann den Auf- und Umbau hin zu agileren und offenen Architekturen unterstützen.

Aber auch organisatorisch müssen für das datengetriebene Unternehmen die richtigen Weichen gestellt werden. Ohne klare Definitionen der Datenhoheit mit Verantwortlichkeiten, die über Rollen wie Data Owner, Data Scientist oder Data Engineer im Rahmen einer Data Governance festgelegt sind, nutzt das beste Systemkonzept nichts.

Einig ist man sich zudem darüber, dass die Verantwortlichen über spezifische Skills verfügen müssen, die über bisherige Anforderungen im BI-Bereich hinausgehen. Falls das BI-Team sich um Advanced Analytics kümmern sollte, halten fast 60 Prozent der Befragten es für notwendig, dass hier zusätzliche Kompetenzen aufgebaut werden. Neben Spezialisten für statistisch-mathematische Methoden sind dabei auch Experten gefragt, die hochkomplexe Auswertungen in verständliche, businessrelevante Informationen übertragen.

Viele Unternehmen haben bereits gute Ideen, an welcher Stelle sie Advanced Analytics und KI-Methodik einsetzen könnten. Hinsichtlich der konkreten Umsetzung auf Basis praktikabler Use Cases tut man sich derzeit aber noch schwer. Hier sind Controller gefordert, ihre Erfahrung in der Datenanalyse einzubringen. Expertenhäuser wie QUNIS ergänzen und begleiten dies mit bereichsübergreifender, strategischer Fachkompetenz. Diese Kombination ist eine optimale Basis, um datengetriebene Geschäftsmodelle voranzubringen und neue Potenziale für das Unternehmen zu erschließen.

Alle Ergebnisse im Detail finden Sie hier KOMPLETTE STUDIE DOWNLOADEN

Trends bei Nutzung von Big Data 2018

Erstellt am: Dienstag, 6. März 2018 von Sascha

Nach Einschätzung der Marktforscher von IDC wird der weltweite Umsatz mit Software, Hardware und Services für Big Data und Big Data Analytics in den kommenden zwei Jahren auf 203 Milliarden US-Dollar steigen. Das jährlich zu den bereits vorhandenen Datenbergen hinzukommende Datenvolumen könnte laut der Auguren im Jahr 2025 bereits bei 180 Zetabyte liegen. Gewaltige Datenmengen und viele Chancen für Unternehmen, neue oder detailliertere Informationen zu extrahieren und für die Unternehmens- und Prozesssteuerung, Planung oder Produktentwicklung einzusetzen.

Prescriptive Analytics

Unter den vielen Aspekten, die im Zusammenhang mit der Nutzung von Big Data und Advanced Analytics diskutiert werden, finden sich einige Entwicklungen, die laut Marktbeobachtern in den kommenden zwölf Monaten besondere öffentliche Aufmerksamkeit erfahren werden.
So wird erwartet, dass das Interesse an Prescriptive Analytics steigt. Es vereint Verfahren des Machine Learning, Simulationen und mathematische Berechnungen, um bei einer bestimmten Fragestellung die optimale Lösung oder das beste Ergebnis unter verschiedenen zur Auswahl stehenden Möglichkeiten zu ermitteln. Praktisch werden also beispielsweise kontinuierlich und automatisch neue Daten verarbeitet, um die Genauigkeit von Vorhersagen zu erhöhen und bessere datengetriebene Entscheidungsoptionen zu bieten. Prescriptive Analytics könnte so neben Cognitive Computing den Mehrwert bei der Analyse von Big Data künftig erheblich steigern helfen.

ECM und Big Data

Big Data ist ein Sammelbegriff, der in der Praxis sowohl vorhandenen Daten, etwa aus einem Data Warehouse oder ERP-System, als auch neue Datenquellen einbezieht. Diese können dabei durchaus auch innerhalb der eigenen Unternehmensgrenzen liegen. So wird für 2018 erwartet, dass sich Organisationen mehr für historische Daten und Dokumente interessieren werden, die bislang nicht in einer digitalen Form vorliegen. In diesen können wichtige Informationen liegen, die zum Beispiel für Voraussagen hilfreich sein können. Damit zeichnet sich hier eine Entwicklung ab, die wir auch bei QUNIS sehen, nämlich der Annäherung und Kombination von Enterprise Content Management und Analyseumgebungen.

Datenqualität statt Datenquantität

Angesichts der wachsenden Datenberge ist es trotz sinkender Hardwarepreise, Cloud und Konzepten wie dem Data Lake auf Dauer nicht wirtschaftlich, schlicht alle erreichbaren Daten zu speichern. Unternehmen müssen sich daher in den kommenden Monaten strategisch damit beschäftigen, auf welche Datensätze sie es besonders abgesehen haben bzw. welche ihnen Ansätze für bessere Analysen bieten können. Ebenso wird es um Wege zur Verbesserung der Datenqualität gehen, denn Datensätze können irrelevant, ungenau oder gar beschädigt sein. Qualität statt Quantität, heißt also die Parole für 2018.

Machine Learing hilft beim Datenschutz

Herzstück einer Big-Data-Analyse sind Verfahren der Künstlichen Intelligenz. Diese müssen in 2018 verstärkt für Auswertungen im Bereich der Datensicherung und Datensicherheit zum Einsatz kommen, da auf diesem Anwendungsgebiet laut Marktbeobachtern Nachholbedarf herrscht. So werden Maschinen beispielsweise schon bald in der Lage sein, mit Hilfe von Machine Learning menschliches Verhalten „vorherzusagen“ und automatisiert „unlabeled data“ zu verwenden. Dadurch wird sich Künstliche Intelligenz zu einem zentralen Instrument für Datenschutz und Abwehr unerlaubter Zugriff entwickeln.

Neue Rollen und viele Stellenangebote

Aber nicht nur die Vielfalt und Nutzungsformen von Big Data werden sich in der nächsten Zeit weiterentwickeln, sondern auch die Menschen, die damit arbeiten. So entstehen neben dem viel zitierten Data Scientist weitere Rollen in den Organisationen, welche die Erfassung, Auswertung und Operationalisierung von Big Data überhaupt erst strukturiert möglich machen. Auch die QUNIS hat hierzu bereits im Rahmen ihrer Big Data Methodik ein modernes Rollenmodell entwickelt, das detailliert die Aufgaben und Kombinationen diskutieren und definieren hilft. Zugleich wächst im Markt die Sorge, dass sich nicht ausreichend Spezialisten für diese oft sehr anspruchsvollen Aufgaben und Rollen rund um Big Data finden lassen. So schätz beispielsweise IBM, dass allein in den USA das Stellenangebot für Big-Data-Experten im weitesten Sinne von 364.000 offenen Stellen in 2018 auf 2,72 Millionen bis 2020 ansteigen wird.

Keine Industrie 4.0 ohne Big Data und Künstliche Intelligenz

Erstellt am: Mittwoch, 14. Februar 2018 von Sascha

Mit der zunehmenden Praxis wächst auch die Zahl der Umfragen zu Industrie 4.0. So hat sich jetzt die Siemens Financial Services bei Herstellern und Beratungshäuser aus dem Bereich der Produktion und Wartung in elf Ländern umgehört, wo der Schuh drückt. Heraus kamen sechs Themenfelder, die Hersteller nach eigenen Aussagen aktuell angehen müssen:

  • Entwicklung der Kompetenzen und Kenntnisse von digitaler Technologie für einen erfolgreichen Übergang zu Industrie 4.0
  • Zugang zu Finanzierungen, die den erforderlichen Investitionszeitraum berücksichtigen
  • Aufbau einer Kooperationskultur, die notwendig ist, um gemeinsam am Erfolg in einer vernetzten Industrie-4.0-Welt zu arbeiten, ob im eigenen Unternehmen, in der Lieferkette oder branchenübergreifend (mehr zur Unternehmenskultur und Industrie 4.0 finden Sie hier)
  • Überwindung von Risiken bezüglich der Daten- und Internetsicherheit in einer Welt, in der sich große Mengen sensibler Daten durch das Internet bewegen
  • Umfassender Zugang zu einer ausreichenden Zahl an realen Beispielen für erfolgreiche digitale Transformation aus allen Fertigungssektoren
  • Spezialisierte strategische Managementkompetenzen zur Erarbeitung eines klaren Stufenplans, um Industrie 4.0 zu erreichen. Spezialisierte strategische Führungsqualität zur Entwicklung eines klaren, gestaffelten Plans, um Industrie 4.0 umzusetzen.

Laut der Autoren zeigen diese Aspekte, dass es mittlerweile nicht mehr darum geht, grundsätzlich die Notwendigkeit zur Digitalisierung und Automatisierung zu diskutieren. Vielmehr stehen mittlerweile praktische Fragen im Mittelpunkt, wie Organisation den Weg zur Industrie 4.0 schrittweise und mit Augenmaß gehen können – einschließlich laufender Qualitätskontrollen und RoI-Maßnahmen.

Es fehlt an Expertise für digitale Produkte und Künstliche Intelligenz

Von allen Themenfeldern wurde die „Entwicklung der Kompetenzen und Kenntnisse von digitaler Technologie für einen erfolgreichen Übergang zu Industrie 4.0“ als größte Herausforderung benannt. Es fehlt bis dato digitales Produktionswissen, welches es operativen Mitarbeitern ermöglicht, Maschinen- und Leistungsdaten auf ihren portablen Dashboards zu interpretieren und entsprechende Maßnahmen zu ergreifen. Ferner müssen „digitaler Wartungskompetenzen“ entstehen, wie es die Studienautoren nennen, also, dass Techniker auch das Know-how haben, um komplexe digitalisierte Betriebssysteme und Geräte instandzuhalten. Und schließlich bedarf es der Expertise für operative und strategische Analysen. Gemeint ist damit, dass man die Auswertung großer Datenmengen, die sich durch die enge Vernetzung von Maschinen, Anwendungen und Menschen künftig rasant erhöhen (Big Data) in den Griff bekommt. Diese Unmengen an Daten – einschließlich Produktionsdaten, Lieferkettendaten, Marktdaten und finanziellen Daten – erfassen und analysieren zu können, ist entscheidend um die eigene Wettbewerbsfähigkeit künftig zu erhalten bzw. zu verbessern.

Datenmanagement auf Industrie 4.0 vorbereiten

Voraussetzung dafür ist, dass Unternehmen zunächst ihr bisheriges Datenmanagement und ihre Dateninfrastruktur bewerten, ob und wie sich diese für die Erfassung und Analyse von Big Data weiterentwickeln lassen – ohne bisherige Investitionen deshalb gleich aufgeben zu müssen. Ebenso gehört zu Vorarbeiten eine Strategiediskussion sowie Auswahl von Use Cases. Schauen Sie sich einmal unsere Methodik für Big-Data-Umgebungen sowie unser Data Lake Konzept an, die unsere langjährige Projekterfahrung und Expertise auch in den neuen Technologien und Verfahren wie die der Künstlichen Intelligenz widerspiegeln!