Archiv für die Kategorie Advanced Analytics

CDS – der Citizen Data Scientist als Weg aus dem Analytics-Ressourcen-Engpass

Erstellt am: Montag, 18. März 2019 von Monika Düsterhöft

Für die Umsetzung von Advanced-Analytics-Vorhaben ist eine durchdachte Datenstrategie unverzichtbar. Sie regelt alle Fragen rund um die technische Systemintegration, die Data Governance und das unternehmensweite Data Quality Management (DQM).

Darüber hinaus gibt es neue fachliche Anforderungen und Aufgabenfelder wie die Definition komplexer Algorithmen für das Heben wirtschaftlicher Potenziale oder das Deployment der entstandenen Data-Science-Services. Der Data Scientist nimmt bei diesen Aufgaben eine der zentralen Schlüsselrollen ein. 

Neue Advanced-Analytics-Aufgaben benötigen Data Scientisten mit vielfältigen mathematischen, technischen und prozessualen Skills.

Mit seinem tiefen Einblick in die Fachbereiche formuliert der Data Scientist die Projektanforderungen, kümmert sich um die Themen Datenmanagement und Data Quality Management unter Beachtung der Data Governance und übernimmt die Definition von Datenmodellen und Algorithmen. Er hat tiefe mathematisch-statistische Kenntnisse, kann programmieren, kennt sich mit Datenschutz und sonstigen Compliance-Regeln aus und verfügt über umfangreiches Business-Know-how.

Kurzum, der Data Scientist ist ein Allrounder mit viel Spezialwissen und umfassender Erfahrung. Kein Wunder daher, dass diese Fachkräfte äußerst gefragt und ziemlich rar sind und dass viele Digitalisierungsvorhaben schlichtweg wegen dieser fehlenden Skills und Ressourcen stagnieren.

Arbeitsteilung, Tools und das Konzept des Citizen Data Scientist (CDS) kann Abhilfe aus dem Ressourcen-Dilemma schaffen.

Ein Ansatzpunkt ist die Entlastung des Data Scientists von Routinen im Datenmanagement. Speziell bei der Datenakquisition können technisch versierte Experten, die sogenannten Data Engineers, den Data Scientist gut unterstützen. Ein zweiter Ansatzpunkt, der sich derzeit am Markt für analytische Applikationen abzeichnet, ist die zunehmende Verlagerung von analytischem Know-how in die Systemwelt.

Etablierte BI-Anbieter beispielsweise erweitern ihr Portfolio um Datenvisualisierungstools, die Visual Analytics ohne Programmieraufwand unterstützen. Per Drag-and-drop können hier Datenströme hinzugefügt, verbunden und analysiert werden, und im Hintergrund laufen die neuesten Algorithmen für die fortgeschrittene Datenanalyse. Auch die Branche der AI-Spezialisten liefert unter der Bezeichnung „Augmented Analytics“ anwenderorientierte Werkzeuge, die Funktionen zur Automatisierung der Datenaufbereitung, Erkenntnisfindung und Datenanalyse enthalten.

Mithilfe solcher anwenderorientierten Frontends können geübte BI Power User, die ein mathematisch-statistisches Grundverständnis sowie Interesse an Analytics mitbringen, bestimmte Aufgabenfelder der Data Science übernehmen und so neben den Data Engineers ebenfalls ihren Teil dazu beitragen, das begehrte Skillset des Data Scientists zu erfüllen. Es kristallisiert sich ein neues Rollenbild heraus. Wir sprechen vom Citizen Data Scientist (CDS), der mit den richtigen Tools in der Lage ist, analytische Aufgaben auszuführen und auch selbst Modelle zu erstellen, die fortgeschrittene Analysen, Vorhersagen und präskriptive Funktionen enthalten.

Die Ausbildung von CDS ist ein aussichtsreicher Ansatzpunkt, um analytische Kompetenzen im Unternehmen aufzubauen.

Im Grunde kann jeder Fachanwender oder IT-Spezialist, der ein Grundverständnis für Datenarbeit sowie statistisches und mathematisches Know-how mitbringt, den Umgang mit Self-Service-Data-Science-Werkzeugen erlernen. Besonders geeignet sind BI Power User, die lernbereit und neugierig darauf sind, Data Science und vorhersagende Algorithmen für ihre Geschäftsprozesse zu erkunden.

Im Gegensatz zum klassischen BI-Anwender, der auf der Basis vorgefertigter Daten-Cubes arbeitet, bewegt sich der CDS dabei jedoch auch auf der Ebene der Rohdaten, um explorativ neue Erkenntnisse zu generieren. Weitere aussichtsreiche Kandidaten für Citizen Data Science sind Ingenieure mit Hintergrundwissen aus Mathematik, Statistik und Modellierung.

Die neuen Data-Science-Experten benötigen Rückendeckung und Unterstützung für ihr Tätigkeitsfeld.

Für ihre Aufgabenfelder bringen unternehmensintern ausgebildete CDS neben ihren analytischen Fähigkeiten auch ihr bereits vorhandenes Markt- und Branchen-Know-how sowie das Wissen um interne Prozessen in die Datenanalysen mit ein. Ein wesentlicher und nicht zu unterschätzender Vorteil. Sie brauchen aber auch Rückendeckung durch das Management sowie Unterstützung durch die interne IT.

CDS benötigen mehr Daten, zum Teil auch mehr ungefilterte Daten und sie brauchen IT-Umgebungen, in denen sie mithilfe aktueller Tools und Technologien experimentieren und Prototypen von Modellen und Applikationen bauen können. Zudem müssen sie den zeitlichen Freiraum für ihre Datenrecherchen erhalten.

Ein versierter Partner an der Seite, der neben der expliziten Data-Science-Expertise auch Erfahrung aus anderen Projekten mit einbringt und die neuen CDS auf ihrem Weg begleitet, ist eine weitere äußerst wertvolle Hilfe und ein wichtiger Baustein für den Erfolg einer Advanced-Analytics-Initiative.

Wenn die Rahmenbedingungen stimmen, können sich Unternehmen auf diese Weise pragmatisch wertvolle Personalressourcen aus den eigenen Reihen erschließen und richtig Schubkraft in ihre Digitalisierungsprojekte bringen.

Mein Tipp: Besuchen Sie das CA-Seminar – Deep Dive Advanced Analytics – Machine Learning in der Praxis mit „R“ – und lernen Sie das Tagesgeschäft eines Data Scientist besser kennen. Das Seminar wird von und mit QUNIS Experten durchgeführt und findet im Rahmen der Kooperation mit der CA Controller Akademie und des Ausbildungsprogramms zum Information Manager statt. Mehr zu allen CA-Seminaren finden Sie hier.

Data-Science-Services einfach und stabil bereitstellen mit dem AHUB Deployment Framework.

Data Science liebt Docker

Erstellt am: Freitag, 1. März 2019 von Monika Düsterhöft

Moderne Verfahren zur Datenanalyse dringen immer mehr in den Unternehmensalltag ein. Als Experte für das Erkennen von Strukturen in großen Datentöpfen und daraus abzuleitenden Vorhersagen spielt der Data Scientist eine bedeutende Rolle. Er leitet und begleitet die Entwicklung des Data-Science-Services von der Modellierung bis zur Bereitstellung an die Nutzer und hat es dabei typischerweise mit folgenden Herausforderungen zu tun:

Erstellung eines Modells in R oder Python inklusive einer REST API für webbasierte Aufrufe zum Modelltraining und Scoring

Im ersten Schritt, der explorativen Phase, befasst sich der Data Scientist mit dem Erstellen eines Modells mit Hilfe von Skripten. Diese trainieren das Modell mit historischen Daten und rufen Vorhersagen auf Basis neuer Datensätze ab. Die Umsetzung der Skripte erfolgt meist in Umgebungen wie R oder Python, die sich dank ihrer umfangreichen Bibliotheken aus dem Bereich der Statistik und des Machine Learning sowie einer sehr aktiven Entwickler-Community zum Quasi-Standard erhoben haben.

Für die Modell-Findung arbeitet der Data Scientist gerne in einer „Sandkasten-Umgebung“. Das kann eine virtuelle Maschine, ein lokaler Rechner oder auch ein Cloud-gehostetes „Notebook“ mit browserbasierter Entwicklungsumgebung sein. Das fertige Modell sollte über eine webbasierte Schnittstelle (REST-API) für andere Services ansprechbar sein. Hierfür haben sich die Bibliotheken Flask (Python) und Plumber (R) bewährt.

Definition der Code-Abhängigkeiten und Aufbau eines Images über Dockerfiles sowie Start der Container auf einem Cloud- oder On-Premise-Server

Ist ein Vorhersagemodell mit hoher Güte entstanden, gilt es dieses dem Nutzer zur Verfügung zu stellen. Wir sprechen vom Deployment des Data-Science-Services. Für diesen Zweck hat sich in den letzten Jahren die Docker-Container-Technologie als extrem flexibles und einfach handhabbares Werkzeug erwiesen. Denn Docker-Container lassen sich durch eine simple Konfigurationsdatei (das Dockerfile) in Minutenschnelle bauen und auf einem beliebigen System zur Ausführung bringen. Es gilt das große Docker-Versprechen: Wenn ein Container im Sandkasten läuft, lässt er sich auf jeder anderen Infrastruktur gleichermaßen betreiben.

Ein Container ist dabei ein gekapselter Prozess in dem sowohl der auszuführende Code, als auch alle dafür benötigten Abhängigkeiten (Laufzeitumgebung, Bibliotheken) untergebracht sind. Die Hardware-Ressourcen wie CPU und RAM werden dem Container vom Docker-Daemon, der auf dem Host-Betriebssystem läuft, zugewiesen. Container lassen sich so als ressourcenschonendere Variante einer dedizierten virtuellen Maschine sehen, da im Gegensatz zur VM nicht für jeden gekapselten Prozess ein eigenes Betriebssystem ausgeführt werden muss.

Fragestellungen rund um GUI, Sicherheit, Betrieb bedenken und lösen

Wer den Deployment-Prozess für einen Data-Science-Service einmal durchlaufen hat, wird feststellen, dass neben der reinen Data Science auch noch folgende Fragestellungen bedacht werden müssen:

  • Wie kann ein technisch weniger versierter Nutzer die Modellvorhersage abrufen? Welche GUI braucht er?
  • Wie kann der Zugriff auf das Modell nur berechtigten Personen erlaubt werden? Welche Sicherheitsthemen sind zu beachten?
  • Wie ist der fortdauernde Betrieb und die Nachvollziehbarkeit im Fehlerfall gewährleistet? Wie ist ein stabiler Betrieb und Governance möglich?

Da diese übergeordneten Fragestellungen bei jedem Deployment auftauchen, bietet es sich an, diese in standardisierter Form zu adressieren. Aus dieser Überlegung heraus ist bei QUNIS im Rahmen eines Forschungsprojektes das AHUB Deployment Framework entstanden.

Schnelle und stabile Bereitstellung mit Docker-basiertem Deployment-Framework

AHUB ist Docker-basiert und bietet eine orchestrierte Container-Landschaft aus standardisierten Modulen, die sich den obigen Fragestellungen annehmen. Mithilfe des Frameworks lassen sich beliebig viele analytische Teil-Applikationen mit minimalem Aufwand von der Sandbox-Umgebung in ein professionelles, produktives Setup und schlussendlich in einen stabilen Betrieb überführen.

Das ganze Framework ist als Open-Source-Projekt konzipiert. Der Quellcode und eine Demo-Applikation stehen über GitHub für jedermann zur Verfügung. Eine wirkliche Wohltat für jeden Data Scientisten. DIREKT ZU AHUB AUF GITHUB

Mehr zu AHUB erfahren.

Die Blockchain – ist das was oder kann das weg?

Erstellt am: Montag, 18. Februar 2019 von Monika Düsterhöft

Kryptowährungen sind nichts für mich, also warum sollte ich mich mit der Blockchain auseinandersetzen? So oder so ähnlich könnte man denken, wenn das Gespräch auf den mittlerweile nicht mehr gar so neuen Hype-Begriff kommt. Dass sich diese hochinteressante Technologie jedoch nicht nur für das Abbilden von Zahlungstransaktionen eignet, sondern auch anderen Anwendungsfällen eine solide und sehr sichere Plattform bieten kann, versteht man, wenn man sich mit dem Verfahren näher auseinandersetzt.

Wie funktioniert die Blockchain?

Rein technisch ist die Blockchain zunächst einmal eine Datenbank. Allerdings handelt es sich hier nicht um eine relationale Datenbank, wie wir sie vom SQL Server, Oracle, DB2 oder den vielen anderen namhaften Systemen kennen. Die Datenbank besteht vielmehr aus einer verketteten Liste von in Blöcken zusammengefassten Daten.


Verkettungen und Kopien machen die Blockchain einzigartig sicher

Die Verkettung definiert den Kern des Verfahrens

Diese Verkettung ist auch gleichzeitig das Spannende. Jeder der Blöcke „zeigt“ auf den jeweils vorigen Datenblock mittels eines sogenannten „Hashwertes“, der durch kryptografische Verschlüsselung jenes Vorgängerblocks mitsamt dessen Zeiger auf wiederum seinen Vorgängerblock entstanden ist.

Dieses Verfahren macht einen guten Teil dessen aus, was die Blockchain einzigartig und sicher macht: Würde man einzelne Daten innerhalb eines Blockes manipulieren, würde der Hashwert des Blockes damit verändert, was zur Folge hätte, dass man den nachfolgenden Block ebenfalls modifizieren müsste, sodann den nächstfolgenden, da auch dieser in Mitleidenschaft gezogen wäre, und so weiter und so fort.

Das Prinzip der Kopie sichert das Verfahren

Anders als in üblichen Systemen befindet sich die Blockchain-Datenbank nicht auf einem einzelnen zentralen Server, auf den die Teilnehmer des Netzwerkes zugreifen. Vielmehr verfügt jeder einzelne der teilnehmenden Rechner über eine vollständige Kopie der Blockchain. Durch vereinbarte Konsensregeln wird permanent überprüft, dass der Löwenanteil aller Teilnehmer das Gleiche gespeichert hat.

Ein betrügender Teilnehmer müsste also nicht nur seine eigene Kopie der Blockchain verändern, sondern dies insgesamt bei mehr als der Hälfte der Rechner tun, um seine Manipulation der Datenbank als die neue gültige Version durchbringen zu können. Dies jedoch ist wiederum durch das Verfahren selbst weitgehend ausgeschlossen.

Das Verfahren organisiert sich selbst

Jedes Mal, wenn ein Blockchain-Teilnehmer eine neue Transaktion, also einen neuen Datensatz meldet, schreiben alle beteiligten Rechner ihre Version der Blockchain eigenständig fort. Eine gewisse aufgelaufene Anzahl dieser neuen Datensätze wird sodann durch einen der teilnehmenden Rechner in einem neuen Block gebündelt, der dann wiederum mittels des Hashwert-Zeigers an die Kette angehängt wird.

Wer dieser Teilnehmer, der den neuen Block vorgibt, jeweils ist, wird durch einen vereinbarten Algorithmus, auch das Protokoll der Blockchain genannt, entschieden. Hierzu gibt es eine Vielzahl gängiger Methoden. Eine der bekanntesten nennt sich „Proof of Work“. Daneben gibt es aber auch den „Proof of Stake“ Algorithmus, „Proof of Authority“ und einige mehr.

Durch dieses Verfahren, das ein Beispiel der sogenannten Distributed Ledger Technologie darstellt, ist eine zentrale Instanz im Netzwerk überflüssig. Dies macht die Blockchain so spannend, denn damit ist es nunmehr erstmalig denkbar, dass es möglich sein könnte, auf zentralisierte Services wie zum Beispiel Banken zu verzichten, deren Servertechnologie und Programmen wir ja Stand heute quasi bedingungslos vertrauen müssen.

Kryptowährung, Smart Contracts, IoT – wo kommt die Blockchain zum Einsatz?

Am weitesten verbreitet und bekannt sind die sogenannten Kryptowährungen, also digitale Zahlungsmittel, deren Transaktionen auf einer Blockchain gespeichert werden. Bitcoin ist hierbei die älteste Währung, quasi die Mutter aller Blockchain-basierten Geldmittel.

Daneben ist Ethereum eine weitere sehr verbreitete Blockchain Technologie. Besonders bekannt geworden ist diese durch die Möglichkeit der Integration vollautomatischer dynamischer Verträge, sogenannter Smart Contracts.

Diese Programme, die ebenso unveränderlich und fälschungssicher wie alle übrigen Daten auf der Blockchain gespeichert sind und dort zur Ausführung kommen, eröffnen neue Möglichkeiten, die Blockchain im Unternehmensumfeld zu nutzen.

DAPPs für Versicherungen, Logistik, Hotellerie und mehr

Mit Smart Contracts ist es beispielsweise möglich, vertragliche Abkommen beliebiger Art vollautomatisch und unbestechlich zur Ausführung zu bringen, was ein enormes Potenzial an Möglichkeiten eröffnet, auch komplexe Prozesse auf sehr verlässliche Weise zu automatisieren. Man spricht hierbei auch von dezentralisierten Applikationen, sogenannten DAPPs.

So ist großes Automatisierungspotenzial beispielsweise bei Versicherungen denkbar – die Blockchain ermöglicht die verlässliche Sammlung aller Kundenzahlungen mit automatischer Auszahlung bei Eintritt eines im Smart Contract definierten Versicherungsfalls.
Ein weiteres großes Anwendungsfeld ist in der Logistik angesiedelt, lassen sich doch durch die Blockchain ganze Lieferketten mit allen Zwischenstationen zuverlässig dokumentieren.

Auch in IoT (Internet of Things)-Szenarien bieten Smart Contracts, neben der sich unter dem Namen IOTA etablierenden Blockchain, die sich durch eine ganz besonders hohe Transaktionsrate auszeichnet, hervorragende Optionen. So könnte beispielsweise ein Hotel enorme Einsparungen durch vollautomatische Services erzielen. Ein denkbares Szenario wäre: Bei Zahlung einer 24-Stunden-Gebühr werden für den Hotelgast Licht, Wasser sowie Strom aktiviert und das Türschloss automatisch geöffnet – was Schlüsselkarten oder ähnliches überflüssig macht.

Es ist noch nicht alles gedacht!

Bei all diesen vielen Möglichkeiten besteht zum aktuellen Zeitpunkt neben dem großen Hype um das Thema Blockchain noch einige Unsicherheit, was die Zukunft dieser Technologie betrifft. In einigen Aspekten gibt es auch noch Entwicklungsbedarf, um bestehende Schwachstellen zu beseitigen.

Dennoch lassen die Vielzahl der bereits umgesetzten Anwendungsfälle und die Möglichkeiten, die die Technologie in sich birgt, erahnen, dass das System Blockchain von dauerhaftem Bestand sein wird. Auch in der BI und Analytics tun sich spannende Einsatzfelder wie Echtzeitanalyse zur Anomalie- oder Betrugserkennung, eine Überwachung von Lieferketten oder einer Rückverfolgung von Produkten auf, die wir weiterverfolgen werden.

In Summe lässt sich also festhalten: Blockchain ist zwar nicht von Beuys, man sollte sie aber trotzdem nicht entsorgen. Vielmehr sollte man wachsam sein und bei Szenarien und Initiativen, bei denen es um sichere, nachvollziehbare Datenströme geht, immer auch mal ein Auge auf die Technologien und Plattformen der Blockchain werfen und untersuchen, wo sich ein Einsatz ausprobieren ließe oder gar lohnen könnte.

Vielleicht wollen Sie ja ein Vorreiter sein?

Sprechen Sie mit uns, wir bringen gerne unsere Erfahrung und Know-how mit ein KONTAKT

Datenqualität in BI und Big Data – wo liegt der Unterschied und wie funktioniert es zusammen?

Erstellt am: Freitag, 4. Januar 2019 von Monika Düsterhöft

In einer klassischen BI-Umgebung lagern typischerweise strukturierte Daten aus internen Vorsystemen wie Enterprise Resource Planning (ERP), Customer Relationship Management (CRM) oder der Buchhaltung. Für die Qualitätssicherung gibt es Best Practices und erprobte Technologien – man weiß genau, wie und wo man bei der Optimierung ansetzen kann, wenn der Bedarf da ist.

Unklar ist hingegen die Qualitätssicherung bei den für Predictive Analytics nötigen Big-Data-Quellen. Nutzen und Wertschöpfung der anvisierten Vorhersagemodelle hängt auch hier maßgeblich von der Qualität der zugrundeliegenden Daten ab. Systemarchitekten diskutieren nun, wie sie die Qualität von riesigen semi- und polystrukturierten Daten bewerten und sichern, welche Systemarchitekturen dabei ins Spiel kommen und wie das Datenmanagement funktioniert.

Das Data Warehouse bleibt der Single Point of Truth

Das klassische Data Warehouse hat als Kern einer typischen BI-Umgebung auch in der Welt der fortgeschrittenen Analysen seine Daseinsberechtigung. Es ist die beste Grundlage für standardisierte Berichts- und Analyseprozesse mit den unverzichtbaren Finanz- und Steuerungskennzahlen. Geht es um vorausschauende Unternehmenssteuerung, so sind diese Berichtsstandards um Trendanalysen und Prognosen aus der Big-Data-Welt zu ergänzen. In der Praxis erweist sich der sogenannte Data Lake als pragmatischer Implementierungsansatz, um hochstrukturierte Daten aus Transaktionssystemen und wenig strukturierte Big Data zusammenzuführen.

Ausgehend von der bewährten BI-Architektur mit offenen Schnittstellen lassen sich damit Big-Data-Komponenten in eine vorhandene Informationsplattform integrieren. Wichtig dabei ist, dass das zentrale Data Warehouse seinen Anspruch als Single Point of Truth im Unternehmen behält. Will man das Datenmanagement und die Qualität der Datenbasis für Advanced Analytics optimieren, ist es daher eine gute Idee, mit dem meist vorhandenen Data Warehouse zu starten.

Wie die Projektpraxis zeigt, besteht hier nämlich oft noch Handlungsbedarf. Abgesehen von Qualitätsmängeln und inkonsistenten Datenstrukturen wird mit dem Trend zu Self-Service-BI auch das bekannte Problem von Insellösungen und Datensilos wieder akut, das früher durch diverse Excel-Lösungen der Fachabteilungen verursacht wurde. Self-Service im Fachbereich ist praktisch und hat seine Berechtigung, aber das zentrale Business Intelligence Competence Center oder der BI-Verantwortliche müssen die Datenströme unter Kontrolle halten und darauf achten, dass der Single Point of Truth nicht ausgehebelt wird.

Data Warehouse Automation sichert die Datenqualität

Sind die Datenströme gut modelliert, bestehen große Chancen für eine dauerhaft hohe Datenqualität im BI-System. Durchweg strukturierte Daten von der operativen bis zur dispositiven Ebene, standardisierte Auswertungsverfahren und mächtige ETL-Werkzeuge (Extraktion, Transformation, Laden) mit integrierten Prüffunktionen ermöglichen eine hohe Automatisierung der Datenauswertung.

Für den effizienten Aufbau, die Anpassung und die Optimierung von Data Warehouses gibt es inzwischen ausgereifte Verfahren, die Standardisierung und Automatisierung erhöhen und damit die Fehlerrisiken auf ein Minimum senken. Diese Data Warehouse Automation beruht auf Frameworks, die bereits Best Practices für ETL nach etablierten Verfahren sowie Prüflogiken zur Sicherung der Datenqualität enthalten beziehungsweise deren Modellierung auf Meta-Ebene unterstützen. Neben einer effizienten Entwicklung und Administration vermeidet dieser lösungsorientierte Ansatz Konstruktionsfehler und sorgt dafür, dass für eine saubere Datenverarbeitung Best Practices zum Einsatz kommen.

Da Business Intelligence die Business-Realität möglichst genau abbilden will, ist ein hohe Datenqualität unverzichtbar. Klassische Kriterien wie Exaktheit und Vollständigkeit sind dabei zentrale Anforderungen. Schon ein Datenfehler oder eine Lücke im operativen Bestand kann das Ergebnis einer aggregierten Kennzahl verfälschen. Im Rahmen des internen und externen Berichtswesens stehen damit schnell falsche Entscheidungen oder Compliance-Verstöße im Raum.

Bei Big Data steuert der Business Case die Governance

In der Big-Data-Welt gestaltet sich die Datenqualität anders. Hier geht es zunächst darum, die relevanten Datenquellen zu bestimmen, die Daten abzuholen und zu speichern. Das ist nicht immer trivial angesichts einer Bandbreite von Daten aus dem Internet of Things, unstrukturierten Informationen aus Blogs und Social Networks, Sensordaten aus Kassensystemen und Produktionsanlagen, Messdaten aus Leitungsnetzen bis zu Datensätzen aus Navigationssystemen.

Im Gegensatz zur BI-Welt bestehen hier für die interne Datenarbeit keine allgemeingültigen Geschäftsregeln und Standards. Da es um die statistische Auswertung von Massendaten geht, sind die BI-typischen Qualitätskriterien Vollständigkeit und Exaktheit weniger wichtig. Im Rahmen der statistischen Verfahren fallen einzelne Fehler und Lücken nicht ins Gewicht, und Ausreißer lassen sich regelbasiert eliminieren. Wie groß die kritische Masse für belastbare Ergebnisse ist, wie genau, vollständig oder aktuell die Datenbasis sein muss und in welcher Form Informationen nutzbar gemacht werden, das ist für Big-Data-Analysen fallbezogen zu klären.

Die Vielfalt der Einsatzbereiche und damit die Rahmenbedingungen für die Bewertung und Bearbeitung von Daten sind nahezu unbegrenzt. Geht es etwa beim Internet of Things um die grobe Ressourcenplanung von Wartungsarbeiten für angebundene Geräte, sind Ausfälle einzelner Geräte-Meldesysteme irrelevant, da die Ermittlung von Peaks ausreicht. Im Rahmen von Predictive Maintenance ist dagegen jede konkrete Ausfallmeldung eines Gerätes wichtig. Für Kundenzufriedenheitsindizes auf Basis von Weblog-Analysen kommt es nicht auf jeden Beitrag an. Vielmehr geht es darum, Trends abzuleiten und diese in sinnvoll definierte Kennzahlen zu überführen.

Bei Big-Data-Anwendungen fallen also Datenqualitätsmanagement und Governance ebenso individuell aus wie das Analyseszenario des jeweiligen Business Case. In hoch automatisierten Anwendungen wie Autonomes Fahren oder Predictive Maintanance, in denen ausschließlich Maschinen über die Ergebnisse und Auswirkungen von Datenanalyen entscheiden, ist die Data Governance besonders wichtig. Die Quellen von Big Data liegen häufig außerhalb des Einflussbereichs der internen Prozesse: Maschinen-Output, Nutzereingaben oder Internet-Datenströme lassen sich nicht über interne organisatorische Maßnahmen kontrollieren. Bei permanent fließenden, unstrukturierten Datenquellen wie Chatforen greifen auch die klassischen ETL-Methoden nicht, und Störungen wie etwa eine Leitungsunterbrechung können nicht durch Wiederholung oder das Wiederherstellen des Datenbestands ausgeglichen werden.

Eine profunde Konzeption sichert den Projekterfolg

Das Potenzial von Predictive Analytics ist riesig, und viele Unternehmen erschließen sich gerade neue Dimensionen der Informationsgewinnung. Durch Cloud-Betriebsmodelle lassen sich neue Anwendungen schnell und kosteneffizient umsetzen. Voraussetzung dafür ist eine profunde Konzeption, die den kompletten Wertschöpfungsprozess der Daten mit Blick auf ein präzise formuliertes Projektziel abdeckt. Für ein erfolgreiches Projekt müssen anspruchsvolle Fragen der Fachlichkeit, Technik und Organisation geklärt werden. Hier empfiehlt es sich, die Erfahrung eines ganzheitlich orientierten Beratungsunternehmens hinzuzuziehen, um sich zeitraubende Umwege und schmerzhafte Lernzyklen zu ersparen.

Mehr zum QUNIS Data Lake Konzept erfahren.

Softbots als nächste Evolutionsstufe in der Anwendungsentwicklung

Erstellt am: Freitag, 24. August 2018 von Malte Hoffmann

Ein Chat- oder noch besser Softbot – je nachdem, wie leistungsfähig sein Kernprogramm ist – sehe ich als beste Idee einer möglichen Weiterentwicklung des klassischen Anwendungsprogramms, die mir seit langem begegnet ist. Nennen wir diese Konstruktion im Nachfolgenden einfach Bot, um die Sache nicht unnötig zu verkomplizieren.

Digitaler bester Freund, Kollege und Ratgeber

Ein Bot kann so vieles sein – schlichte Frage-/Antwortmaschine, leicht und effizient bedienbarer FAQ-Service, umfassendes und weltumspannendes Auskunftsbüro, unbürokratisches, sympathisches Helferlein bei der Datenerfassung oder effizientes Hilfsinstrument bei Recherchearbeiten. Der Einsatz geht bis hin zum digitalen intelligenten Assistenten, der on Demand entweder BI-Analysen interaktiv durchführt oder hochkomplexe KI-Algorithmen zur Ausführung bringt oder mir ganz schlicht über einen Internetservice eine Pizza bestellt, wenn mich der kleine Hunger packt.

Die möglichen Anwendungsfälle sind von unbegrenzter Mannigfaltigkeit. Vor allem aber ist ein Bot ein treuer, intelligenter – und wenn der Entwickler sich ein wenig Mühe mit dem Charakter gibt auch recht liebenswürdiger – vor allem aber nimmermüder hilfreicher Geselle, der mich, sei es privat oder auch und ganz explizit geschäftlich, angenehm und effizient unterstützend durch meinen Tag begleiten kann.

Funktion und Technik kurz erklärt

Um zu verstehen, wie so ein Bot technisch funktioniert, befassen wir uns am besten mit den Komponenten, aus denen er besteht.

Da haben wir zum einen die Schnittstellen zu seiner Umwelt – in der Grafik links und rechts außen dargestellt. Hier sitzt der Mensch, der mit dem Bot in Interaktion tritt und zwar üblicherweise mittels Text – also Tippen – oder Sprache – also verbal.

Kommt die Sprachsteuerung zum Einsatz, braucht es dafür auf beiden Seiten jedenfalls die dafür vorgesehenen Künstliche-Intelligenz (KI)-Bausteine – zum einen für die automatische Spracherkennung, also die Umwandlung des gesprochenen Wortes in maschinenlesbaren Text – und  zum anderen für die Sprachsynthese, also die Umwandlung des textbasierten Maschinenoutputs in eine künstliche Sprechstimme.

Beide Verfahren basieren heutzutage immer mehr auf Deep Learning Methoden, die einen sehr positiven Einfluss auf die Qualität des Ergebnisses haben – auf der einen Seite die Minimierung der Fehlerrate bei der Spracherkennung, auf der anderen Seite die Verbesserung der Natürlichkeit der Sprachmelodie.

Die Interpretation des Gesagten

Nachdem nun also die Benutzereingabe in maschinenlesbarer Form vorliegt, folgt oftmals als optionale Komponente ein weiterer KI-Baustein, der auf den ersten Blick eventuell gar nicht weiter als solcher auffällt, aber dennoch eine sehr essentielle Funktionalität darstellt. Ich spreche hier von der Notwendigkeit der Interpretation des Gesagten, also der Feststellung des besonderen Wunsches, der Intention des Anwenders.

Wie Sie vielleicht schon selbst beim Chatten mit einem Bot bemerkt haben, können Sie in mehr oder weniger ganzen, auch umgangssprachlichen Sätzen mit ihm kommunizieren. Weder ist es nötig, sich bestimmte Sprachbefehle zu merken oder aber verabredete Wortlaute zu verwenden; selbst kleine Tippfehler werden großzügig toleriert.

Wie funktioniert das? Nun, hier kommt eine weitere Disziplin der KI zum Einsatz, das Natural Language Processing (NLP). Es übernimmt die Interpretation des Anwenderwunsches.

Zu guter Letzt, sozusagen im Zentrum des Geschehens befindet sich dann das Kernprogramm. Hier passiert quasi die Fleißarbeit, alle Programmschritte, die für die Erfüllung des Anwenderwunsches vollzogen werden müssen. Und da befinden wir uns in der traditionellen, wenngleich auch sehr stark dialogorientierten Anwendungsentwicklung, die aber auch hier ganz stark über den Einbezug von weiteren, individuellen KI-Komponenten intelligent gemacht werden kann.

Ein Wort noch zur Sprachsteuerung

Diejenigen Bots, die Stand heute vorrangig durch direkte Ansprache funktionieren, sind beispielsweise Alexa von Amazon, Google Home, Siri von Apple oder Cortana von Microsoft, um jetzt nur ein paar bekannte Vertreter zu nennen. Wir haben uns mittlerweile mit dem permanenten Lauschangriff seitens dieser treuen Gefährten arrangiert, ist es doch zu bequem, auf diese Weise mit den gewünschten Funktionen zu korrespondieren.

Was jedoch im privaten Umfeld so angenehm anmutet, gilt – noch? – nicht gleichermaßen für das professionelle Umfeld. Zumindest wird es heutzutage bisher eher nicht toleriert, wenn im Großraumbüro der Kollege nebenan permanent mit seinem Computer spricht, um seine Anweisungen durchzugeben – dies stößt noch zu sehr auf Irritationen, vergleichbar mit einem Sitznachbarn im Bus, der mit seinem Bekannten lautstark mobil telefoniert.

Weder schöner Traum noch ferne Zukunftsvision

Wenn Sie jetzt anhand dieser Detail-Informationen den Eindruck gewonnen haben sollten, die Entwicklung eines Bots sei sehr aufwändig und kompliziert, so stimmt das nur bedingt, denn mittlerweile gibt es dafür umfassende Hilfestellung. So hat beispielsweise Microsoft mit seinem Bot Framework eine für die sofortige Nutzbarkeit bereitstehende Rahmenhandlung geschaffen, mittels derer man einen einfachen Bot binnen weniger Minuten zum Laufen bringen kann.

Für die notwendigen KI-Funktionalitäten stehen fertig nutzbare sogenannte kognitive Services zur Verfügung, so beispielsweise die Applikation LUIS – Language Understanding Intelligent System – eine Applikation für die Interpretation der Anwenderwünsche anhand der eingegebenen Anweisungen, die ich ganz nach den umzusetzenden Funktionalitäten gestalten kann. Hier definiere ich die zu realisierenden Intentionen und hinterlege diese mit dazu passenden Redewendungen, auf die ich anschließend einen Machine Learning Algorithmus trainiere, so dass auch sinnverwandte Formulierungen verstanden werden.

So kann sich der Entwickler voll und ganz auf die Umsetzung der Kernfunktionalität konzentrieren, für die er aus einem reichhaltigen Fundus an kognitiven KI- und anderen Services schöpfen kann, während der Bot Connector Service als universelle Schnittstelle dafür Sorge trägt, dass der Bot ohne Änderung des Programms über zahlreiche bekannte Kanäle angesprochen werden kann – sei es via Facebook Messenger, Microsoft Teams, Skype und viele mehr;  selbst Cortana steht für eine Anbindung zur Verfügung.

Denn schlussendlich ist der Bot ja ein Anwendungsprogramm ohne eigene grafische Benutzeroberfläche, benötigt also immer noch ein weiteres Medium für den Dialog mit dem Anwender.

Flexible Anwendungen mit großem Potential

Sicherlich haben all die großen ERP-, CRM- und übrigen Datenbankanwendungen mit unternehmensweitem Charakter unverändert und auch künftig ihre Daseinsberechtigung. Die flexiblen und wendigen Chat- und Softbots jedoch bergen ein enormes Potential, all die Aufgaben zu lösen, für die es bis dato kein spezielles oder aber viele kleine Programme brauchte.

War es bislang nur höhergestellten Personen im Unternehmen oder im Privaten vergönnt, einen persönlichen Assistenten zur Hand zu haben, der all die kleinen lästigen Aufgaben erfüllte, so rückt die enorme Vielfalt jetzt schon verfügbarer kleiner und großer KI-basierter Funktionalitäten den intelligenten digitalen Assistenten in greifbare Nähe. Es sollte kein Wunschtraum in ferner Zukunft mehr sein, sondern mit den zur Verfügung gestellten Mitteln und cloudbasierten Betreiberservices direkt in die Tat umgesetzt werden können.

Best-Practice zum Anfassen

Mit MrQ bietet QUNIS eine Best-Practice-Lösung und macht damit die Funktionsweise eines Softbots bestehend aus dialogorientierter klassischer Anwendungsentwicklung, Artifical Intelligence (AI), Cloud und Machine Learning direkt erlebbar. Darüber hinaus bildet MrQ den Grundstock für die Entwicklung kundenspezifischer Prototypen und Softbots. MrQ nutzt das Microsoft Bot Framework und die Azure Cognitive Services, betrieben wird MrQ als Azure Managed Service.

Mehr von MrQ finden Sie unter www.mr-qunis.com, auf seiner Facebook-Seite oder in der QUNIS-App.

Bereit für Künstliche Intelligenz?

Erstellt am: Donnerstag, 14. Juni 2018 von Monika Düsterhöft

Wir alle kennen den Begriff Künstliche Intelligenz und haben über das Science-Fiction-Genre Bekanntschaft mit An droiden oder dem Supercomputer Deep Thought gemacht. Wir nutzen Internet-Suchmaschinen oder Sprachassistenten, und in den Medien wird täglich über Innovationen wie selbstfahrende Autos, intelligente meinungsbildende Algorithmen oder menschlich anmutende, sogar mit Gefühlen ausgestattete Pflege- und Service-Roboter berichtet. Veränderungen, die KI für unsere Lebens-, Geschäfts- und Arbeitswelt mit sich bringt, werden in der kompletten Bandbreite von Panik über Skepsis und Besorgnis bis hin zur totalen Faszination diskutiert. Und dass Daten sowie der intelligente Umgang damit die Basis dafür bilden, ist kein Geheimnis mehr.

In diesem Zusammenhang den Umsetzungstand von KI in den Unternehmen zu erfragen und dabei den Fokus auf die Gruppe der Controller zu legen, erschien uns als logisch und interessant. Denn gerade die Controller sind es, die sich schon lange mit dem Thema Datenauswertung beschäftigen und auf dem Weg der digitalen Transformation zum datengetriebenen Unternehmen viele entscheidende Stationen mitgestaltet haben. Sie sind es, die innovativen Schlüsseltechnologien und Verfahren der Datenanalyse aufgegriffen, weiterentwickelt und bis hin zur Etablierung als Standardtechnologie vorangetrieben haben. Waren BI, OLAP, Big Data und Advanced Analytics namentlich bis dato zwar eher im Umfeld der Unternehmenssteuerung anzutreffen, so sind sie nun Teil von Digitalisierungsinitiativen und Innovationsprojekten.

Gemeinsam mit der Controller Akademie haben wir von QUNIS eine Anwenderbefragung zur Organisation von Projekten mit Big Data und Advanced Analytics durchgeführt und sind zu folgenden Ergebnissen gelangt: Eine große Mehrheit der Unternehmen gaben an, dass Advanced Analytics bzw. KI-Methoden hoch strategische Themen sind und eine wichtige Rolle bei der digitalen Transformation spielen. Dabei setzen 44 Prozent mit Advanced Analytics noch primär auf interne Prozessverbesserungen. Genauso viele Unternehmen sehen diese Methoden jedoch als entscheidend für zukünftige Innovationen rund um ihre Produkte und Services. Trotz der bestehenden Unsicherheiten hinsichtlich der Umsetzung erklären die Unternehmen fast durchweg ihre hohe Investitionsbereitschaft.

Beim Thema Datenmanagement ist den meisten sehr wohl klar, dass die klassische BI-Architektur mit Data Warehouse (DWH) nur begrenzt für die neuen Anwendungsbereiche geeignet ist. Die Kombination vorhandener Daten, die oft in einem DWH organisiert sind, mit weiteren internen oder externen Datenquellen und -formaten, wird als eine der größten Herausforderungen genannt. Dazu gehört auch die offene Frage, wie sich eine flexible Datenarchitektur schaffen lässt, welche die bisherige BI- mit der Big-Data-Welt zusammenführt und somit auch Investitionen schützt. Für diese Verbindung hat sich das Data-Lake-Konzept in der Praxis als sehr tragfähige Lösung bewährt. Dieses kann den Auf- und Umbau hin zu agileren und offenen Architekturen unterstützen.

Aber auch organisatorisch müssen für das datengetriebene Unternehmen die richtigen Weichen gestellt werden. Ohne klare Definitionen der Datenhoheit mit Verantwortlichkeiten, die über Rollen wie Data Owner, Data Scientist oder Data Engineer im Rahmen einer Data Governance festgelegt sind, nutzt das beste Systemkonzept nichts.

Einig ist man sich zudem darüber, dass die Verantwortlichen über spezifische Skills verfügen müssen, die über bisherige Anforderungen im BI-Bereich hinausgehen. Falls das BI-Team sich um Advanced Analytics kümmern sollte, halten fast 60 Prozent der Befragten es für notwendig, dass hier zusätzliche Kompetenzen aufgebaut werden. Neben Spezialisten für statistisch-mathematische Methoden sind dabei auch Experten gefragt, die hochkomplexe Auswertungen in verständliche, businessrelevante Informationen übertragen.

Viele Unternehmen haben bereits gute Ideen, an welcher Stelle sie Advanced Analytics und KI-Methodik einsetzen könnten. Hinsichtlich der konkreten Umsetzung auf Basis praktikabler Use Cases tut man sich derzeit aber noch schwer. Hier sind Controller gefordert, ihre Erfahrung in der Datenanalyse einzubringen. Expertenhäuser wie QUNIS ergänzen und begleiten dies mit bereichsübergreifender, strategischer Fachkompetenz. Diese Kombination ist eine optimale Basis, um datengetriebene Geschäftsmodelle voranzubringen und neue Potenziale für das Unternehmen zu erschließen.

Alle Ergebnisse im Detail finden Sie hier KOMPLETTE STUDIE DOWNLOADEN

Trends bei Nutzung von Big Data 2018

Erstellt am: Dienstag, 6. März 2018 von Sascha

Nach Einschätzung der Marktforscher von IDC wird der weltweite Umsatz mit Software, Hardware und Services für Big Data und Big Data Analytics in den kommenden zwei Jahren auf 203 Milliarden US-Dollar steigen. Das jährlich zu den bereits vorhandenen Datenbergen hinzukommende Datenvolumen könnte laut der Auguren im Jahr 2025 bereits bei 180 Zetabyte liegen. Gewaltige Datenmengen und viele Chancen für Unternehmen, neue oder detailliertere Informationen zu extrahieren und für die Unternehmens- und Prozesssteuerung, Planung oder Produktentwicklung einzusetzen.

Prescriptive Analytics

Unter den vielen Aspekten, die im Zusammenhang mit der Nutzung von Big Data und Advanced Analytics diskutiert werden, finden sich einige Entwicklungen, die laut Marktbeobachtern in den kommenden zwölf Monaten besondere öffentliche Aufmerksamkeit erfahren werden.
So wird erwartet, dass das Interesse an Prescriptive Analytics steigt. Es vereint Verfahren des Machine Learning, Simulationen und mathematische Berechnungen, um bei einer bestimmten Fragestellung die optimale Lösung oder das beste Ergebnis unter verschiedenen zur Auswahl stehenden Möglichkeiten zu ermitteln. Praktisch werden also beispielsweise kontinuierlich und automatisch neue Daten verarbeitet, um die Genauigkeit von Vorhersagen zu erhöhen und bessere datengetriebene Entscheidungsoptionen zu bieten. Prescriptive Analytics könnte so neben Cognitive Computing den Mehrwert bei der Analyse von Big Data künftig erheblich steigern helfen.

ECM und Big Data

Big Data ist ein Sammelbegriff, der in der Praxis sowohl vorhandenen Daten, etwa aus einem Data Warehouse oder ERP-System, als auch neue Datenquellen einbezieht. Diese können dabei durchaus auch innerhalb der eigenen Unternehmensgrenzen liegen. So wird für 2018 erwartet, dass sich Organisationen mehr für historische Daten und Dokumente interessieren werden, die bislang nicht in einer digitalen Form vorliegen. In diesen können wichtige Informationen liegen, die zum Beispiel für Voraussagen hilfreich sein können. Damit zeichnet sich hier eine Entwicklung ab, die wir auch bei QUNIS sehen, nämlich der Annäherung und Kombination von Enterprise Content Management und Analyseumgebungen.

Datenqualität statt Datenquantität

Angesichts der wachsenden Datenberge ist es trotz sinkender Hardwarepreise, Cloud und Konzepten wie dem Data Lake auf Dauer nicht wirtschaftlich, schlicht alle erreichbaren Daten zu speichern. Unternehmen müssen sich daher in den kommenden Monaten strategisch damit beschäftigen, auf welche Datensätze sie es besonders abgesehen haben bzw. welche ihnen Ansätze für bessere Analysen bieten können. Ebenso wird es um Wege zur Verbesserung der Datenqualität gehen, denn Datensätze können irrelevant, ungenau oder gar beschädigt sein. Qualität statt Quantität, heißt also die Parole für 2018.

Machine Learing hilft beim Datenschutz

Herzstück einer Big-Data-Analyse sind Verfahren der Künstlichen Intelligenz. Diese müssen in 2018 verstärkt für Auswertungen im Bereich der Datensicherung und Datensicherheit zum Einsatz kommen, da auf diesem Anwendungsgebiet laut Marktbeobachtern Nachholbedarf herrscht. So werden Maschinen beispielsweise schon bald in der Lage sein, mit Hilfe von Machine Learning menschliches Verhalten „vorherzusagen“ und automatisiert „unlabeled data“ zu verwenden. Dadurch wird sich Künstliche Intelligenz zu einem zentralen Instrument für Datenschutz und Abwehr unerlaubter Zugriff entwickeln.

Neue Rollen und viele Stellenangebote

Aber nicht nur die Vielfalt und Nutzungsformen von Big Data werden sich in der nächsten Zeit weiterentwickeln, sondern auch die Menschen, die damit arbeiten. So entstehen neben dem viel zitierten Data Scientist weitere Rollen in den Organisationen, welche die Erfassung, Auswertung und Operationalisierung von Big Data überhaupt erst strukturiert möglich machen. Auch die QUNIS hat hierzu bereits im Rahmen ihrer Big Data Methodik ein modernes Rollenmodell entwickelt, das detailliert die Aufgaben und Kombinationen diskutieren und definieren hilft. Zugleich wächst im Markt die Sorge, dass sich nicht ausreichend Spezialisten für diese oft sehr anspruchsvollen Aufgaben und Rollen rund um Big Data finden lassen. So schätz beispielsweise IBM, dass allein in den USA das Stellenangebot für Big-Data-Experten im weitesten Sinne von 364.000 offenen Stellen in 2018 auf 2,72 Millionen bis 2020 ansteigen wird.

Keine Industrie 4.0 ohne Big Data und Künstliche Intelligenz

Erstellt am: Mittwoch, 14. Februar 2018 von Sascha

Mit der zunehmenden Praxis wächst auch die Zahl der Umfragen zu Industrie 4.0. So hat sich jetzt die Siemens Financial Services bei Herstellern und Beratungshäuser aus dem Bereich der Produktion und Wartung in elf Ländern umgehört, wo der Schuh drückt. Heraus kamen sechs Themenfelder, die Hersteller nach eigenen Aussagen aktuell angehen müssen:

  • Entwicklung der Kompetenzen und Kenntnisse von digitaler Technologie für einen erfolgreichen Übergang zu Industrie 4.0
  • Zugang zu Finanzierungen, die den erforderlichen Investitionszeitraum berücksichtigen
  • Aufbau einer Kooperationskultur, die notwendig ist, um gemeinsam am Erfolg in einer vernetzten Industrie-4.0-Welt zu arbeiten, ob im eigenen Unternehmen, in der Lieferkette oder branchenübergreifend (mehr zur Unternehmenskultur und Industrie 4.0 finden Sie hier)
  • Überwindung von Risiken bezüglich der Daten- und Internetsicherheit in einer Welt, in der sich große Mengen sensibler Daten durch das Internet bewegen
  • Umfassender Zugang zu einer ausreichenden Zahl an realen Beispielen für erfolgreiche digitale Transformation aus allen Fertigungssektoren
  • Spezialisierte strategische Managementkompetenzen zur Erarbeitung eines klaren Stufenplans, um Industrie 4.0 zu erreichen. Spezialisierte strategische Führungsqualität zur Entwicklung eines klaren, gestaffelten Plans, um Industrie 4.0 umzusetzen.

Laut der Autoren zeigen diese Aspekte, dass es mittlerweile nicht mehr darum geht, grundsätzlich die Notwendigkeit zur Digitalisierung und Automatisierung zu diskutieren. Vielmehr stehen mittlerweile praktische Fragen im Mittelpunkt, wie Organisation den Weg zur Industrie 4.0 schrittweise und mit Augenmaß gehen können – einschließlich laufender Qualitätskontrollen und RoI-Maßnahmen.

Es fehlt an Expertise für digitale Produkte und Künstliche Intelligenz

Von allen Themenfeldern wurde die „Entwicklung der Kompetenzen und Kenntnisse von digitaler Technologie für einen erfolgreichen Übergang zu Industrie 4.0“ als größte Herausforderung benannt. Es fehlt bis dato digitales Produktionswissen, welches es operativen Mitarbeitern ermöglicht, Maschinen- und Leistungsdaten auf ihren portablen Dashboards zu interpretieren und entsprechende Maßnahmen zu ergreifen. Ferner müssen „digitaler Wartungskompetenzen“ entstehen, wie es die Studienautoren nennen, also, dass Techniker auch das Know-how haben, um komplexe digitalisierte Betriebssysteme und Geräte instandzuhalten. Und schließlich bedarf es der Expertise für operative und strategische Analysen. Gemeint ist damit, dass man die Auswertung großer Datenmengen, die sich durch die enge Vernetzung von Maschinen, Anwendungen und Menschen künftig rasant erhöhen (Big Data) in den Griff bekommt. Diese Unmengen an Daten – einschließlich Produktionsdaten, Lieferkettendaten, Marktdaten und finanziellen Daten – erfassen und analysieren zu können, ist entscheidend um die eigene Wettbewerbsfähigkeit künftig zu erhalten bzw. zu verbessern.

Datenmanagement auf Industrie 4.0 vorbereiten

Voraussetzung dafür ist, dass Unternehmen zunächst ihr bisheriges Datenmanagement und ihre Dateninfrastruktur bewerten, ob und wie sich diese für die Erfassung und Analyse von Big Data weiterentwickeln lassen – ohne bisherige Investitionen deshalb gleich aufgeben zu müssen. Ebenso gehört zu Vorarbeiten eine Strategiediskussion sowie Auswahl von Use Cases. Schauen Sie sich einmal unsere Methodik für Big-Data-Umgebungen sowie unser Data Lake Konzept an, die unsere langjährige Projekterfahrung und Expertise auch in den neuen Technologien und Verfahren wie die der Künstlichen Intelligenz widerspiegeln!

Big Data Anwendungsfälle PayPal und ProSiebenSat1

Erstellt am: Mittwoch, 24. Januar 2018 von Sascha

Auch wenn heute Big Data in aller Munde ist, so stehen doch die Unternehmen mehrheitlich immer noch am Anfang mit der Umsetzung. Gerade zu Beginn einer Big-Data-Initiative fällt es schwer, die geeigneten Use Cases zu finden beziehungsweise vorhandene Ideen weiter auszuarbeiten und für ein Proof-of-Concept zu priorisieren. Wir empfehlen daher, sich zunächst in einem individuellen Workshop über die eigenen Anforderungen,  den Markt und Technologien bis hin zur eine Road Map klar zu werden. Im Rahmen dieser Vorarbeiten erläutern wir unter anderem Anwendungsbeispiele aus der jeweiligen Branche oder Fachbereich, die von Kunden oder aus dem Markt stammen. Die QUNIS hat hierfür als Besonderheit im Markt eine „Lösungsbibliothek“ geschaffen. Sie vereint und strukturiert aktuell weit über 100 im Markt veröffentlichte Anwendungsbeispiele für die Nutzung von Big Data.

Ein besonders spannendes Anwendungsgebiet für Advanced Analytics ist beispielsweise das Marketing. Die in der Branche viel zitierte 360°-Sicht auf den Kunden bildet künftig die Grundlage dafür, welches Produkt und welche Dienstleistung er über welchen der vielen Kanäle zu welchen Konditionen angeboten bekommt. Je präziser daher eine Segmentierung von Kunden und die Prognose ihres Verhaltens möglich ist, desto höher sind Kontakt- und Antwortraten und damit auch Abschlussquoten und Umsatz, desto höher die Kundenzufriedenheit und Loyalität. Nachfolgend zwei Beispiele:

PayPal – Kunden besser verstehen und binden – Service optimieren durch Text Analytics

PayPal hat über 143 Millionen aktive Kunden und wickelt täglich über 8 Millionen Zahlungen ab. Zahlreiche Kunden äußern sich über Kundenumfragen, E-Mail, Feedback-Formulare im Web, Twitter zu den Dienstleistungen von PayPal, unter anderem darüber, welche technischen Probleme sie haben, was sie mögen, was sie stört und wie man den Service verbessern könnte. Wegen der enorm großen Menge an Feedback, wäre es sehr zeit- und kostenaufwändig, alles textuelle Feedback einzeln zu lesen und zu berücksichtigen. Die automatisierte Analyse des Kundenfeedbacks aus über 60 Ländern und in über 30 Sprachen ermöglicht es PayPal nun, wichtige Probleme und Themen sowie ihre Häufigkeit und Kritikalität automatisch und fast in Echtzeit zu erkennen, zu priorisieren und zu beheben.

ProSiebenSat.1 – Fakten mit Big Data: Was bringen TV-Spots für E-Commerce?

Die ProSiebenSat.1 Media AG vermarktet einerseits klassische TV-Werbezeiten und beteiligt sich andererseits an zahlreiche E-Commerce-Unternehmen. Im Rahmen der Beteiligung stellt ProSieben-Sat.1 u. a. Werbezeiten für die Bewerbung der E-Commerce-Angebote zur Verfügung. Es ist daher von hohem Interesse für ProSiebenSat.1, systematisch ermitteln zu können, welchen konkreten Beitrag die TV-Werbung zur Wertschöpfung des beworbenen E-Commerce-Unternehmens leistet. Wie viele Visitors besuchen genau deshalb die E-Commerce-Website, weil sie die TV-Werbung gesehen haben? Und welchen Umsatz bringen diese Visitors, die nachweislich ursächlich wegen der TV-Werbung auf die Website gekommen sind, in einem bestimmten Zeitraum? Durch den Big Data-Ansatz konnte ein Verfahren entwickelt werden, um den TV-Einfluss auf den Website-Traffic zu messen.

Mehr zu Big Data und der QUNIS-Methodik finden Sie hier

Self Service Business Intelligence will gelernt sein

Erstellt am: Donnerstag, 7. Dezember 2017 von Sascha

Es war um das Jahr 2010 als das Schlagwort Self Service im Markt für Business Intelligence die Runde machte. Das Thema wurde zunächst stark von Herstellern wie Microsoft, Tableau oder QlikView getrieben, während diese Anforderung in Anwenderunternehmen noch selten formuliert wurde. So mussten wir denn auch in der Beratung häufig zunächst ein Grundverständnis für Self Service BI (SSBI) schaffen, welche Vorzüge SSBI bieten könnte. Vielen Anwendern war gar nicht bewusst, wo SSBI anfängt und wo es endet. Seitdem hat es sich mehr und mehr etabliert und ist aus keinem Projekt mehr wegzudenken.

Selbst wenn es zu Beginn nicht explizit vom Kunden gefordert wird, zeigt sich bei der Ausarbeitung der Anforderungen, dass hier Bedarf besteht. Anwender, meist so genannte Power User, wollen sich ihre Daten immer häufiger selber erschließen und Analysen und Reports erstellen – eigenständig und unabhängig von der IT. Entsprechend wird erwartet, dass eine Business-Intelligence-Lösung und Technologie diese Nutzer bestmöglich unterstützt.

SSBI erfordert Erfahrung im Umgang mit Daten

Doch Self Service Business Intelligence ist kein Selbstläufer, sondern bedeutet für alle Betroffenen ein Umdenken. Man kann dem Anwender nicht ohne Anleitung einfach Werkzeuge an die Hand gegeben, damit er sich seine Daten selbst erschließt oder Reports erstellt. Es ist für ihn ungewohnt oder neu, sich jetzt mit den Tools sowie Fragen auseinandersetzen zu müssen, die Ihm sonst die IT abgenommen hat. Hilfe bei der Nutzung des BI-Frontends als auch die Datenintegration sind daher bei SSBI vonnöten.

Die gilt im noch stärkeren Maße bei der Datenexploration. Diese ist dann sinnvoll, wenn wenig über die Daten bekannt ist und die Explorationsziele nicht genau spezifiziert sind. Der Nutzer muss dann mit Hilfe von Methoden und Verfahren aus dem Gebiet der Advanced Analytics diese Daten selbstständig erforschen und Schlussfolgerungen ziehen können. Ebenso muss er im Explorationsprozess in der Lage sein, die Explorationsziele bei Bedarf verändern und anpassen zu können. Dies setzt viel Erfahrung mit Advanced Analytics voraus.

Ebenso mussten und müssen BI-Software-Hersteller lernen, wie sie SSBI in ihren Produkten am besten unterstützen. Manche Produkte konnten sich am Markt durchsetzen, andere verschwanden wieder. So konnte beispielsweise Microsoft in seinem BI-Stack anfangs nur wenige Tools für SSBI vorweisen: Excel, Power-Pivot, PerformancePointServices und die ReportingServices. Mit der Zeit gesellten sich zu diesen weitere Möglichkeiten hinzu durch MobileReports, PowerBI, PowerView, PowerQuery, AS-Tabular und DAX. PowerBI hat mittlerweile in seiner aktuellen Version sogar Künstliche Intelligenz integriert, um die Datenexploration zu vereinfachen (mehr zu PowerBI finden Sie hier).

IT muss Tools und Infrastruktur harmonisieren

Neben dem Anwender galt es auch für die IT umzudenken. Sie konnte nun nicht mehr einfach einen Cube entwickeln, dem nur mit Spezial-Wissen und als MDX-Experte die richtigen Zahlen zu entlocken waren. Nein, Cubes mussten auf einmal anwenderfreundlich sein! Dies setzte unter anderem voraus, dass man verstand, wie SSBI-Tools mit einem Cube umgehen, denn diese arbeiten eher per Drag-and-Drop mit Measures und Dimension auf den verschiedenen Achsen. Für selbstgeschriebene MDX-Abfragen war da kein Platz. Die IT muss daher Infrastruktur und Tools bestmöglich aufeinander abstimmen, soll SSBI in der Praxis funktioniere. In diesem Zusammenhang hört man gelegentlich auch von Self Service Data Integration (SSDI). Power-Pivot und AS-Tabular waren im Microsoft-BI-Stack die ersten Gehversuche, um den Anwendern die Integration von Daten aus verschiedenen Datenquellen zu einem Datenmodel zu ermöglichen. Dem Thema wird aber bislang noch zu wenig Aufmerksamkeit geschenkt, vielleicht auch weil die Tools dafür noch nicht die notwendige Flexibilität und Leichtigkeit bieten.

SSBI für den Power User

Selbst wenn alle genannten Voraussetzungen und Anpassungen gegeben sind, wird SSBI wohl auch künftig eine Domäne für Power User bleiben. Man muss schon ein gutes Verständnis über die eigenen Daten und Datenmodelle haben, um selbstständig arbeiten zu können. In den Projekten läuft es daher für gewöhnlich darauf hinaus, dass Power-User aus den Daten neue Erkenntnisse gewinnen und diese dann als Report den übrigen Endanwendern (Report-Konsumenten) zur Verfügung stellen.

Weitere Beiträge zu Entwicklungen in der Business Intelligence: