16.11.2018
Ernst-Rudolf Töller
Autor: Ernst-Rudolf Töller

dab: AnalyticIntelligence - Neuer Wein in neuen Schläuchen

Wie Sie vielleicht schon gesehen haben, haben wir ein neues Produkt namens dab: AnalyticIntelligence auf unserer Webseite aufgeführt. Worum es dabei geht, und wie es sich von unseren bekannten Datenanalyse-Produkten unterscheidet, das erfahren Sie in diesem Blogpost. Autor ist Herr Ernst-Rudolf Töller, mit dem wir bei dab:AnalyticIntelligence vertrauensvoll seit Jahren in Sachen Forschung und Entwicklung zusammenarbeiten. Ich wünsche Ihnen eine spannende Lektüre; bei Fragen wenden Sie sich jederzeit gerne an uns.

Stefan Wenig, Geschäftsführer der dab: Daten – Analysen & Beratung GmbH

 

Ausgangslage: Klassische Datenanalyse ist nicht die Lösung aller Probleme.

Vielfach sehen Unternehmen beim Übergang von Datenanalyse zu echtem Datamining immer noch grundsätzliche Probleme:

  1. Wonach soll beim Datamining eigentlich genau gesucht werden; gibt es wirklich etwas in den Unternehmensdaten zu entdecken, das man z.B. mit SQL-Abfragen nicht finden würde?
  2. Selbst wenn sich neue Ansätze für die Datenanalyse finden lassen: lassen sich innovative Konzepte mit herkömmlicher Hard- und Software überhaupt umsetzen?
  3. Und scheitern am Ende nicht alle Überlegungen in Richtung Datamining früher oder später an der Personalfrage? 

Daten intelligenter verarbeiten

Wir haben uns bei der dab diesen Herausforderungen gestellt und in intensiver Entwicklungsarbeit nach neuen Wegen gesucht. Am Anfang stand sehr schnell die Erkenntnis, dass es zunächst ganz neue Sichten auf Daten braucht. Die vorhandene IT-Technik kann aber Daten im Wesentlichen „verarbeiten“ ohne sie dabei wirklich zu „verstehen“. Andererseits zeigt das Beispiel moderner Suchmaschinen, wie dem Benutzer nahezu perfekt der Eindruck vermittelt werden kann, die Suchmaschine habe seine Anfrage tatsächlich „verstanden“. Dies gelingt u.a. durch eine intelligente Sortierung der Suchergebnisse. Auch bei der Datenanalyse muss es also darum gehen, den Korridor zu nutzen zwischen innovativen Konzepten und dem was davon mit konventioneller IT-Technik gerade noch umsetzbar ist. Wir setzen auf eine alternative Repräsentation von Daten basierend auf fundierten mathematischen Verfahren und zielführend visualisiert mit modernen grafischen Methoden.

 

Daten als eigene Wirklichkeit mathematisch beschreiben

Darum geht es: Daten sind nicht mehr nur Abbild der Realität, sondern werden selber als eigene Wirklichkeit verstanden. Die mathematische Beschreibung dieser Wirklichkeit ist der Schlüssel für eine ganz neue Sicht auf das Thema Daten, das gilt nicht nur für Suchmaschinen.

Transformation der Daten in mathematische Objekte – weg von herkömmlichen SQL-ähnlichen Abfragen oder trivialen Process Mining Graphen

Aus solchen Überlegungen heraus haben wir bei der dab das Konzept des „Datenderivats“ entwickelt. Unternehmensdaten, wie sie in einzelnen oder miteinander verknüpften Tabellen von ERP-Systemen enthalten sind, werden dabei in mathematische Objekte transformiert. Diese Objekte erlauben neue Formen der „endogenen Datenanalyse“. Daten werden jetzt nicht mehr streng von außen abgefragt wie dies z.B. mit SQL Abfragen geschieht:

Beispiel für herkömmliche SQL-Abfrage:

SELECT * FROM LIEFERANT WHERE Adresse IS NULL AND BankVerb IS NOT NULL

Hier wird eine bestimmte Konstellation in den Lieferantendaten gefiltert: Lieferanten ohne Adresse aber mit Bankverbindung. Dahinter stehen Metainformationen/Metadaten des Anwenders, der mit dieser Datenkonstellation z.B. eine erhöhte Kritikalität der Daten verbindet.

 

Beispiel eines Ergebnisses basierend auf endogener Datenanalyse:

Die Daten (ein Punkt = ein Debitor) gliedern sich hier ganz ohne externe Vorgaben eines Anwenders in Gruppen. Der blaue Kreis zeigt eine Gruppe abweichender Fälle. Die große Masse der Fälle bildet eine zusammenhängende Gruppe. Diese Gliederung der Debitoren erfolgt „endogen“, d.h. sie ergibt sich nicht durch von außen vorgegebene Filter, Schwellenwerte etc. Die Gliederung wird in dieser Form aus der Gesamtheit der Daten errechnet. Ob die hier gewählte grafische Darstellung die Daten zusammenhängend zeigt oder ob es zusätzlich einzelne „Inseln“ gibt, ist eine Eigenschaft der gesamten Datenmenge, die erst in dieser Darstellung überhaupt sichtbar wird. Selbstverständlich lassen sich dann im Folgenden auch Filter definieren, die die einzelnen Inseln beschreiben. Das Entscheidende ist, dass diese Filterkriterien bzw. Aussagen über deren Trennschärfe erst NACH einer solchen Analyse überhaupt zur Verfügung stehen.

 

Beispiel Derivatsbildung:

In die Definition des Derivats gehen im vorliegenden Beispiel wichtige semantische Aspekte ein, die die Zusammensetzung der Belege eines Debitorenkontos betreffen.

ERP-System: SAP
Beteiligte Tabellen: KNA1, BKPF, BSEG
Wesentliche Datenattribute: KTOKD, Kontengruppe (KNA1), BLART Belegart (BKPF), TCODE Transaktionscode (BKPF), BSCHL Buchungsschlüssel (BSEG)
Key: KUNNR, Kundennummer

In diesem Fall wird ein Derivat mit der Kundennummer als eindeutiger Schlüssel definiert. In diesem Derivat ist die Zusammensetzung der Buchungsbelege zu einer Kundenummer auf Basis der genannten Attribute/Felder codiert. Genauso könnte man auch nur einen Teil dieser Attribute/Felder oder auch ganz andere Felder verwenden usw. So bleiben alle wichtigen semantische Aspekte der Daten immer unter der Kontrolle des Anwenders. Kritische Ausprägungen von Attributen/Feldern, Schwellenwerte etc. brauchen aber in keinem Fall definiert werden. 

 

Die Verwendung von Derivaten erschließt die Syntax der Daten umfassend für eine Analyse durch Algorithmen. Die nötigen semantischen Überlegungen finden getrennt davon bei der Definition des Derivats statt. Dort muss entschieden werden, welche Tabellen, Felder etc. zur Analyse eines bestimmten Zusammenhangs herangezogen werden sollen. Die Analyse von Derivaten ist in diesem Sinne also auch kein „Korrelationsbingo“.

Dieser kleine Überblick zeigt, dass es auf diese ersten beiden der drei eingangs gestellten Fragen sehr interessante positive Antworten gibt.

1. Wonach soll beim Datamining eigentlich genau gesucht werden; Gibt es wirklich etwas in den Unternehmensdaten zu entdecken, das man z.B. mit SQL-Abfragen nicht finden würde?

Die Antwort auf diese erste Frage könnten lauten: prinzipiell könnte die Auswertung von Daten über Derivate parallel auch über SQL-Abfragen erfolgen. Diese Abfragen wären allerdings so komplex, dass sie aus Sicht des Anwenders und ggf. auch IT-technisch nicht mehr handhabbar wären.

2. Selbst wenn sich neue Ansätze für die Datenanalyse finden lassen: lassen sich wirklich innovative Konzepte mit herkömmlicher Hard- und Software überhaupt umsetzen?

Die Antwort auf die zweite Frage wäre: die in Zusammenhang mit der Verarbeitung von Derivaten benötigten Hard- und Softwaresysteme stehen mit AnalyticIntelligence von dab zur Verfügung. Grundlage der Softwarelösung von dab ist eine stringente mathematische Durchdringung des ganzen Themas; dies und auch die anschließende Verarbeitung können mit herkömmlichen Ressourcen umgesetzt werden.

3. Scheitern am Ende nicht alle Überlegungen in Richtung Datamining früher oder später an der Personalfrage?

Damit haben wir auch den Übergang zur dritten Frage: Der gesamte hier in Rede stehende Prozess ist nur über Managed Services darstellbar. Im Prinzip ist auch hier der Vergleich mit modernen Suchmaschinen zielführend: Die Frage am Anfang und das Ergebnis am Ende des Prozesses sind immer auch für den Anwender verständlich. Was technisch dazwischen abläuft, liegt hier wie dort auf einer ganz anderen Ebene.

Fazit

Unser Produkt dab:AnalyticIntelligence beschreitet einen neuen Weg, der die Stärken aus semantischem Wissen und jahrelanger Erfahrung kombiniert mit der unvoreingenommenen Sicht auf die Daten, die den Charme von DataMining Ansätzen ausmacht – ohne dessen vielfach beschriebene Schwächen zu übernehmen. Wir sind überzeugt, dass in einer Welt, in der Machine Learning und künstliche Intelligenz immer wichtiger werden und der mathematischen Beschreibung von Daten und der darauf basierenden Datenanalyse eine wesentliche Bedeutung zu Teil wird. Deterministische Abfragen, wie sie durch SQL(-ähnliche) Queries abgebildet werden, sind nicht obsolet – der innovativere und effizientere Weg, die große und komplexe Datenmengen, gleich aus welcher Quelle sie stammen Herr zu werden, liegt in Ansätzen wie dab:AnalyticIntelligence.

Wir hoffen, diese kleine Darstellung zu den Grundlagen von dab AnalyticIntelligence hat ihr Interesse gefunden. Für Fragen zu diesem Artikel oder generellen Fragen zu Datenanalyse oder Produkten von dab und ACL™ kommen Sie jederzeit gerne auf uns zu.


Kommentare (0)
Sei der erste, der diesen Blog-Beitrag kommentiert.
Blog Anmeldung

Sie sind nicht angemeldet. Bitte melden Sie sich an um diesen Blogbeitrag zu kommentieren.

anmelden