Knowledge Discovery in Databases (KDD)

Um die Ursprünge der Data Analytics zu verstehen, muss man sich mit Knowledge Discovery in Databases (KDD) auseinander setzen, einem Konzept, das erstmals 1989 als Begriff auftauchte. Unter KDD versteht man den Prozess der Erkennung interessanter Informationen in Daten, die in großen Datenbanken gespeichert sind. Dabei meint interessant nicht-triviales, implizites, vorher nicht bekanntes, einfach verständliches und nützliches Wissen. Informationen sind im Rahmen von KDD als Muster, Korrelationen, Regeln oder Beziehungen in Daten zu verstehen, die Wissen vermitteln, das die Entscheidungsfindung erleichtert. Der Definitionsbestandteil Prozess impliziert dabei, dass es sich hierbei um ein Verfahren handelt, bei dem mehrere Schritte notwendig sind, die in Teilen iterativ angegangen werden (Olson, 2017). Auf einer abstrakten Ebene ist die vorrangige Aufgabe von KDD also die Entwicklung von Techniken und Methoden zur Verständnisentwicklung von Daten. Das Ausgangsproblem eines KDD-Prozesses liegt darin, dass das Datenmaterial im Rohdatenzustand zu umfangreich und für den menschlichen Intellekt nicht fassbar ist. Eine Transformation in ein kompakteres Format nimmt sich diesem Problem an. Beispiele hierfür sind die Erstellung eines Reports inklusive deskriptiver Statistiken oder die Entwicklung eines Modells zur Vorhersage einer Zielvariable, z. B. dem Umsatz für eine bestimmte Produktkategorie in Abhängigkeit von anderen Variablen.

Prof. Dr. Gernot Heisenberg

Professur für Information Research and Data Analytics. Studium der theoretischen Physik an der RWTH Aachen und Promotion in Informatik. Langjährige Teamleitertätigkeit am Fraunhofer Competence Center for Virtual Environments. Gründung, Aufbau und erfolgreicher Verkauf seiner Firma für numerische Simulationssoftware. 2013 Vertretungsprofessor in Sankt Augustin, 2014 bis 2016 ordentliche Professur in Wiesbaden und seit 2016 ordentliche Professur an der Technischen Hochschule Köln. Seine Forschungs- und Lehrschwerpunkte umfassen Advanced Data Analytics sowie Advertising Research.

Weitere Informationen und alle Beiträge

Prof. Dr. Heisenberg bietet Consulting rund um die Themen Advanced Data Analytics und Advertising Research an: www.gernotheisenberg.de
Prof. Dr. Gernot Heisenberg
« Back to Glossary Index