Supervised Learning

Beim Supervised Learning handelt es sich um Machine Learning Algorithmen, die auf einen Datensatz angewandt werden, der ein Label oder auch eine Zielvariable aufweist. Anders ausgedrückt handelt es sich also um einen Datensatz, in dem jede Observation, z.B. eine befragte Person, eine korrekt identifizierbare Antwort zu einem definierten Untersuchungsziel aufweist. Das Supervised Learning erlaubt es nun, durch Beobachtung ein Modell zu entwickeln, mit dem man in der Lage ist, vorherzusagen, mit welcher Wahrscheinlichkeit (genauer gesagt mit welcher Konfidenz) ein noch nicht beobachtetes Sample sich klassifizieren lässt.

Ein möglicher Anwendungsfall wäre die Vorhersage, ob ein Nutzer ein Produkt kaufen bzw. eine spezielle Aktion ausführen wird, unter Zuhilfenahme von Informationen von anderen Nutzern über deren Verhalten (z. B. Kaufverhalten). In diesem Fall ist die Zielvariable kategorisch, sodass wir von einem Klassifikationsproblem sprechen. Ist die Zielvariable hingegen metrisch skaliert, also möchte man beispielsweise den Wert einer Immobile auf Grundlage gegebener Merkmale wie z.B. der Größe, Lage, des Bauzustands und des aktuellen Marktwerts vorhersagen und kennt den tatsächlichen erreichten Immobilienwert, spricht man von einem Regressionsproblem.

Prof. Dr. Gernot Heisenberg
« Back to Glossary Index