Knoten eines Netzwerkes

Die Modellierung digitaler Zielgrößen – Die Verbindung von Digital-Customer-Journey-Analysen und ökonometrischem Modelling

Ausgangssituation

Nach einer aktuellen Schätzung wurde im Jahr 2018 weltweit ein Digital-Datenvolumen von 33 Zettabyte generiert[1], das sind 33 x 1021 Byte oder 33 Milliarden Terrabyte, also die Datenmenge, die auf 33 Milliarden Festplatten typischer Größe gespeichert werden können – also eine recht große Menge an Daten.

Folglich ergibt sich der Wunsch, Wissen aus den Daten zu generieren. Für Unternehmen ist es vor allem von Bedeutung, neue Informationen über die Kunden zu gewinnen, z. B. über Risikopotentiale und das Kaufverhalten der Kunden.

Die Digital-Customer-Journey-Analyse

Eine typische Analyse, die hier ansetzt, ist die Analyse der sog. „Digital-Customer-Journey-Analyse“. Hier geht es darum, die Beiträge zu bestimmen, die jeder einzelne digitale Kontaktpunkt am Erfolg hat. Üblicherweise wird die sogenannte „Conversion“ als ein solcher Erfolg betrachtet. Dies kann der Kauf in einem Online-Shop sein, aber je nach Zielsetzung auch ein „weicherer Faktor“ wie z. B. die Registrierung auf einer Webseite oder die Befüllung eines digitalen Warenkorbs.

Um die Beiträge der Kontaktpunkte zu bestimmen, werden die Logfile-Daten von den Servern der zu betrachtenden Webseite, des Onlineshops o.ä. analysiert. Aus den Logfile-Daten lässt sich auslesen, welche Kontakte eine „Person“ (oder besser: das, was vom System als eine Person identifiziert wird) mit den einzelnen Kontaktpunkten wie z.B. Werbebannern auf unterschiedlichen Webseiten in der letzten Zeit hatte.

Die Analyse der Digital Customer Journey ist nicht neu. Bereits in der ersten Hälfte der 2000er-Jahre wurden entsprechende Verfahren eingesetzt. In dieser Zeit kamen vor allem sogenannte „Attributionsmodelle“ zum Einsatz. Hier geht es – wie der Name schon sagt – darum, dass dem Erfolg bestimmte Ursachen zugeschrieben werden. Ein sehr populärer Ansatz besteht im sogenannten „last cookie counts“-Ansatz. Hier wird dem letzten Kontaktpunkt die entscheidende Bedeutung zugeschrieben. Wenn nun alle „Personen“, die eine Conversion liefern, betrachtet werden, kann auf dieser Basis einfach bestimmt werden, welche letzten Kontaktpunkte an diesem Erfolg beteiligt waren – häufig werden dies die Suchanfragen sein, die auf die betrachtete Webseite geführt haben.

Ähnliche Ansätze bestehen darin, anderen Kontaktpunkten eine Bedeutung zuzuschreiben, z. B. dem ersten Kontaktpunkt und dem letzten oder auch jedem beliebigen Kontaktpunkt.

Diese dreigeteilte Grafik veranschaulicht unterschiedliche Attributionsmodelle für die Analyse der Digital-Customer-Journey

Abb. 1: Beispiele für Attributionsmodelle für die Analyse der Digital-Customer-Journey

Das wesentliche Problem dieses so durchgeführten Ansatzes besteht darin, dass nur die „Personen“ betrachtet werden, die einen Erfolg geliefert haben. Personen, die ebenfalls die betrachteten Kontaktpunkte besucht haben, ohne einen Erfolg zu liefern, werden nicht beachtet. Nun wäre es aber möglich, dass die Kontaktpunkte, denen hier ein Beitrag zum Erfolg zugeschrieben wird, bei den nicht-konvertierenden Personen einen viel höheren Anteil an den Kontaktpunkten haben als bei den konvertierenden. Damit würde das Ergebnis der Analyse widerlegt werden.

Folglich ist es erforderlich, in einer Analyse der Digital-Customer-Journey auf Basis einzelner „Personen“ auch diejenigen zu betrachten, die keinen Erfolg, also keine Conversion, liefern. Auf die praktischen Schwierigkeiten, die „Nicht-Konvertierer“ zu erfassen, sei an dieser Stelle nicht eingegangen.

Einfach gesagt geht es darum, festzustellen, welche Kontaktpunkte zu einem Erfolg geführt haben und welche nicht.

Diese zweigeteilte Grafik beschreibt die Digital-Customer-Journey je einer "Person", die zu keinem bzw. einem Erfolg geführt hat.

Abb. 2: Unterschiedliche Digital-Customer-Journeys einzelner „Personen“, die zu keinem bzw. einem Erfolg geführt haben

Hierfür werden die Pfade von „Personen“ betrachtet, die entweder erfolgreich verliefen oder eben nicht. Neben dem Ziel, die Bedeutung der Kontaktpunkte zu bestimmen, wird auch oft untersucht, ob der Pfad selbst, also die Reihenfolge der Kontaktpunkte, eine Rolle spielt. Hierzu eine kurze Überlegung:

Angenommen, es gibt drei Kontaktpunkte, z. B. einen Werbebanner auf einer Webseite (A), ein Video auf einer bestimmten Webseite (B) und einen weiteren Werbebanner auf einer anderen Webseite (C), dann ergeben sich die folgenden vollständigen Pfade

A-B-C, A-C-B, B-A-C, B-C-A, C-A-B und C-B-A sowie die TeilpfadeA-B, A-C, B-A, B-C, C-A, C-B und A, B und C,

also insgesamt 15 Pfade.

Bereits bei zwölf Kontaktpunkten ergeben sich 479.001.600 vollständige Pfade, Teilpfade nicht eingerechnet. Dies sind ca. sechs Mal mehr Pfade als Einwohner in der Bundesrepublik Deutschland.

Da die entsprechenden Daten verfügbar sind, ist es grundsätzlich möglich, Pfade zu betrachten. Ob dies sinnvoll ist und ob sich daraus Erkenntnisse ableiten lassen, ist eine andere Frage. Interessanterweise wird in der Offline-Welt vergleichsweise selten über die Frage diskutiert, welche Bedeutung z. B. die Reihenfolge von Kontakten mit TV-Spots auf unterschiedlichen Sendern oder von Kontakten in unterschiedlichen Medien hat.

Lassen wir die Frage der Reihenfolge der Kontakte außer Acht, so geht es also darum, zu ermitteln, welche Bedeutung die einzelnen Kontaktpunkte für den Erfolg haben – und hierfür lassen sich die Digital-Customer-Journeys auf Basis einzelner Personen, die entweder einen oder keinen Erfolg liefern, analysieren.

Für diese Analyse stehen unterschiedliche Verfahren zur Verfügung:

  • statistische Verfahren wie die logistische Regression, in der es darum geht, eine dichotome abhängige Variable (z.B. Kauf ja/nein bzw. Kauf 0/1) durch eine Kombination unabhängiger Variablen (Kontaktpunkte, ggf. weitere Variablen wie Dauer des Kontakts, Zeitpunkt des Kontakts, etc.) vorherzusagen
  • Verfahren der künstlichen Intelligenz, Vorhersage der abhängigen Variablen (z.B. Kauf ja/nein) auf Basis der entsprechenden unabhängigen Variablen auf Basis von künstlichen neuronalen Netzen oder Machine-Learning-Verfahren

Auf eine nähere Beschreibung der Verfahren muss an dieser Stelle verzichtet werden. Grundsätzlich sind alle Verfahren – die richtige Anwendung vorausgesetzt – geeignet, die oben formulierte Aufgabe zu lösen.

Kurz zusammengefasst ergeben sich folgende Vor- und Nachteile für die Ansätze:

Statistische Verfahren

  • Vorteile: Vollständige Transparenz, Überprüfbarkeit und Bewertung der Ergebnisse auf Basis von statistischen Kennziffern, hypothesengestütztes Vorgehen, vollständige Reproduzierbarkeit der Ergebnisse: Anwendung auf gleiche Daten liefert stets das gleiche Ergebnis
  • Nachteile: In der Regel geringere Anpassungsgüten als bei Verfahren der künstlichen Intelligenz für Trainingsdaten, statistische Bewertung der Ergebnisse kann zu Ausschluss von interessierenden unabhängigen Variablen führen

Verfahren der künstlichen Intelligenz

  • Vorteile: Anwendung ohne Vorkenntnisse von Hypothesen stets möglich, in der Regel höhere Anpassungsgüten für Testdaten
  • Nachteile: Zustandekommen der Ergebnisse nicht nachvollziehbar („Black-Box“), üblicherweise nie gleiche Ergebnisse bei wiederholter Analyse gleicher Daten, häufig deutlicher Abfall der hohen Prognosegüte für Trainingsdaten bei Anwendung auf Testdaten

Unter Anwendung beider Verfahren kann es letztendlich gelingen, eine Aussage über die Wirkung der Kontaktpunkte innerhalb der Digital-Customer-Journey zu treffen.

Allerdings ergibt sich nun ein neues Problem: Die Daten, die in der o.g. Analyse betrachtet werden, weisen viele Vorteile auf: Sie sind sehr detailliert, wurden exakt gemessen und sind in der Regel schnell verfügbar – nur leider stammen sie ausschließlich aus der „Online-Welt“. Im Allgemeinen wird aber auch das Verhalten in der „Online-Welt“, also z.B. der Kauf in einem Online-Shop, durch Einflüsse gesteuert, die sich in der „Offline-Welt“ befinden. Hierzu zählen u.a. weitere Kontaktpunkte wie z.B. TV-Werbespots, Radio-Werbung, Marketing-Aktivitäten wie Preise und Promotions, Mailings, übergeordnete Einflüsse wie die konjunkturelle Entwicklung oder saisonale Effekte und schließlich auch Aktivitäten des Wettbewerbs. Diese Aufzählung ließe sich beliebig weiter fortsetzen, aber allein anhand dieser Beispiele lässt sich erahnen, dass online nur ein Teil der relevanten Einflüsse berücksichtigt werden kann.

Allerdings wird üblicherweise den nachweisbaren Online-Einflüssen in den Ansätzen der Customer-Journey-Analysen der gesamte Erfolg an der „Conversion“ zugeschrieben, was zu einer deutlichen Überschätzung der Online-Maßnahmen führt.

Diese Grafik visualisiert die Off- und Online-Einflüsse, die auf eine Conversion wirken können

Abb. 3: Einflüsse, die auf eine Conversion (wie z. B. den Kauf in einem Onlineshop) wirken können

Hieraus ergibt sich zwangsläufig die Frage, mit welchem Ansatz sich die relevanten Einflüsse auf die „Conversion“ berücksichtigen lassen, sowohl Online- als auch Offline-Einflüsse.

An dieser Stelle kommt ein bewährtes Verfahren zum Einsatz: das ökonometrische Modelling.

Das Ökonometrische Modelling

Unter Anwendung des ökonometrischen Modellings wird eine Zielvariable, z. B. der Absatz eines Produkts, im Zeitverlauf betrachtet. Der Absatz wird üblicherweise nicht auf Ebene einzelner Personen (Single-Source-Data), sondern aggregiert betrachtet, z. B. über alle Geschäfte im Vertriebsgebiet. Das Ziel des Verfahrens besteht darin, die Einflüsse durch unabhängige Variablen, z. B. Preis, Werbung, Saison und Wettbewerb, die ebenfalls im Zeitverlauf betrachtet werden, zu identifizieren und deren Wirkung zu verstehen.

Auch wenn es sich beim ökonometrischen Modelling um einen Sammelbegriff handelt, kommen üblicherweise statistische Verfahren zum Einsatz, um die o.g. Fragestellungen zu beantworten. Das „klassische“ statistische Verfahren, das üblicherweise angewendet wird, ist die sog. multiple Regression. Bei der Modellerstellung geht es darum, die Zielvariable, z. B. den Absatz im Zeitverlauf, durch eine Kombination von unabhängigen Variablen so gut wie möglich zu erklären. Hierfür werden „optimale Gewichtsfaktoren“ für eine Kombination von unabhängigen Variablen bestimmt, die die abhängige Variable bestmöglich erklären. Beispiel: Absatz = x1*Preis + x2*Temperatur + x3*Werbeausgaben (die xi sind die gesuchten Gewichtsfaktoren bzw. Modellkoeffizienten). In der Praxis geht es vor allem darum, eine „ideale Kombination“ unabhängiger Variablen zu finden, die eine im statistischen Sinn gute Anpassung an die abhängige Variable liefern, gleichzeitig aber inhaltlich plausibel sind.

Im Gegensatz zur zuvor beschriebenen Digital-Customer-Journey-Analyse spielt es im ökonometrischen Modelling keine Rolle, ob es sich um rein digitale Einflüsse oder um Einflüsse aus der „Offline-Welt“ handelt. Das Modell hat viele Anwendungsmöglichkeiten. Diese Anwendungsmöglichkeiten lassen sich in zwei Bereiche unterteilen: rückwirkende Beschreibung und Prognose.

In der rückwirkenden Betrachtung lässt sich z. B. ermitteln, welchen Anteil die nachgewiesenen Faktoren an der Entwicklung des Absatzes haben („Sales Decomposition“). Die Wirkung einzelner Faktoren kann bestimmt werden, z. B. die Elastizität des Preises. Im Bereich Media interessiert vor allem, wie lange die Wirkung anhält, welcher Werbedruck optimal ist und welchen Umsatzbeitrag die bisherigen Medien erbracht haben („Return on Investment – ROI“).

Der zweite wichtige Einsatzbereich für die Modelle besteht in der Möglichkeit, Simulationen und Prognosen durchführen zu können. So lässt sich z. B. simulieren, welchen Effekt eine Preisanpassung oder eine Veränderung des Media-Mixes und der Media-Strategie bewirken. Auf Basis des Modells können die optimale Mediastrategie sowie der optimale Media-Mix für ein gegebenes Budget ermittelt werden oder umgekehrt das erforderliche Budget zum Erreichen bestimmter Absatzziele bestimmt werden. Schließlich können Prognosen für die Absatzentwicklung erstellt werden.

Diese Grafik zeigt eine Übersicht zur Sales Decomposition, die Modellgleichung und Anwendungsmöglichkeiten

Abb. 4: Einflüsse, Datenmodell und Anwendungsmöglichkeiten

Während der klare Vorteil des ökonometrischen Modellings darin liegt, grundsätzlich jede Art von Einflüssen in die Analyse einbeziehen zu können, die sich in einer Zeitreihe abbilden lassen, besteht ein Nachteil darin, dass üblicherweise nur vergleichsweise wenige Einflüsse signifikant nachgewiesen werden können. Verwendet man z. B. wöchentliche Daten über einen Zeitraum von drei Jahren, so lassen sich bis max. 20 Einflüsse im Modell abbilden. Weitere Vorteile des Ansatzes bestehen darin, dass das Verfahren vollständig transparent ist (hypothesengestützte Herangehensweise, Beurteilung der in das Modell aufgenommenen Variablen nach statistischen Verfahren) und üblicherweise gute Prognosen auf Basis des Modells erstellt werden können, sofern bestimmte Regeln bei der Erstellung des Modells beachtet werden. Darüber hinaus ist es möglich, auch zu berücksichtigen, wie sich die Wirkung der Werbemaßnahmen über die Zeit verteilt („Carry-Over“), also welche Werbewirkung noch in der Folgewoche, in zwei Wochen, etc. besteht.

Das ökonometrische Modelling kann also grundsätzlich auch auf das oben genannte Beispiel, die Untersuchung der Einflüsse auf Käufe in einem Webshop, angewendet werden. Hierzu müssen die Käufe auf Tages- oder Wochenbasis zusammengefasst werden und die jeweiligen Einflüsse – online und offline – als entsprechende erklärende Variablen herangezogen werden. Die Analyse unterscheidet sich also nicht von der „klassischen Vorgehensweise“, in der z. B. Absätze in einem „Offline-Geschäft“ untersucht werden. Da mit diesem Ansatz alle Daten auf Tages- oder Wochenbasis aggregiert werden, werden auch keinerlei personenbezogene Daten benötigt.

Im Ergebnis zeigen sich die wesentlichen Einflüsse; unter ihnen bei entsprechendem Werbedruck natürlich auch digitale Werbemaßnahmen. Je nach Anzahl der Datenpunkte gilt natürlich auch hier wieder die Einschränkung, dass die Zahl der nachweisbaren Einflüsse begrenzt ist, eine Untersuchung einzelner digitaler Kontaktpunkte also in der Regel ausgeschlossen ist.

  Digital Customer Journey Ökonometrisches Modelling
Vorteil Üblicherweise werden sehr viele einzelne Maßnahmen untersucht. Grundsätzlich können alle Einflüsse (Online und Offline) in die Analyse einbezogen werden, dadurch realistisches Bild der Stärke der Einflüsse.   

Vollständige Transparenz und Überprüfung nach statistischen Verfahren.

Nachteil Keine Berücksichtigung von Offline-Einflüssen, dadurch Überschätzung des Einflusses digitaler Maßnahmen.   

Je nach Methode nur begrenzte Transparenz.

Nur wenige Einflüsse nachweisbar.

Abb. 5: Digital-Customer-Journey vs. Ökonometrisches Modelling

Die Verbindung beider Verfahren

Sofern vollständige Daten (online und offline) über einen längeren Zeitraum zur Verfügung stehen, kann es sinnvoll sein, beide Verfahren einzusetzen:

Das ökonometrische Modelling liefert  Informationen darüber, welche Einflüsse in welcher Stärke die Zielvariable beeinflussen. Unter diesen Einflüssen wird sich – entsprechender Werbedruck vorausgesetzt – auch der Einfluss der Digitalmaßnahmen befinden, z. B. als Variable „Digitale Werbeausgaben“ oder „Digitale Kontakte“, ggf. grob unterteilt nach Medium (Online Video, Online Display, etc.).

Die Digital Customer Journey liefert dann den Detailblick und trifft eine Aussage über die Wirkung der einzelnen „Digitalen Kontaktpunkte“.

Unter Berücksichtigung des ökonometrischen Modellings kann eine realistische Einschätzung über die Wirkung der Digitalmaßnahmen (z. B. Ermittlung des ROIs) vorgenommen werden, indem die Wirkung an dem Anteil des Absatzes der Digitalmaßnahmen in der „Sales Decomposition“ gewichtet wird. Dies erlaubt auch eine erste Einschätzung, wie die digitalen Medien im Mix mit klassischen Medien abschneiden. Die Auswahl der konkreten digitalen Werbeträger kann dann anhand der Ergebnisse der Digital-Customer-Journey-Analyse ausgesteuert werden.

Zusammenfassung

Die herkömmlichen Analysen der Digital-Customer-Journey weisen eine entscheidende methodische Schwäche auf: Üblicherweise wird die Entwicklung des betrachteten Zielparameters ausschließlich auf Effekte in der Online-Welt zurückgeführt, entscheidende weitere Faktoren wie z. B. Werbekontakte aus der „Offline-Welt“ oder saisonale Faktoren, werden nicht berücksichtigt. Dies kann zu einer deutlichen Überschätzung des Einflusses der digitalen Kontaktpunkte führen.

Das klassische ökonometrische Modelling kann auch verwendet werden, um die Entwicklung digitaler Zielgrößen in der Zeitreihe zu analysieren. Hierbei werden sowohl die Einflüsse aus der Online- als auch aus der Offline-Welt gemessen. Allerdings ermöglicht dieser Ansatz üblicherweise nicht die Bewertung einzelner digitaler Kontaktpunkte.

Durch Kombination der beiden Ansätze „Digital-Customer-Journey-Analyse“ und „Ökonometrisches Modelling“ wird es möglich, gleichermaßen Online-Einflüsse im Detail und im Zusammenspiel mit Offline-Einflüssen zu untersuchen. Das ökonometrische Modelling ordnet den Einfluss der Digitalmaßnahmen im Zusammenspiel mit anderen Einflüssen realistisch ein, die Digital-Customer-Journey-Analyse liefert den Detailblick auf die einzelnen digitalen Kontaktpunkte.

[1] Seagate. (20. November, 2018). Prognose zum Volumen der jährlich generierten digitalen Datenmenge weltweit in den Jahren 2018 und 2025 (in Zettabyte) [Chart]. In Statista. Zugriff am 20. Juli 2019, von https://de.statista.com/statistik/daten/studie/267974/umfrage/prognose-zum-weltweit-generierten-datenvolumen/

Prof. Dr. Alexander Preuß, annalect

Managing Partner Marketing Science bei annalect
Alexander Preuß ist Managing Partner Marketing Science bei annalect, den Spezialisten der Omnicom Media Group Germany für innovative, datengetriebene Marketinglösungen. Er verantwortet vom Standort Hamburg aus den Forschungsbereich ökonometrisches Modelling.

Preuß studierte Soziologie und promovierte im Fach Statistik. 2000 begann er seine Forschungskarriere als Researcher bei der Kabel New Media GmbH in Hamburg. Bereits ein Jahr später wechselte Preuß als Group Manager Research zur Mediaagentur OMD Hamburg, wo er die Forschung im Bereich der quantitativen Werbewirkungsforschung vorantrieb.

Seit 2009 ist der gebürtige Hamburger bei der Omnicom Media Group Germany tätig und betreut in seiner Position als Managing Partner namhafte Kunden aus unterschiedlichen Branchen.

Neben seiner Beschäftigung bei der Omnicom Media Group ist Preuß an der Hochschule Fresenius als Professor für quantitative Methodenlehre tätig.

Weitere Informationen und alle Beiträge

https://www.annalect.de
Prof. Dr. Alexander Preuß, annalect

Wissen, Fachartikel

Schreibe einen Kommentar