Marketing Mix Modellierung mit Excel

Marketing Mix Modellierung (MMM) hilft bei der Quantifizierung verschiedener Marketing-Inputs auf den Umsatz. Mit Marketing-Inputs sind im engeren Sinne, die 4P des Marketing Mix gemeint (Product (Produkt), Price (Preis), Place (Distribution), Promotion (Kommunikation)). Das Modell ist aber beliebig erweiterbar.

Ziel kann neben einer möglichst guten Verteilung von Marketingbudgets, zum Beispiel eine optimale Kombination aus Produkteigenschaften sein.

Die Marketing-Mix-Modellierung beinhaltet statistische Methoden bei der die Marketing-Inputs daraufhin untersucht werden, welchen Einfluss sie auf den Umsatz hatten.

Vorteile

  • ROI Optimierung
  • Verbesserung Budgetverteilung
  • Vorhersagen von benötigten Budgets und Verkäufen möglich

Einschränkungen

  • Keine Echtzeitanalyse (wie bei digitalen Tools)
  • Keine Berücksichtigung von Attribution (Kunden haben oft eine Customer Journey)
  • Keine Analyse von konkreten Kundenerfahrungen

Beispieldatensatz

Für eine sinnvolle Einführung in die Marketing Mix Modellierung werden wir anhand eines einfach strukturierten Beispieldatensatzes einige konkrete Analysen in Excel durchführen.

Der Beispieldatensatz kann hier abgerufen werden: Beispieldatensatz-Download

Wochen seit Start -> zeitlicher Bezug; TV, Plakat, Onlinemarketing sind die Marketing-Inputs und der Umsatz ist unsere Ziel-KPI -> jeweils in Geldeinheiten (z.B. in Tausend Euro)

Korrelationskoeffizient zwischen den Kanälen und dem Umsatz

Im ersten Schritt berechnen wir einfach die Korrelationskoeffizienten zwischen den Marketing-Kanälen und dem Umsatz. Der Korrelationskoeffizient gibt eine Aussage über den linearen Zusammenhang zwischen 2 Variablen.

In Excel kommen wir am schnellsten, wenn wir einfach eine Korrelationsmatrix erstellen und die Zeilen/Spalten löschen, die uns nicht interessieren:

Hier sind die errechneten Korrelationskoeffizienten:

TVPlakatOnlinemarketing
Umsatz0,782551097154310,5757261621322760,228254003788576

Was können wir ablesen?

Umso höher der Korrelationskoeffizient umso größer ist die Abhängigkeit. Laut den Daten unseres Beispieldatensatzen ist die Abhängigkeit der TV-Werbeausgaben stärker an den Umsatz gekoppelt als das Onlinemarketing und die Plakatkampagne.

Ab wann man von einem starken oder schwachen Zusammenhang spricht, ist umstritten bzw. hängt vom Autor ab. Bei einem Koeffizient von über 0,7 wird die Mehrheit der Experten von einem mittleren bis starken positiven Zusammenhang sprechen.

Streudiagramm für Zusammenhang zwischen TV Ausgaben und Umsatz

In Streudiagrammen werden jeweils zwei Variablen als ein Punkt dargestellt. Wenn wir in unserem Beispiel Ausgaben für TV-Werbung auf der einen Seite und dem Umsatz für unser Produkt auf der anderen Seite haben, ergibt das einen eindeutigen Punkt in einem Diagramm. Wenn wir jetzt viele solcher Punkte haben, kann ich mögliche Abhängigkeiten grafisch oft schon erahnen.

In Excel gehen wir folgendermaßen vor:

Ergebnis:

Was können wir ablesen?

Das Streudiagramm lässt auf jeden Fall einen Zusammenhang zwischen den TV-Ausgaben auf der X-Achse und den Umsätzen auf der Y-Achse vermuten. Wie schon der Korrelationskoeffizient gezeigt hat, ist dieser Zusammenhang zwar nicht perfekt aber dennoch stark.

Wenn wir gedanklich eine Linie durch die Punktwolke ziehen, die möglichst “mittig” durchgeht (Methoder der kleinsten Quadrate) sehen wir auch, dass der Abstand zu der Linie größer wird, umso weiter wir uns auf der X-Achse nach rechts bewegen. Also umso weiter wir die TV-Ausgaben steigern, umso größer scheint die mögliche Varianz der Ergebnisse zu sein.

Prädiktive Modellierung mit Hilfe von linearer Regression

Auf der Grundlage der bisherigen Erkenntnisse wollen wir jetzt ein (einfaches) Vorhersagemodel in Excel entwickeln. Wir haben in der Analyse der Korrelationskoeffizienten und unter Zuhilfenahme des Streudiagramms festgestellt, dass wir einen linearen Zusammenhang zwischen den TV-Ausgaben und den Umsätzen haben.

Wir können jetzt versuchen eine lineare Funktion über die Punktwolke zu legen und damit Umsätze schätzen indem wir TV-Ausgaben voraussetzen. Hierfür nutzen wir die Methode der linearen Regression.

Aus Sicht der Datenwissenschaft sind die TV-Ausgaben die unabhängige Variable und der Umsatz die abhängige.

In Excel machen wir jetzt folgendes:

Ergebnis in Excel:

In der Zusammenfassung haben wir 3 Arten von Ausgaben (die uns interessieren), die wir nacheinander behandeln werden:

  • Tabelle mit Regressionsstatistiken
  • ANOVA-Tabelle
  • Tabelle der Regressionskoeffizienten

Tabelle mit Regressionsstatistiken

Die Tabelle der Regressionsstatistik gibt Aufschluss darüber, wie gut die Anpassungslinie die lineare Beziehung zwischen den unabhängigen und abhängigen Variablen definiert. Zwei der wichtigsten Messwerte sind das Bestimmtheitsmaß (r²) und das adjustierte (bereinigte) Bestimmtheitsmaß (adjustiertes r²).

Das Bestimmtheitsmaß ist der Indikator für die Anpassungsgüte, der angibt, wie viel Varianz durch die beste Anpassungslinie erklärt wird. Der Wert reicht von 0 bis 1. In unserem Fall liegt das Bestimmtheitsmaß bei 0,612, was bedeutet, dass unsere Linie 61 % der Varianz erklären kann – das soll uns reichen.

Es gibt jedoch ein Problem: Wenn wir immer mehr Variablen hinzufügen, steigt unser Bestimmtheitsmaß immer weiter an, auch wenn die Variable möglicherweise keine Auswirkungen hat. Das bereinigte Bestimmtheitsmaß löst dieses Problem und ist eine viel zuverlässigere Metrik. Wir liegen hier ebenfalls bei 61 %, der bereinigte Wert kann aber auch wesentlich schlechter sein (was dann aber kein gutes Zeichen wäre).

ANOVA-Tabelle

ANOVA steht für Analysis of Variance (Analyse der Varianz). In dieser Tabelle wird die Summe der Quadrate in ihre Komponenten zerlegt, um Details zur Variabilität innerhalb des Modells zu erhalten.

Sie enthält eine sehr wichtige Kennzahl, die Signifikanz F (Excel nennt das F krit ), die uns sagt, ob das Modell statistisch signifikant ist oder nicht. Kurz gesagt bedeutet dies, dass unsere Ergebnisse wahrscheinlich nicht auf einen Zufall, sondern auf eine zugrunde liegende Ursache zurückzuführen sind. Der am häufigsten verwendete Schwellenwert für die Signifikanz ist 0,05. Wenn der Wert unter diesem Wert liegt, sind wir auf der sicheren Seite.

Wir sind mit unserem Wert sehr weit drunter, was auf jeden Fall gut ist.

Tabelle der Regressionskoeffizienten

Die Koeffiziententabelle schlüsselt die Komponenten der Regressionsgeraden in Form von Koeffizienten auf.

In unserem Fall können wir ablesen, dass für jede Einheit, die wir mehr in TV-Werbung stecken 0,95 Einheiten mehr Umsatz gemacht werden. Zusätzlich sehen wir, dass der Schnittpunkt bei 1032,5 liegt, was heißt, wenn wir TV-Werbung nutzen, starten wir mit diesem Umsatzwert (in der Realität sollten solche Schnittpunkte mit Vorsicht betrachtet werden).

Funktion für die Umsatzvorhersage

Jetzt nehmen wir eine lineare Funktion der Form f(x) = m*x +n und fügen für m den Koeffizienten für TV ein und für n den Schnittpunkt. Dann haben wir die Vorhersagefunktion: y(Umsatz) = 0,95*TV-Werbeausgaben + 1032,5

Wenn wir beispielsweise wissen wollen, wie viel Umsatz wir bei TV Augaben in Höhe von 5000 Euro machen würden, rechnen wir: 5.000*0,95 + 1032,5 = 5782,5

Lineare Funktion Visualisierung