Korrelationskoeffizient

[engl.: coefficient of correlation]

Unter Korrelation versteht man einen statistischen Zusammenhang zwischen zwei Variablen. Mittels des Korrelationskoeffizienten kann man die Stärke des Zusammenhangs bestimmen.

1. Der Produkt-Moment-Korrelationskoeffizient

Es gibt unterschiedliche Typen von Korrelationskoeffizienten. Einer der am häufigsten verwendeten ist der Produkt-Moment-Korrelationskoeffizient (oder auch Pearson-Korrelation). Er findet bei einer metrischen Skalierung Anwendung, wenn ein linearer Zusammenhang zwischen den Variablen untersucht werden soll. Eine Schwäche des Produkt-Moment-Korrelationskoeffizienten liegt darin, dass er nicht robust gegen Ausreißer ist. Bei ordinal skalierten Variablen würde man ein anderes Verfahren wie zum Beispiel den Spearmanschen Rangkorrelationskoeffizienten anwenden.

2. Interpretation des Korrelationskoeffizienten

Wichtig ist die Unterscheidung von Korrelation und Kausalität: Nur weil zwei Variablen korrelieren, bedeutet dies noch nicht, dass die eine Variable einen direkten Einfluss auf die andere Variable hat. Der statistische Zusammenhang könnte auch durch eine dritte Variable verursacht werden, die bei der Erhebung nicht berücksichtigt wurde. Korrelation ist somit ein Hinweis auf Kausalität aber kein Beweis. Die Werte des Korrelationskoeffizienten können sich zwischen -1 und 1 bewegen. Bei einem Ergebnis von 1 besteht ein perfekter positiver linearer Zusammenhang zwischen den Variablen und bei 0 besteht gar kein linearer Zusammenhang (eventuell jedoch ein nichtlinearer). Bei einem Korrelationskoeffizienten von -1 existiert ein perfekter negativer linearer Zusammenhang.

DataAnalyst.eu

Das Angebot von DataAnalyst.eu richtet sich an Jobsuchende im Bereich Data Science und Unternehmen, die auf der Suche nach Data-Analysten sind.

In unserem Lexikon und Data-Science-Blog bündeln wir für Sie außerdem Informationen rund um Begrifflichkeiten, Berufsfeld, Karriere und Trends.
DataAnalyst.eu
« Back to Glossary Index