Varianz und Kovarianz sind beides statistische Maße, die verwendet werden, um die Streuung und die Beziehung zwischen Datenpunkten zu beschreiben. Hier ist eine kurze Erklärung ihrer Unterschiede:
Varianz:
- Die Varianz misst, wie weit die einzelnen Werte in einem Datensatz vom Mittelwert dieses Datensatzes abweichen.
- Sie wird berechnet, indem man die Differenz zwischen jedem Datenpunkt und dem Mittelwert nimmt, diese Differenzen quadriert und dann den Durchschnitt dieser quadrierten Differenzen berechnet.
- Die Varianz gibt an, wie “verstreut” oder “konzentriert” die Daten sind.
- Sie wird in den Einheiten des Datensatzes zum Quadrat gemessen (zum Beispiel: wenn die Daten in Metern gemessen werden, wird die Varianz in Quadratmetern angegeben).
Kovarianz:
- Die Kovarianz misst, wie zwei Variablen gemeinsam variieren oder zusammenhängen.
- Sie wird berechnet, indem man die Produkte der Abweichungen jedes Datenpunktes vom jeweiligen Mittelwert der beiden Variablen nimmt und dann den Durchschnitt dieser Produkte berechnet.
- Positive Kovarianz bedeutet, dass, wenn eine Variable über ihrem Mittelwert liegt, die andere Variable dazu neigt, auch über ihrem Mittelwert zu liegen (und umgekehrt). Negative Kovarianz bedeutet, dass, wenn eine Variable über ihrem Mittelwert liegt, die andere dazu neigt, unter ihrem Mittelwert zu liegen.
- Im Gegensatz zur Varianz, die nur eine Variable betrachtet, benötigt die Kovarianz zwei Variablen.
Zusammengefasst ist die Varianz ein Maß für die Streuung innerhalb einer einzelnen Variablen, während die Kovarianz ein Maß für die Art und Stärke der Beziehung zwischen zwei Variablen ist.