In R: Aggregieren / Zusammenfassen mehrerer Variablen pro Gruppe (z.B. Summe, Mittelwert)

In R können Sie mehrere Variablen pro Gruppe aggregieren oder zusammenfassen, indem Sie die Funktionen aggregate() oder dplyr-Paket verwenden. Hier sind zwei Beispiele, wie Sie dies tun können:

1. Verwenden von aggregate() Funktion:

# Daten erstellen
data <- data.frame(
  group = c("A", "A", "B", "B", "A", "B"),
  var1 = c(10, 20, 30, 40, 50, 60),
  var2 = c(5, 10, 15, 20, 25, 30)
)

# Summe und Mittelwert pro Gruppe berechnen
sum_result <- aggregate(cbind(var1, var2) ~ group, data, sum)
mean_result <- aggregate(cbind(var1, var2) ~ group, data, mean)

# Ergebnisse ausgeben
print(sum_result)
print(mean_result)

2. Verwenden von dplyr-Paket:

Zuerst müssen Sie das dplyr-Paket installieren und laden:

# dplyr-Paket installieren
install.packages("dplyr")

# dplyr-Paket laden
library(dplyr)

Dann können Sie die group_by() und summarise() Funktionen verwenden, um die gewünschten Statistiken zu berechnen:

# Daten erstellen
data <- data.frame(
  group = c("A", "A", "B", "B", "A", "B"),
  var1 = c(10, 20, 30, 40, 50, 60),
  var2 = c(5, 10, 15, 20, 25, 30)
)

# Summe und Mittelwert pro Gruppe berechnen
result <- data %>%
  group_by(group) %>%
  summarise(
    sum_var1 = sum(var1),
    mean_var1 = mean(var1),
    sum_var2 = sum(var2),
    mean_var2 = mean(var2)
  )

# Ergebnisse ausgeben
print(result)

In beiden Beispielen wird die Summe und der Mittelwert von var1 und var2 für jede Gruppe berechnet und die Ergebnisse ausgegeben.