In R können Sie mehrere Variablen pro Gruppe aggregieren oder zusammenfassen, indem Sie die Funktionen aggregate()
oder dplyr
-Paket verwenden. Hier sind zwei Beispiele, wie Sie dies tun können:
1. Verwenden von aggregate()
Funktion:
# Daten erstellen
data <- data.frame(
group = c("A", "A", "B", "B", "A", "B"),
var1 = c(10, 20, 30, 40, 50, 60),
var2 = c(5, 10, 15, 20, 25, 30)
)
# Summe und Mittelwert pro Gruppe berechnen
sum_result <- aggregate(cbind(var1, var2) ~ group, data, sum)
mean_result <- aggregate(cbind(var1, var2) ~ group, data, mean)
# Ergebnisse ausgeben
print(sum_result)
print(mean_result)
2. Verwenden von dplyr
-Paket:
Zuerst müssen Sie das dplyr
-Paket installieren und laden:
# dplyr-Paket installieren
install.packages("dplyr")
# dplyr-Paket laden
library(dplyr)
Dann können Sie die group_by()
und summarise()
Funktionen verwenden, um die gewünschten Statistiken zu berechnen:
# Daten erstellen
data <- data.frame(
group = c("A", "A", "B", "B", "A", "B"),
var1 = c(10, 20, 30, 40, 50, 60),
var2 = c(5, 10, 15, 20, 25, 30)
)
# Summe und Mittelwert pro Gruppe berechnen
result <- data %>%
group_by(group) %>%
summarise(
sum_var1 = sum(var1),
mean_var1 = mean(var1),
sum_var2 = sum(var2),
mean_var2 = mean(var2)
)
# Ergebnisse ausgeben
print(result)
In beiden Beispielen wird die Summe und der Mittelwert von var1
und var2
für jede Gruppe berechnet und die Ergebnisse ausgegeben.