Wie kann man eine Variable nach Gruppen in R summieren?

Um eine Variable nach Gruppen in R zu summieren, kannst du die Funktionen aggregate() oder die Funktionen aus den Paketen dplyr bzw. data.table nutzen. Hier sind Beispiele für die verschiedenen Methoden:

Methode 1: Verwendung der Funktion aggregate()

# Beispiel Datensatz erstellen
daten <- data.frame(Gruppe = c('A', 'A', 'B', 'B', 'A', 'B'),
                   Wert = c(1, 2, 3, 4, 5, 6))

# Variable nach Gruppen summieren
ergebnis <- aggregate(Wert ~ Gruppe, data = daten, FUN = sum)
print(ergebnis)

Methode 2: Verwendung von dplyr

Zuerst musst du das Paket “dplyr” installieren und laden.

# dplyr installieren (wenn noch nicht vorhanden)
# install.packages("dplyr")

# dplyr laden
library(dplyr)

# Beispiel Datensatz erstellen
daten <- data.frame(Gruppe = c('A', 'A', 'B', 'B', 'A', 'B'),
                   Wert = c(1, 2, 3, 4, 5, 6))

# Variable nach Gruppen summieren
ergebnis <- daten %>%
  group_by(Gruppe) %>%
  summarise(Summe_Werte = sum(Wert))
print(ergebnis)

Methode 3: Verwendung von data.table

Installiere und lade das Paket “data.table”.

# data.table installieren (wenn noch nicht vorhanden)
# install.packages("data.table")

# data.table laden
library(data.table)

# Beispiel Datensatz erstellen
daten <- data.frame(Gruppe = c('A', 'A', 'B', 'B', 'A', 'B'),
                   Wert = c(1, 2, 3, 4, 5, 6))

# Konvertiere data.frame zu data.table
daten_dt <- as.data.table(daten)

# Variable nach Gruppen summieren
ergebnis <- daten_dt[, .(Summe_Werte = sum(Wert)), by = .(Gruppe)]
print(ergebnis)

Jede dieser Methoden liefert das gewünschte Ergebnis, nämlich die Summe der Wert-Variable gruppieren nach der Gruppe-Variable.