Angenommen, Sie haben einen data.frame
und Sie möchten die Zeile mit dem maximalen Wert in jeder Gruppe auswählen. Hier ist ein einfacher Weg, dies mit dem dplyr
-Paket zu tun.
Lassen Sie uns ein Beispiel erstellen:
# Beispiel-Daten
daten <- data.frame(
Gruppe = c('A', 'A', 'B', 'B', 'C', 'C'),
Wert = c(10, 20, 5, 15, 25, 30)
)
print(daten)
Die Ausgabe ist:
Gruppe Wert
1 A 10
2 A 20
3 B 5
4 B 15
5 C 25
6 C 30
Jetzt, um die Zeile mit dem maximalen Wert in jeder Gruppe auszuwählen, können Sie dplyr
verwenden:
library(dplyr)
ergebnis <- daten %>%
group_by(Gruppe) %>%
filter(Wert == max(Wert))
print(ergebnis)
Die Ausgabe sollte sein:
# A tibble: 3 x 2
# Groups: Gruppe [3]
Gruppe Wert
<chr> <dbl>
1 A 20
2 B 15
3 C 30
Mit diesem Code haben Sie die Zeile mit dem höchsten Wert in jeder Gruppe ausgewählt.