In R: Wähle die Zeile mit dem maximalen Wert in jeder Gruppe aus.

Angenommen, Sie haben einen data.frame und Sie möchten die Zeile mit dem maximalen Wert in jeder Gruppe auswählen. Hier ist ein einfacher Weg, dies mit dem dplyr-Paket zu tun.

Lassen Sie uns ein Beispiel erstellen:

# Beispiel-Daten
daten <- data.frame(
  Gruppe = c('A', 'A', 'B', 'B', 'C', 'C'),
  Wert = c(10, 20, 5, 15, 25, 30)
)

print(daten)

Die Ausgabe ist:

  Gruppe Wert
1      A   10
2      A   20
3      B    5
4      B   15
5      C   25
6      C   30

Jetzt, um die Zeile mit dem maximalen Wert in jeder Gruppe auszuwählen, können Sie dplyr verwenden:

library(dplyr)

ergebnis <- daten %>%
  group_by(Gruppe) %>%
  filter(Wert == max(Wert))

print(ergebnis)

Die Ausgabe sollte sein:

# A tibble: 3 x 2
# Groups:   Gruppe [3]
  Gruppe Wert
  <chr>  <dbl>
1 A         20
2 B         15
3 C         30

Mit diesem Code haben Sie die Zeile mit dem höchsten Wert in jeder Gruppe ausgewählt.