In R gibt es verschiedene Wege, data.frame
Zeilen basierend auf einer logischen Bedingung zu filtern. Hier sind zwei gängige Methoden, dies zu tun:
- Basierend auf Basal-R: Sie können die logische Bedingung direkt auf den
data.frame
anwenden. Zum Beispiel, um alle Zeilen zu behalten, in denen die Werte in der SpalteWert
größer als 10 sind:
daten <- data.frame(
ID = 1:5,
Wert = c(5, 15, 8, 20, 12)
)
gefiltert <- daten[daten$Wert > 10, ]
print(gefiltert)
- Verwendung des
dplyr
-Pakets: Dasdplyr
-Paket bietet eine intuitive und leistungsstarke Syntax für Datenmanipulationen. Hier ist, wie Sie den gleichen Filter mitdplyr
anwenden können:
library(dplyr)
daten <- data.frame(
ID = 1:5,
Wert = c(5, 15, 8, 20, 12)
)
gefiltert <- daten %>%
filter(Wert > 10)
print(gefiltert)
Beide Methoden würden den gleichen gefilterten data.frame
zurückgeben, in dem nur die Zeilen mit Werten größer als 10 in der Spalte Wert
enthalten sind.
Abhängig von Ihren Anforderungen und Ihrem Komfort mit verschiedenen Syntaxen können Sie entscheiden, welche Methode Sie bevorzugen. Das dplyr
-Paket kann besonders nützlich sein, wenn Sie mehrere Schritte der Datenmanipulation verkettet durchführen möchten.